Speed up the inference speed of glm-4 validation set and add pure text fine-tuning function for glm-4v

2024-08-23 07:10:27 +00:00 · 2024-08-23 07:10:27 +00:00 · 358e483cd4
parent 1bd342059d
commit 358e483cd4
5 changed files with 28 additions and 8 deletions
--- a/finetune_demo/configs/lora.yaml
+++ b/finetune_demo/configs/lora.yaml
@ -26,7 +26,7 @@ training_args:
  logging_strategy: steps
  logging_steps: 10
  # settings for evaluation
-  per_device_eval_batch_size: 4
+  per_device_eval_batch_size: 32
  eval_strategy: steps
  eval_steps: 500
  # settings for optimizer
@ -45,4 +45,4 @@ peft_config:
  r: 8
  lora_alpha: 32
  lora_dropout: 0.1
-  target_modules: ["query_key_value"]
+  target_modules: ["query_key_value"]
--- a/finetune_demo/finetune.py
+++ b/finetune_demo/finetune.py
@ -444,6 +444,13 @@ def main(
    if test_dataset is not None:
        print('test_dataset:', test_dataset)

+    ft_config.training_args.generation_config.pad_token_id = (
+        151329
+    )
+    ft_config.training_args.generation_config.eos_token_id = [
+        151329, 151336, 151338
+    ]
+
    model.gradient_checkpointing_enable()
    model.enable_input_require_grads()

--- a/finetune_demo/finetune_vision.py
+++ b/finetune_demo/finetune_vision.py
@ -270,6 +270,8 @@ def process_batch(
            if message.get('image'):
                image = Image.open(message['image']).convert('RGB')
                message['image'] = image
+            else:
+                images = None

            loss_mask_val = False if message['role'] in ('system', 'user', 'observation') else True
            new_input_ids_all = tokenizer.apply_chat_template(
@ -312,14 +314,15 @@ def process_batch(
    del batched_conv, conv, input_ids, attention_mask, position_ids, loss_masks, message, new_input_ids, new_loss_masks, labels, input_id, mask
    torch.cuda.empty_cache()

-    return {
+    return_dict = {
        'input_ids': batched_input_ids,
        'attention_mask': batched_attention_mask,
        'position_ids': batched_position_ids,
        'labels': batched_labels,
-        'images': batched_images
    }
-
+    if len(batched_images) > 0:
+        return_dict['images'] = batched_images
+    return return_dict

 def process_batch_eval(
        batch: Mapping[str, Sequence],
@ -372,19 +375,22 @@ def process_batch_eval(
            batched_attention_mask.append(attention_segment[:max_input_length])
            batched_position_ids.append(position_segment[:max_input_length])
            batched_output_ids.append(output_segment[:max_output_length])
-            batched_images.append(new_input_ids_all['images'][0])
+            if 'images' in new_input_ids_all:
+                batched_images.append(new_input_ids_all['images'][0])

    del batched_conv, input_ids, attention_mask, position_ids, new_input_ids_all, output_segment
    torch.cuda.empty_cache()

-    return {
+    return_dict = {
        'input_ids': batched_input_ids,
        'attention_mask': batched_attention_mask,
        'position_ids': batched_position_ids,
        'output_ids': batched_output_ids,
-        'images': batched_images
    }

+    if len(batched_images) > 0:
+        return_dict['images'] = batched_images
+    return return_dict

 def load_tokenizer_and_model(
        model_dir: str,
@ -490,6 +496,13 @@ def main(
    if test_dataset is not None:
        print('test_dataset:', test_dataset)

+    ft_config.training_args.generation_config.pad_token_id = (
+        151329
+    )
+    ft_config.training_args.generation_config.eos_token_id = [
+        151329, 151336, 151338
+    ]
+
    model.gradient_checkpointing_enable()
    model.enable_input_require_grads()

--- a/finetune_demo/output/runs/Aug23_06-44-19_platform/events.out.tfevents.1724395509.platform.130500.0
+++ b/finetune_demo/output/runs/Aug23_06-44-19_platform/events.out.tfevents.1724395509.platform.130500.0
--- a/finetune_demo/output/runs/Aug23_07-02-39_platform/events.out.tfevents.1724396577.platform.132314.0
+++ b/finetune_demo/output/runs/Aug23_07-02-39_platform/events.out.tfevents.1724396577.platform.132314.0