Merge pull request #550 from zhipuch/froze

Froze vision layers
2024-09-07 01:00:29 +08:00 · 2024-09-07 01:00:29 +08:00 · 5fe70a075b
parent e058a509da 1c2676415c
commit 5fe70a075b
4 changed files with 9 additions and 1 deletions
--- a/finetune_demo/configs/lora.yaml
+++ b/finetune_demo/configs/lora.yaml
@ -5,6 +5,7 @@ data_config:
  num_proc: 1

 combine: True
+freezeV: True
 max_input_length: 512
 max_output_length: 512

--- a/finetune_demo/configs/ptuning_v2.yaml
+++ b/finetune_demo/configs/ptuning_v2.yaml
@ -5,6 +5,7 @@ data_config:
  num_proc: 1

 combine: True
+freezeV: True
 max_input_length: 512
 max_output_length: 512

--- a/finetune_demo/configs/sft.yaml
+++ b/finetune_demo/configs/sft.yaml
@ -5,6 +5,7 @@ data_config:
  num_proc: 1

 combine: True
+freezeV: True
 max_input_length: 512
 max_output_length: 512

--- a/finetune_demo/finetune_vision.py
+++ b/finetune_demo/finetune_vision.py
@ -136,6 +136,7 @@ class FinetuningConfig(object):
    max_input_length: int
    max_output_length: int
    combine: bool
+    freezeV: bool

    training_args: Seq2SeqTrainingArguments = dc.field(
        default_factory=lambda: Seq2SeqTrainingArguments(output_dir='./output')
@ -449,6 +450,10 @@ def main(
 ):
    ft_config = FinetuningConfig.from_file(config_file)
    tokenizer, model = load_tokenizer_and_model(model_dir, peft_config=ft_config.peft_config)
+    
+    if ft_config.freezeV:
+        for param in model.transformer.vision.parameters():
+            param.requires_grad = False
    data_manager = DataManager(data_dir, ft_config.data_config)

    train_dataset = data_manager.get_dataset(