一、微调:让通用模型适配特定任务
预训练大模型拥有广泛的知识,但要胜任特定领域任务,微调(Fine-tuning)不可或缺。全量微调需要更新全部参数,对算力要求极高。2024-2025年,参数高效微调(PEFT)成为主流,仅更新极小部分参数即可达到接近全量微调的效果。
二、PEFT主流方法对比
| 方法 | 可训练参数 | 核心思想 | 显存节省 |
|---|---|---|---|
| LoRA | 0.1%-1% | 低秩矩阵分解,A×B近似ΔW | ~70% |
| QLoRA | 0.1%-1% | LoRA + 4bit量化,双重量化 | ~85% |
| Adapter | 2%-5% | 在Transformer层间插入小型网络 | ~50% |
| Prefix Tuning | 0.01% | 在输入前添加可训练的虚拟Token | ~90% |
三、LoRA实战指南
关键超参数:rank r(通常8-64,越大效果越好但参数越多)、alpha(缩放因子,通常为r的2倍)、target_modules(通常选择q_proj和v_proj)。对7B模型,r=16的LoRA在单张24GB GPU上即可训练。
四、数据准备与评估
微调数据的质量远比数量重要。1000条高质量、多样化的指令数据往往优于10000条噪声数据。评估时需在分布内(In-Distribution)和分布外(OOD)两个维度测试。
评论 (39)