大模型微调实战指南：LoRA、QLoRA、Adapter等高效方法全解

一、微调：让通用模型适配特定任务

预训练大模型拥有广泛的知识，但要胜任特定领域任务，微调（Fine-tuning）不可或缺。全量微调需要更新全部参数，对算力要求极高。2024-2025年，参数高效微调（PEFT）成为主流，仅更新极小部分参数即可达到接近全量微调的效果。

方法	可训练参数	核心思想	显存节省
LoRA	0.1%-1%	低秩矩阵分解，A×B近似ΔW	~70%
QLoRA	0.1%-1%	LoRA + 4bit量化，双重量化	~85%
Adapter	2%-5%	在Transformer层间插入小型网络	~50%
Prefix Tuning	0.01%	在输入前添加可训练的虚拟Token	~90%

关键超参数：rank r（通常8-64，越大效果越好但参数越多）、alpha（缩放因子，通常为r的2倍）、target_modules（通常选择q_proj和v_proj）。对7B模型，r=16的LoRA在单张24GB GPU上即可训练。

微调数据的质量远比数量重要。1000条高质量、多样化的指令数据往往优于10000条噪声数据。评估时需在分布内（In-Distribution）和分布外（OOD）两个维度测试。