"Fine-Tuning"
- Catastrophic Forgetting Fine-tune 模型時、新訓練資料覆蓋掉原本學到的能力的現象、LoRA / 資料 mixing 是主要緩解
- LoRA Low-Rank Adaptation:凍住原模型權重、只訓兩個小矩陣的 parameter-efficient fine-tuning
- QLoRA 把 base model 量化到 4-bit + LoRA fine-tune 的組合、消費級 GPU 也能 fine-tune 大模型
- Hands-on:用 QLoRA 在本機 fine-tune coding 模型 Apple Silicon Mac / PC 獨立 GPU 上跑 QLoRA fine-tune 的完整流程:環境、資料、訓練、evaluation、合併、部署到 Ollama