目前有关大语言模型训练,微调,开发等技术的优秀教材有哪些?
2024-11-19 阅读 15
可以推荐几类资源:Goodfellow 等《Deep Learning》做理论基础,Aurélien Géron《Hands-On Machine Learning》偏实战,Stanford CS224n(词向量、Transformer、NLP 实战)和 fast.ai 课程(工程实操),Hugging Face Course 与 Transformers 库文档适合微调开发,"Attention Is All You Need"、GPT/GPT-2/GPT-3 原始论文看架构与训练思路,LoRA/Adapter/PEFT 等论文与综述学高效微调,ZeRO/DeepSpeed、Megatron-LM、FlashAttention 等论文和 GitHub 项目用于大模型并行与加速。
更新于 2026年01月03日