知乎《AI大模型全栈工程师》第9期视频教程是一套系统且进阶的AI大模型实战课程,由知乎旗下技术团队联合业界一线专家打造,旨在培养具备大模型构建、训练、部署、调优与落地能力的全栈型AI工程师。以下是该教程的详细介绍:
🧠 教程名称
知乎《AI大模型全栈工程师》第9期训练营
🎯 课程定位
本课程聚焦 从零打造AI大模型应用的完整技术链条,涵盖:
- 大模型的原理与架构
- 数据处理与训练技巧
- 模型微调(如LoRA、QLoRA)
- 各类推理加速技术
- 应用部署与前后端集成
目标受众为具备基础编程能力的开发者,希望系统性掌握大模型开发与部署的工程师。
📚 课程模块概览
第1章:AI大模型发展与产业趋势
- 大模型技术发展路线图
- 主流开源大模型(LLaMA、Baichuan、ChatGLM等)对比
- AIGC应用场景拆解
第2章:大模型预训练与数据构建
- Tokenizer构建原理
- 数据预处理工具链(FastChat、OpenLLaMA数据格式)
- 数据清洗、切分与混合策略
第3章:大模型微调与指令调优
- 全参数微调 vs LoRA/QLoRA 对比
- 使用 Hugging Face Transformers + PEFT + TRL 实现 SFT
- 指令微调最佳实践与提示词构造技巧
- 模型评估指标与人类反馈优化(如RLHF)
第4章:推理部署与性能优化
- 轻量化部署方案:vLLM、TGI、llama.cpp
- 多卡推理与量化部署(INT8/FP16)
- Web API 推理服务搭建(FastAPI / Gradio)
- Triton Inference Server 实战部署
- LangChain / LlamaIndex 接入与RAG系统搭建
第5章:应用开发实战
- 打造自己的ChatGPT对话系统
- 构建PDF问答 / 知识库问答 / 多轮对话系统
- 支持多模态大模型(文生图、图生文等)初探
- 前端UI框架接入(Vue/React)+ 后端调用链设计
第6章:大模型落地与商业化
- 企业级场景大模型部署流程
- 私有化部署与安全性考量
- AIGC产品闭环:从模型到产品
- 成本估算与运维监控
🛠️ 涉及技术栈
- 模型框架:Transformers、PEFT、Diffusers、Megatron-DeepSpeed
- 训练工具:Deepspeed、Colossal-AI、LoRA、QLoRA、Gradient Accumulation
- 推理部署:vLLM、TGI、llama.cpp、FastAPI、Streamlit、Gradio
- 知识库构建:Faiss、Milvus、LangChain、LlamaIndex
- 多模态集成:CLIP、BLIP、Stable Diffusion 接入
👨🏫 授课形式
- 视频课程 + 代码实战 + 项目作业
- 提供完整训练代码、数据、部署脚本
- 答疑社群支持 + 实战项目辅导
🧩 项目实战案例
项目 | 内容 |
---|---|
🎙️ 智能客服问答系统 | 基于企业知识库搭建Chat系统,支持多轮对话 |
📄 PDF问答助手 | 文档解析 + 向量检索 + 本地部署大模型 |
🌐 Web对话机器人 | ChatGPT界面前端 + 后端推理服务 |
🔍 搜索增强生成(RAG)系统 | 基于LlamaIndex实现RAG问答系统 |
🧠 私有大模型微调平台 | LoRA微调+管理面板+训练监控仪表盘 |
📦 配套资源
- 全套源码包与配置文件
- 模型权重下载教程
- 数据集预处理模板
- 从0搭建推理服务的完整流程文档
- Docker环境与部署指南
🏆 学完收获
- 熟练掌握开源大模型微调与部署技巧
- 具备独立开发AI对话/问答/多模态系统能力
- 能在企业或创业项目中落地大模型应用
- 拥有多个可复用的AI产品Demo

课程目录:
知乎AI大模型全栈工程师第9期
├──课件
| ├──01-intro.zip 2.47M
| ├──02-prompt.zip 3.42M
| ├──03-func-call.zip 4.06M
| ├──04-ai-programming.zip 49.46M
| ├──05-rag-embeddings.zip 21.29M
| ├──06-assistants-api.zip 2.15M
| ├──07-llamaindex.zip 1.71M
| ├──08-langchain.zip 13.49M
| ├──09-llm-tools.zip 1.44M
| ├──10-agent.zip 935.06kb
| ├──11-workflow.zip 1.33M
| ├──12-transformer.zip 16.74M
| ├──13-fine-tuning-01.zip 31.73M
| ├──14-fine-tuning-02.zip 20.31M
| ├──15-agent-tuning.zip 26.28M
| ├──16-multimodal-01.pptx 110.04M
| ├──17-vision.pptx 200.70M
| ├──17-vision.zip 365.70kb
| ├──18-delivery-01.zip 25.82M
| ├──18-delivery-02.zip 35.60M
| ├──19-indie-hackers.zip 3.58M
| ├──20-product.zip 301.84kb
| ├──21-operation.zip 5.88kb
| └──22-projects.zip 3.72M
├──1. 大模型应用开发基础(因录制中断,分为2个)-1.mp4 1.86G
├──1. 大模型应用开发基础(因录制中断,分为2个)-2.mp4 504.30M
├──10. LangChain.mp4 1.94G
├──11. LLM 应用开发工具链.mp4 1.96G
├──12. 手撕 AutoGPT.mp4 2.27G
├──13. 工作流.mp4 3.54G
├──14. 神经网络和Transformer 详解.mp4 3.30G
├──15. 模型微调(上).mp4 2.24G
├──16. 模型微调(下).mp4 1.90G
├──17. Agent模型微调.mp4 2.72G
├──18. 多模态大模型(上).mp4 1.60G
├──19. 多模态大模型(下)(因录制中断,分为2个)-1.mp4 2.03G
├──19. 多模态大模型(下)(因录制中断,分为2个)-2.mp4 446.52M
├──2. Prompt Engineering.mp4 2.60G
├──20. 视觉生成模型.mp4 2.27G
├──21.AI 产品部署和交付(上).mp4 3.60G
├──22.AI 产品部署和交付(下).mp4 2.98G
├──23. 大模型时代的创业机遇.mp4 2.02G
├──24. 产品设计.mp4 1.85G
├──25. 产品运营.mp4 1.59G
├──26. 项目方案分析与设计.mp4 2.07G
├──27. 优秀项目路演及结课项目.mp4 2.38G
├──3. 加餐:软件开发基础概念与环境搭建.mp4 2.47G
├──4. 结构化输出.mp4 2.31G
├──5. 从 AI 编程认知 AI.mp4 2.79G
├──6. 加餐:AI编程实操演示(因录制中断,分为2个)-1.mp4 4.10G
├──6. 加餐:AI编程实操演示(因录制中断,分为2个)-2.mp4 281.59M
├──7. RAG 和 Embeddings.mp4 2.13G
├──8. Assistants API.mp4 1.66G
└──9. LlamaIndex.mp4 1.68G