课程介绍
本课程包括大模型开发基础,RAG基础与架构,RAG与LangChain,模型微调与私有化大模型,智能设备与“小”模型,多模态大模型开发7个阶段,内容涵盖大模型核心原理,大模型实操与API调用,提示工程技术,RAG,向量数据库,LangChain,Function Calling,模型微调,LoRA,Agent,智能设备上的模型优化,边缘计算与大模型,多模态大模型,Sora等前沿技术等全方位知识讲解,并结合5个实战项目,帮助同学们实现学以致用。
课程大纲
注:由于大模型技术迭代迅速,课程大纲可能会根据技术的迭代而动态调整,加入最新的知识,请以最终上课时的课程大纲和内容为准。
第一阶段 · 大模型开发基础
为什么要学习大模型开发?
对学员期望与课程目标
课程安排概览
学习评估
需要准备的工具和环境
大模型发展史
从大模型预训练、微调到应用
GPT结构剖析
大模型家族、类别、应用场景
RAG,Agent与小模型
通过API调用大模型
单论对话与多轮对话调用
开源模型与闭源模型调用
ChatGLM,Baichuan,Yi-34B调用
GPT,LLaMA模型调用
模型的部署、容器化
提示词的常见结构
提示词的模版化
Zero-shot与Few-shot
In-context learning
Chain of thought prompting
Tree of thought prompting
Graph of thought promting
Self-consistency
Active-prompt
Prompt chaining
第二阶段 · RAG基础与架构
为什么需要RAG?
RAG的经典应用场景
RAG的经典结构与模块
向量数据库
检索与生成
产品介绍与核心功能
技术方案与架构设计
文档读取和解析
文档的切分和文档向量化
query搜索与文档排序
提示模版与大模型API接入
模型部署与Web应用
根据每个Sentence切分
根据固定字符数切分
根据固定sentence数切分
根据递归字符来切分
根据语义相似度来切分
常用向量数据库以及类别
向量数据库与索引算法
到排表与搜索优化
KNN与近似KNN
Product Quantization
HSNW算法在索引中的重要性
NSW算法解读
NSW图中的搜索问题
Skip List讲解
具有层次结构的NSW
推荐系统原理、应用场景以及架构剖析
传统推荐算法与基于LLM推荐算法
新闻数据的准备与整理
推荐中的召回与精排
精排与Prompt构建
模型部署与测试
第三阶段 · RAG与LangChain
为什么需要LangChain?
通过一个小项目快速理解各个模块
LangChain调用模型
PromptTemplate的应用
输出格式设定
Pydantic Object设计
什么是 Function Calling
自定义输出结构
基于OpenAI调用Function Calling
Function Calling的稳定性
LangChain与Function Calling
Document Loaders
Text Splitters
Text Embedding模型
常用的向量数据库调用
常用的Retriever
为什么需要Chain?
LLMChain, Sequential Chain
Transform Chain
Router Chain
自定义Chain
经典RAG的几个问题
Self-querying retrieval
MultiQuery retriever
Step-back prompting
基于历史对话重新生成Query
其他Query优化相关策略
Sentence window retrieval
Parent-child chunks retrieval
Fusion Retrieval
Ensemble Retrieval
RPF算法
为什么需要评估RAG
RAG中的评估思路
评估指标设计
套用在项目中进行评估
RAGAS评估框架的缺点
需求理解和系统设计
经典RAG架构下的问题
检索器优化
生成器优化
系统部署与测试
第四阶段 · 模型微调与私有化大模型
模型私有化部署的必要性
中英开源模型概览与分类
ChatGLM, Baichuan,Yi等中文开源模型
LLaMA,Mistral系列英文开源模型
微调所需要的工具和算力
判断是否需要模型微调
模型微调对模型的影响和价值
选择合适的基座模型
数据集的准备
微调训练框架的选择
GPU与CPU
GPU的计算特性
微调所需要的算力计算公式
常见GPU卡介绍与比较
搭建GPU算力环境
全量微调与少量参数微调
理解LoRA训练以及参数
PEFT库的使用
LoRA训练硬件资源评估
认识QLoRA训练
理解ChatGLM模型家族以及特性
导入模型以及tokenizer
设计模型参数以及LoRA参数
训练以及部署微调模型
测试微调模型
第五阶段 · Agent开发
什么是Agent
什么是Plan, Action, Tools
经典的Agent开源项目介绍
编写简单的Agent程序
Agent目前面临的挑战与机遇
LangChain所支持的Agent
什么需要自定义Agent
@tool decorator的使用
编写自定义Agent工具
编写完整的Agent小项目
回顾什么是CoT
CoT和Action的结合
剖析ReAct框架的Prompt结构
从零实现ReAct(from Scratch)
ReAct框架的优缺点分析
开源Agent项目以及分类
AutoGPT项目讲解
MetaGPT项目讲解
其他开源项目
Agent技术目前存在的问题
Agent的planning
Agent的reasoning
Agent的knowledge
Agent的memory
Agent的泛化能力
需求设计和系统设计
工具的设计
AI面试中的深度询问方案设计
提示工程设计
Memory的设计
智能体开发与部署
AI旅游规划师
AI产品销售
AI房租推荐
AI图像处理
AI网站开发
多个Agent的协同
Agent的group行为
Agent Society
Agent的Personality
斯坦福小镇案例
第六阶段 · 智能设备与“小”模型
智能设备特性以及资源限制
模型优化的必要性
常见的模型压缩技术
轻量级模型架构介绍
开源小模型
多大的模型适合
部署流程概述
模型转换工具
模型部署实战
性能测试与优化
边缘计算的概念和重要性
模型所要满足的要求与性能上的平衡
模型在边缘设备上的应用案例
未来“小”模型发展趋势
24年“小”模型机会
第七阶段 · 多模态大模型开发
什么是多模态模型
多模态的应用场景
DALLE-3与Midjourney
Stable Diffusion与ControlNet
语音合成技术概述
主流TTS技术剖析
多模态大模型最新进展
Sora对多模态大模型会产生什么影响
案例:MiniGPT-4与多模态问答
案例:BLIP与文本描述生成
案例:Video-LLaVA与多模态图像视频识别
大模型技术局限性
大模型的隐私性和准确性
大模型和AGI未来
GPT商城的机会
多模态的机会
对于开发工程师未来的启示
课程服务
20次直播讲解与演示(每周两次,每次1.5-2小时)
可反复观看课程视频
不超过25人的小学习群,保证每名学员的问题被快速解决
专属咨询顾问与教务老师全程伴学
认识一群拥有同样兴趣的人、相互交流、相互学习。
课程讲师及教研团队
适合人群
在职人士
在读学生
常见问题
1、是否有基础要求?
Python,或精通至少一门编程语言
2、学习这个课程对硬件有哪些要求?
应用实战部分没有很高要求,普通的笔记本电脑即可;第四阶段微调相关的内容需要显存30G以上的一张NVIDIA显卡或者GPU云服务器。
3、上课形式和课时量是怎样的呢?
共20次直播授课,每次直播课程时长大概1.5-2小时。直播的录播视频会在第二个工作日上传到学习平台方便大家回看,但为了更好的学习效果,建议各位学员提前预留好时间,准时参加直播。
4、课程回放视频的观看期限是多久?
本期课程视频永久有效,其中包含“学习期”和“结课期”两个阶段。 学习期:指我们为同学们提供直播授课的阶段。在此期间,学员可以观看课程回放视频,并享受相应的学习服务,比如课程群助教答疑等。 结课期:本课程最后一节直播课之日起一周后,即为结课期,课程回放视频永久有效。在此期间,学员可随时观看课程视频,但不再享受其他课程服务。
5、可以跟老师互动交流吗?
我们会建立课程学习群,群内可以互动交流。同时,大家还可以在直播授课期间向老师提问。
6、报名缴费后可以退款吗?
本课程第一节直播课起第7个自然日内,如果觉得课程不适合自己,可无条件申请退款,超出7个自然日,就不再办理退款啦。退款流程预计为10个工作日。
7、如何开发票,签合同?
我们可以为学员开具正规的发票和合同。请联系报名老师。
8、价格说明
价格为商品或服务的参考价,并非原价,该价格仅供参考,具体成交价格根据商品或服务参加优惠活动,或拼团等不同情形发生变化,最终实际成交价格以订单结算页价格为准。