封面
版权信息
内容简介
前言
第1章 DeepSeek初探
1.1 大模型的定义
1.2 从GPT到DeepSeek
1.2.1 GPT模型的发展脉络
1.2.2 DeepSeek模型的发展脉络
1.2.3 技术突破:从全球竞速到本土创新
1.2.4 应用生态的进化:从工具到生态伙伴
1.3 DeepSeek的核心能力和独特优势
1.3.1 核心能力
1.3.2 独特优势
1.4 DeepSeek的应用场景
1.4.1 智能客服
1.4.2 辅助办公
1.4.3 智能家居
1.4.4 医疗诊断
1.4.5 教育学习
- APP免费
1.4.6 金融投资
- APP免费
1.4.7 智能政务
- APP免费
1.5 DeepSeek带来的机遇
- APP免费
1.5.1 DeepSeek模型带给个人的机遇
- APP免费
1.5.2 DeepSeek带给中小企业的机遇
- APP免费
小结
- APP免费
第2章 DeepSeek的模型架构
- APP免费
2.1 DeepSeek-V3/R1模型的架构
- APP免费
2.2 混合专家
- APP免费
2.2.1 稠密MoE架构和稀疏MoE架构
- APP免费
2.2.2 DeepSeekMoE
- APP免费
2.2.3 无辅助损耗负载均衡
- APP免费
2.3 多头潜在注意力
- APP免费
2.3.1 键值缓存简介
- APP免费
2.3.2 RoPE简介
- APP免费
2.3.3 传统MHA的缓存机制的不足
- APP免费
2.3.4 低秩键值联合压缩的注意力机制
- APP免费
2.4 多Token预测
- APP免费
2.4.1 块级并行解码策略
- APP免费
2.4.2 Meta的MTP方法
- APP免费
2.4.3 DeepSeek的MTP方法
- APP免费
小结
- APP免费
第3章 DeepSeek的训练架构
- APP免费
3.1 DeepSeek的训练
- APP免费
3.1.1 基础技术
- APP免费
3.1.2 训练过程
- APP免费
3.2 DeepSeek在硬件层面的训练亮点
- APP免费
3.2.1 FP8混合精度训练
- APP免费
3.2.2 DualPipe算法
- APP免费
3.3 DeepSeek在算法层面的训练亮点
- APP免费
3.3.1 组相对策略优化
- APP免费
3.3.2 知识蒸馏
- APP免费
3.4 DeepSeek的数据优化手段
- APP免费
小结
- APP免费
第4章 高质量提示词
- APP免费
4.1 提示词概述
- APP免费
4.1.1 提示词的定义
- APP免费
4.1.2 提示词的种类
- APP免费
4.2 新手常见误区和陷阱
- APP免费
4.3 提示词的设计技巧
- APP免费
4.3.1 STAR法则:让问题更有条理
- APP免费
4.3.2 5W2H法则:全面提问的利器
- APP免费
4.3.3 CO-STAR框架:精准表达需求
- APP免费
4.3.4 CRISPE框架:激发创意和拓展深度
- APP免费
4.3.5 BROKE框架:目标导向和持续优化
- APP免费
4.3.6 借助大模型优化提示词
- APP免费
4.4 企业层面的提示词应用场景
- APP免费
4.4.1 传播策略制定
- APP免费
4.4.2 执行发展制定
- APP免费
4.4.3 品牌故事生成
- APP免费
4.4.4 产品定位
- APP免费
小结
- APP免费
第5章 面向个人的DeepSeek部署
- APP免费
5.1 DeepSeek的模型
- APP免费
5.1.1 DeepSeek模型的常见版本
- APP免费
5.1.2 DeepSeek模型的版本说明
- APP免费
5.1.3 DeepSeek模型的开源协议
- APP免费
5.2 硬件需求和配置建议
- APP免费
5.2.1 存储精度
- APP免费
5.2.2 显存占用估算
- APP免费
5.3 软件环境安装和配置
- APP免费
5.3.1 Ollama安装
- APP免费
5.3.2 使用Ollama部署DeepSeek模型
- APP免费
5.3.3 Ollama常用API
- APP免费
5.4 DeepSeek模型下载和部署
- APP免费
5.4.1 Hugging Face社区简介
- APP免费
5.4.2 模型下载
- APP免费
5.4.3 常见大模型文件类型
- APP免费
5.5 使用Web UI构建对话界面
- APP免费
5.5.1 Open-WebUI
- APP免费
5.5.2 Hollama
- APP免费
5.5.3 ChatBox
- APP免费
小结
- APP免费
第6章 面向企业的DeepSeek API调用
- APP免费
6.1 API调用的优势
- APP免费
6.2 常用DeepSeek API调用方式
- APP免费
6.2.1 DeepSeek官方开放平台
- APP免费
6.2.2 DMXAPI
- APP免费
小结
- APP免费
第7章 面向企业的DeepSeek云服务部署
- APP免费
7.1 本地部署与云服务部署的对比
- APP免费
7.1.1 本地部署的特点
- APP免费
7.1.2 云服务部署的特点
- APP免费
7.2 模型推理加速框架
- APP免费
7.2.1 推理加速框架的必要性
- APP免费
7.2.2 BladeLLM
- APP免费
7.2.3 SGLang
- APP免费
7.2.4 vLLM
- APP免费
7.3 常用DeepSeek云服务部署方式
- APP免费
7.3.1 阿里云
- APP免费
7.3.2 腾讯云
- APP免费
7.3.3 华为云
- APP免费
7.3.4 火山引擎
- APP免费
7.3.5 AutoDL
- APP免费
小结
- APP免费
第8章 DeepSeek模型训练
- APP免费
8.1 常用训练框架
- APP免费
8.1.1 Unsloth
- APP免费
8.1.2 TRL
- APP免费
8.2 DeepSeek模型的SFT训练
- APP免费
8.2.1 算力租用
- APP免费
8.2.2 模型下载和部署
- APP免费
8.2.3 数据预处理
- APP免费
8.2.4 模型训练
- APP免费
8.2.5 模型推理
- APP免费
8.3 DeepSeek模型的GRPO训练
- APP免费
8.3.1 加载模型
- APP免费
8.3.2 配置PEFT模型
- APP免费
8.3.3 数据集准备
- APP免费
8.3.4 模型训练
- APP免费
8.3.5 模型推理
- APP免费
小结
- APP免费
第9章 DeepSeek的RAG实战
- APP免费
9.1 用LangChain构建简单的RAG本地系统
- APP免费
9.1.1 RAG管道构建
- APP免费
9.1.2 向量数据库构建
- APP免费
9.1.3 Web页面启动
- APP免费
9.2 开源DeepSeek RAG应用案例
- APP免费
9.2.1 Local PDF Chat RAG
- APP免费
9.2.2 RAG Flow
- APP免费
小结
- APP免费
第10章 DeepSeek的Agent实战
- APP免费
10.1 基于LlamaIndex项目构建简单的智能体应用
- APP免费
10.1.1 软件安装和模型下载
- APP免费
10.1.2 构建本地知识库
- APP免费
10.1.3 实现基于本地知识库的智能体问答
- APP免费
10.2 基于Swarm框架构建智能体应用
- APP免费
10.2.1 Swarm框架介绍
- APP免费
10.2.2 DeepSeek模型接入
- APP免费
10.2.3 调用外部工具
- APP免费
10.3 开源Agent应用框架
- APP免费
10.3.1 Browser Use
- APP免费
10.3.2 Camel
- APP免费
小结
- APP免费
参考文献
- APP免费
封底
更新时间:2025-06-03 14:18:21