《大模型垂直领域低算力迁移：微调、部署与优化》程戈机械工业出版社PDF电子书网盘迅雷下载、免费在线阅读-兰台网

内容简介
本书是一本深度探讨大模型在低算力环境下实现迁移与微调的实践指南，并深入讲解了大模型的部署与优化策略。书中结合多个垂直领域的应用场景，从理论到技术实现，全程详尽讲解了如何应对大模型在行业落地中的技术挑战，帮助读者逐步掌握大模型的迁移与微调核心技术。
通过阅读本书，你将能够：
（1）全面理解垂直领域迁移方式与技术选型
深入了解开源大模型向垂直领域迁移的核心方式，包括提示工程、检索增强生成、参数高效微调与全参数微调等技术路径，并灵活应对低算力场景下的迁移技术挑战。
（2）快速获取高质量领域数据的低成本方案
学习通过指令自举、无监督标注、自我策展等方法构建高质量数据集，同时掌握数据清洗、去重和质量过滤等关键技术，显著降低数据获取成本。
（3）掌握低算力环境下的训练与推理优化技术
全面掌握低算力训练与微调方法（如LoRA和QLoRA），并结合推理优化技术（如量化、剪枝和模型编译），高效实现低成本的大模型训练与推理。
（4）精通大模型的生产环境部署与优化
系统学习生产环境中大模型的部署方案，涵盖服务器推理加速、分布式集群架构和多平台适配技术，确保模型在实际应用中的高效、安全运行。
无论你是大模型开发者、人工智能研究人员，还是对垂直领域AI应用感兴趣的行业专家，本书都将带你深入大模型的核心领域，提供从构建、优化到部署的全流程指导，助你掌握这一前沿技术的实践精髓。

CONTENTS 目　　录 前言 第1章　垂直领域大模型的行业 变革与机遇1 1.1　大模型下的行业变革1 1.1.1　大模型的iPhone时刻1 1.1.2　大模型的全行业重塑3 1.1.3　劳动力市场的变革7 1.2　垂直领域大模型迁移的动机7 1.2.1　商业价值7 1.2.2　行业技术护城河9 1.2.3　领域数据优势9 1.3　垂直领域大模型迁移的机遇10 第2章　垂直领域迁移技术栈11 2.1　垂直领域迁移的方式11 2.1.1　提示工程12 2.1.2　检索增强生成15 2.1.3　参数高效微调17 2.1.4　全参数微调18 2.1.5　从头预训练19 2.1.6　垂直领域迁移低算 力技术选型20 2.2　低算力微调20 2.3　推理优化22 2.3.1　模型编译23 2.3.2　模型压缩24 2.3.3　模型分区25 第3章　大模型的开源生态27 3.1　大模型的开源社区27 3.1.1　Meta27 3.1.2　Hugging Face28 3.1.3　微软31 3.1.4　英伟达32 3.2　开源生态下基座模型选择的 关键指标33 3.2.1　参数规模33 3.2.2　训练Token34 3.2.3　上下文窗口35 3.2.4　综合评测36 3.2.5　商业许可37 3.3　开源基座模型LLaMA系列38 3.3.1　LLaMA 238 3.3.2　LLaMA 340 3.3.3　商用40 第4章　自举领域数据的获取42 4.1　指令自举标注42 4.2　自举无监督标注44 4.2.1　指令生成阶段44 4.2.2　答案生成阶段46 4.2.3　过滤和修剪阶段47 4.3　自我策展47 4.3.1　初始化阶段48 4.3.2　自我增强阶段49 4.3.3　自我策展阶段49 4.4　自我奖励50 4.4.1　种子数据51 4.4.2　自我指令创建51 4.4.3　指令遵循训练52 4.4.4　迭代训练53 第5章　数据处理54 5.1　数据处理的挑战54 5.2　数据质量55 5.2.1　文本提取56 5.2.2　数据去重56 5.2.3　质量过滤58 5.2.4　内容毒性过滤59 5.3　高效数据集访问60 5.3.1　数据集来源60 5.3.2　列式内存格式61 5.3.3　向量化计算63 5.3.4　零复制数据交换64 5.3.5　虚拟内存65 第6章　大模型抽象66 6.1　计算图66 6.2　静态计算图69 6.3　动态计算图70 6.4　算子优化与调度73 6.4.1　计算图与算子优化73 6.4.2　计算图与算子调度74 6.4.3　串行调度与并行调度74 6.5　大模型中的张量与算子76 6.5.1　输入层77 6.5.2　自注意力层78 6.5.3　前馈网络层79 6.5.4　输出层79 6.6　大模型的序列化80 6.6.1　序列化文件的类型80 6.6.2　TensorFlow模型序列化81 6.6.3　PyTorch模型序列化84 6.6.4　Safetensors序列化格式86 第7章　LoRA低算力微调89 7.1　LoRA的原理89 7.2　LoRA的重参数化方法91 7.3　秩的选择92 7.4　LoRA的多任务处理策略93 7.5　LoRA量化版本QLoRA94 7.6　LoRA微调类型95 7.6.1　继续预训练95 7.6.2　RLHF96 7.6.3　DPO97 第8章　大模型的分布式训练99 8.1　分布式训练的挑战99 8.1.1　算力与内存瓶颈99 8.1.2　分布式训练系统的 设计挑战100 8.2　分布式集群架构102 8.2.1　GPU集群架构102 8.2.2　集合通信算子104 8.2.3　通信拓扑108 8.3　分布式训练的通信架构109 8.3.1　基于参数服务器的架构109 8.3.2　基于归约的架构111 8.4　并行模式113 8.4.1　数据并行113 8.4.2　张量并行115 8.4.3　流水线并行116 8.4.4　并行模式的对比117 8.5　大模型的张量并行118 8.5.1　输入层118 8.5.2　输出层120 8.5.3　多层感知机121 8.5.4　自注意力122 8.6　数据并行的内存优化123 8.6.1　设备内存占用124 8.6.2　ZeRO技术125 8.6.3　ZeRO-Offload技术128 第9章　推理优化技术131 9.1　计算加速131 9.1.1　算子融合131 9.1.2　并行推理134 9.2　内存优化135 9.2.1　KV缓存135 9.2.2　页注意力137 9.2.3　快速注意力139 9.3　吞吐量优化143 9.3.1　内存I/O瓶颈143 9.3.2　静态批处理143 9.3.3　连续批处理144 9.3.4　动态分割融合145 9.4　量化147 9.4.1　量化的动机147 9.4.2　量化的原理148 9.4.3　LLM.int8()150 9.4.4　GPTQ152 第10章　大模型的编译优化156 10.1　深度学习编译与大模型编译156 10.1.1　深度学习编译156 10.1.2　多级渐进优化158 10.1.3　硬件优化偏好159 10.1.4　大模型的编译特点161 10.2　深度学习框架与编译优化162 10.2.1　深度学习框架162 10.2.2　不同阶段的编译优化163 10.3　训练阶段的编译优化165 10.3.1　训练前优化165 10.3.2　训练优化库166 10.4　端侧部署的编译优化166 10.4.1　深度学习框架的 　端侧部署工具167 10.4.2　第三方编译工具168 10.4.3　大模型的手动 　编译优化170 10.5　服务器端部署的编译优化171 第11章　大模型部署的非性能需求173 11.1　内容安全173 11.1.1　内容安全的分类173 11.1.2　应对策略176 11.2　水印177 11.2.1　主要检测技术的对比177 11.2.2　大模型水印框架179 11.2.3　水印攻击技术181 11.3　监控184 11.3.1　监控流程184 11.3.2　大模型基线185 11.3.3　监控架构187 11.4　评估188 11.4.1　评估维度189 11.4.2　评估数据集190 11.4.3　评估方法192 第12章　垂直领域大模型的 　服务器端部署194 12.1　服务器端部署架构194 12.1.1　服务器端部署的挑战194 12.1.2　公有云与私有云196 12.1.3　服务器端部署流程与 　优化198 12.2　运行库优化199 12.2.1　运行库优化与编译 　优化199 12.2.2　TensorRT运行库架构199 12.2.3　TensorRT运行库优化与 　推理201 12.2.4　TensorRT-LLM204 12.3　TGI生产环境解决方案204 12.3.1　TGI的架构204 12.3.2　TGI推理加速技术206 12.3.3　TGI的其他特性207

图书	大模型垂直领域低算力迁移：微调、部署与优化
内容	编辑推荐（1）作者背景权威：作者是湖南国家应用数学中心副主任、湘潭大学的博导、科技部国家重点子课题（大模型相关）的负责人，是资深的大模型技术专家和布道者。（2）作者经验丰富：作者在司法、工业设计等多个领域成功实现了开源大模型向垂直领域的迁移，有丰富的实战经验。（3）涵盖全部技术栈：从迁移方式、低算力微调、推理优化到开源基座模型的选择指标等，本书详细介绍了构建垂直领域大模型需要的全部技术栈。（4）涵盖构建全流程：从垂直大模型的迁移、微调到部署和性能优化，本书详细讲解了构建垂直领域大模型的全流程内容推荐内容简介本书是一本深度探讨大模型在低算力环境下实现迁移与微调的实践指南，并深入讲解了大模型的部署与优化策略。书中结合多个垂直领域的应用场景，从理论到技术实现，全程详尽讲解了如何应对大模型在行业落地中的技术挑战，帮助读者逐步掌握大模型的迁移与微调核心技术。通过阅读本书，你将能够：（1）全面理解垂直领域迁移方式与技术选型深入了解开源大模型向垂直领域迁移的核心方式，包括提示工程、检索增强生成、参数高效微调与全参数微调等技术路径，并灵活应对低算力场景下的迁移技术挑战。（2）快速获取高质量领域数据的低成本方案学习通过指令自举、无监督标注、自我策展等方法构建高质量数据集，同时掌握数据清洗、去重和质量过滤等关键技术，显著降低数据获取成本。（3）掌握低算力环境下的训练与推理优化技术全面掌握低算力训练与微调方法（如LoRA和QLoRA），并结合推理优化技术（如量化、剪枝和模型编译），高效实现低成本的大模型训练与推理。（4）精通大模型的生产环境部署与优化系统学习生产环境中大模型的部署方案，涵盖服务器推理加速、分布式集群架构和多平台适配技术，确保模型在实际应用中的高效、安全运行。无论你是大模型开发者、人工智能研究人员，还是对垂直领域AI应用感兴趣的行业专家，本书都将带你深入大模型的核心领域，提供从构建、优化到部署的全流程指导，助你掌握这一前沿技术的实践精髓。目录 CONTENTS<br />目　　录<br />前言<br />第1章　垂直领域大模型的行业<br />变革与机遇1<br />1.1　大模型下的行业变革1<br />1.1.1　大模型的iPhone时刻1<br />1.1.2　大模型的全行业重塑3<br />1.1.3　劳动力市场的变革7<br />1.2　垂直领域大模型迁移的动机7<br />1.2.1　商业价值7<br />1.2.2　行业技术护城河9<br />1.2.3　领域数据优势9<br />1.3　垂直领域大模型迁移的机遇10<br />第2章　垂直领域迁移技术栈11<br />2.1　垂直领域迁移的方式11<br />2.1.1　提示工程12<br />2.1.2　检索增强生成15<br />2.1.3　参数高效微调17<br />2.1.4　全参数微调18<br />2.1.5　从头预训练19<br />2.1.6　垂直领域迁移低算<br />力技术选型20<br />2.2　低算力微调20<br />2.3　推理优化22<br />2.3.1　模型编译23<br />2.3.2　模型压缩24<br />2.3.3　模型分区25<br />第3章　大模型的开源生态27<br />3.1　大模型的开源社区27<br />3.1.1　Meta27<br />3.1.2　Hugging Face28<br />3.1.3　微软31<br />3.1.4　英伟达32<br />3.2　开源生态下基座模型选择的<br />关键指标33<br />3.2.1　参数规模33<br />3.2.2　训练Token34<br />3.2.3　上下文窗口35<br />3.2.4　综合评测36<br />3.2.5　商业许可37<br />3.3　开源基座模型LLaMA系列38<br />3.3.1　LLaMA 238<br />3.3.2　LLaMA 340<br />3.3.3　商用40<br />第4章　自举领域数据的获取42<br />4.1　指令自举标注42<br />4.2　自举无监督标注44<br />4.2.1　指令生成阶段44<br />4.2.2　答案生成阶段46<br />4.2.3　过滤和修剪阶段47<br />4.3　自我策展47<br />4.3.1　初始化阶段48<br />4.3.2　自我增强阶段49<br />4.3.3　自我策展阶段49<br />4.4　自我奖励50<br />4.4.1　种子数据51<br />4.4.2　自我指令创建51<br />4.4.3　指令遵循训练52<br />4.4.4　迭代训练53<br />第5章　数据处理54<br />5.1　数据处理的挑战54<br />5.2　数据质量55<br />5.2.1　文本提取56<br />5.2.2　数据去重56<br />5.2.3　质量过滤58<br />5.2.4　内容毒性过滤59<br />5.3　高效数据集访问60<br />5.3.1　数据集来源60<br />5.3.2　列式内存格式61<br />5.3.3　向量化计算63<br />5.3.4　零复制数据交换64<br />5.3.5　虚拟内存65<br />第6章　大模型抽象66<br />6.1　计算图66<br />6.2　静态计算图69<br />6.3　动态计算图70<br />6.4　算子优化与调度73<br />6.4.1　计算图与算子优化73<br />6.4.2　计算图与算子调度74<br />6.4.3　串行调度与并行调度74<br />6.5　大模型中的张量与算子76<br />6.5.1　输入层77<br />6.5.2　自注意力层78<br />6.5.3　前馈网络层79<br />6.5.4　输出层79<br />6.6　大模型的序列化80<br />6.6.1　序列化文件的类型80<br />6.6.2　TensorFlow模型序列化81<br />6.6.3　PyTorch模型序列化84<br />6.6.4　Safetensors序列化格式86<br />第7章　LoRA低算力微调89<br />7.1　LoRA的原理89<br />7.2　LoRA的重参数化方法91<br />7.3　秩的选择92<br />7.4　LoRA的多任务处理策略93<br />7.5　LoRA量化版本QLoRA94<br />7.6　LoRA微调类型95<br />7.6.1　继续预训练95<br />7.6.2　RLHF96<br />7.6.3　DPO97<br />第8章　大模型的分布式训练99<br />8.1　分布式训练的挑战99<br />8.1.1　算力与内存瓶颈99<br />8.1.2　分布式训练系统的<br />设计挑战100<br />8.2　分布式集群架构102<br />8.2.1　GPU集群架构102<br />8.2.2　集合通信算子104<br />8.2.3　通信拓扑108<br />8.3　分布式训练的通信架构109<br />8.3.1　基于参数服务器的架构109<br />8.3.2　基于归约的架构111<br />8.4　并行模式113<br />8.4.1　数据并行113<br />8.4.2　张量并行115<br />8.4.3　流水线并行116<br />8.4.4　并行模式的对比117<br />8.5　大模型的张量并行118<br />8.5.1　输入层118<br />8.5.2　输出层120<br />8.5.3　多层感知机121<br />8.5.4　自注意力122<br />8.6　数据并行的内存优化123<br />8.6.1　设备内存占用124<br />8.6.2　ZeRO技术125<br />8.6.3　ZeRO-Offload技术128<br />第9章　推理优化技术131<br />9.1　计算加速131<br />9.1.1　算子融合131<br />9.1.2　并行推理134<br />9.2　内存优化135<br />9.2.1　KV缓存135<br />9.2.2　页注意力137<br />9.2.3　快速注意力139<br />9.3　吞吐量优化143<br />9.3.1　内存I/O瓶颈143<br />9.3.2　静态批处理143<br />9.3.3　连续批处理144<br />9.3.4　动态分割融合145<br />9.4　量化147<br />9.4.1　量化的动机147<br />9.4.2　量化的原理148<br />9.4.3　LLM.int8()150<br />9.4.4　GPTQ152<br />第10章　大模型的编译优化156<br />10.1　深度学习编译与大模型编译156<br />10.1.1　深度学习编译156<br />10.1.2　多级渐进优化158<br />10.1.3　硬件优化偏好159<br />10.1.4　大模型的编译特点161<br />10.2　深度学习框架与编译优化162<br />10.2.1　深度学习框架162<br />10.2.2　不同阶段的编译优化163<br />10.3　训练阶段的编译优化165<br />10.3.1　训练前优化165<br />10.3.2　训练优化库166<br />10.4　端侧部署的编译优化166<br />10.4.1　深度学习框架的<br />　端侧部署工具167<br />10.4.2　第三方编译工具168<br />10.4.3　大模型的手动<br />　编译优化170<br />10.5　服务器端部署的编译优化171<br />第11章　大模型部署的非性能需求173<br />11.1　内容安全173<br />11.1.1　内容安全的分类173<br />11.1.2　应对策略176<br />11.2　水印177<br />11.2.1　主要检测技术的对比177<br />11.2.2　大模型水印框架179<br />11.2.3　水印攻击技术181<br />11.3　监控184<br />11.3.1　监控流程184<br />11.3.2　大模型基线185<br />11.3.3　监控架构187<br />11.4　评估188<br />11.4.1　评估维度189<br />11.4.2　评估数据集190<br />11.4.3　评估方法192<br />第12章　垂直领域大模型的<br />　服务器端部署194<br />12.1　服务器端部署架构194<br />12.1.1　服务器端部署的挑战194<br />12.1.2　公有云与私有云196<br />12.1.3　服务器端部署流程与<br />　优化198<br />12.2　运行库优化199<br />12.2.1　运行库优化与编译<br />　优化199<br />12.2.2　TensorRT运行库架构199<br />12.2.3　TensorRT运行库优化与<br />　推理201<br />12.2.4　TensorRT-LLM204<br />12.3　TGI生产环境解决方案204<br />12.3.1　TGI的架构204<br />12.3.2　TGI推理加速技术206<br />12.3.3　TGI的其他特性207
标签
缩略图
书名	大模型垂直领域低算力迁移：微调、部署与优化
副书名
原作名
作者	程戈
译者
编者
绘者
出版社	机械工业出版社
商品编码（ISBN）	9787111767671
开本	16开
页数	210
版次	1
装订
字数	282
出版时间	2025-01-01
首版时间
印刷时间	2024-12-01
正文语种
读者对象
适用范围
发行范围
发行模式	实体书
首发网站
连载网址
图书大类	教育考试-考试-计算机类
图书小类
重量
CIP核字
中图分类号	TP18
丛书名
印张
印次	1
出版地
长
宽
高
整理
媒质
用纸
是否注音
影印版本
出版商国别
是否套装
著作权合同登记号
版权提供者
定价
印数
出品方
作品荣誉
主角
配角
其他角色
一句话简介
立意
作品视角
所属系列
文章进度
内容简介
作者简介
目录
文摘
安全警示	适度休息有益身心健康，请勿长期沉迷于阅读小说。
随便看	水果/亲亲宝贝认知书律师收费谈判技能/律师执业技能丛书历史学基础(中国史大纲解析2024年全国硕士研究生入学考试)/范无聊历史学考研系列地海故事集/地海传奇/读客科幻文库芬芳满堂(终章) 语文名师吴海燕精评红楼梦新世纪文学研究的重构--以郭敬明和耽美为起点的探索强制性产品认证的经济法规制/两江经济法治文丛混凝土结构工程施工质量验收规范 GB 50204-2015 临床合理用药指导芬芳满堂梦幻贴纸书(灵春之庭)/巴啦啦小魔仙星缘蝶启列那狐的故事/名师推荐新课标阅读书目京津冀发展报告(2019打造创新驱动经济增长新引擎2019版)/北京市哲学社会科学研究基地智库报告系列丛书/京津冀蓝皮书田英章硬笔行书技法(万卷专业书法教材) 2021年会计专业技术资格考试最后六套题中级经济法简·奥斯汀的秩序观老年长期护理保险制度(中日韩的比较研究)/社会政策丛书高考快递高考预测卷理科综合 2023 英国养老金制度变迁(从撒切尔到特蕾莎·梅) 失控的农业(廉价肉品的真实代价) 简·爱(名师推荐全译本)/名师推荐新课标阅读书目所有权转让的抽象性研究/新时代法学学术文库攀登永无止境西藏登山60年(全2册) 列那狐的故事(美绘版统编教材推荐阅读)/世界经典名著阅读馆 EarTrumpet(Windows音量控制增强) v2.2.1.0 中文绿色免费版 CSDN·浏览器助手 V3.0.5 扩展工具 Withings Health Mate(健康监测) for iPhone v5.13.0 苹果手机版钱小店 for android v1.0.1 安卓手机版 VMOS云手机(手游挂机托管软件) v3.0.6 安卓版甄视康 for android v1.0.4 安卓手机版元月潮赏 for android v1.0.0 安卓手机版茶秘书 for android v1.0.0 安卓手机版向日运动 for Android v1.0.1 安卓手机版成语乐开花 for Android v1.1.2 安卓手机版 BestPuzzle No.287 (40 pieces) FAKE miniature TOKYO puzzle 梦幻侏罗纪NEW 残忍的农夫2 Monix Word Pinball 名人我来猜狂扁格斗战士星球分裂者2013 冲浪聚会棒球大联盟优雅的母女坏爱情成化十四年大酱园奈何boss要娶我2 猎鹰与冬兵森林奥林匹斯星传虽然是精神病但没关系