《数据科学技术(文本分析和知识图谱全彩印刷)》苏海波//刘译璟//易显维//苏萌清华大学出版社PDF电子书网盘迅雷下载、免费在线阅读-兰台网

图书

数据科学技术(文本分析和知识图谱全彩印刷)

内容

内容推荐

数据科学的关键技术包括数据存储计算、数据治理、结构化数据分析、语音分析、视觉分析、文本分析和知识图谱等方面。本书的重点是详细介绍文本分析和知识图谱方面的技术。文本分析技术主要包括文本预训练模型、多语种文本分析、文本情感分析、文本机器翻译、文本智能纠错、NL2SQL问答以及ChatGPT大语言模型等。知识图谱技术主要包括知识图谱构建和知识图谱问答等。本书将理论介绍和实践相结合，详细阐述各个技术主题的实现路线，并对应用于业界算法大赛中的技术方案和技巧进行源代码解读，帮助读者深入理解技术原理。最后，本书还介绍了文本分析和知识图谱技术在政务、公共安全、应急等多个行业中的智能应用实践案例。
本书适合具备Python和机器学习技术基础的高等院校学生、文本分析（或者自然语言处理）以及知识图谱领域的算法工程师和研究机构的研究者阅读，也适合数据科学和人工智能领域的研究者作为参考书。

作者简介

苏海波，清华大学电子工程系博士，副研究员，在文本分析、知识图谱、大模型等人工智能方向拥有超过十年的研发实践经验。多篇SCI和E论文发表于国外顶尖学术会议和期刊，获得国家发明专利20余项，曾担任科技部重点研发计划子课题负责人。获得2019年和2020年北京市科学技术进步奖，带领团队获得多个业界知名算法技术评测的冠军和亚军。

第1章什么是数据科学
1.1 数据科学的定义
1.1.1 数据科学的背景
1.1.2 数据科学的定义
1.2 数据科学的关键技术
1.2.1 数据存储计算
1.2.2 数据治理
1.2.3 结构化数据分析
1.2.4 语音分析
1.2.5 视觉分析
1.2.6 文本分析
1.2.7 知识图谱
1.3 本章小结
1.4 习题
1.5 本章参考文献
第2章文本预训练模型
2.1 文本分析技术的发展史
2.2 Transformer模型结构
2.3 预训练模型的结构和变种
2.4 加速处理器GPU和TPU
2.4.1 GPU的介绍
2.4.2 GPU产品命名
2.4.3 TPU和GPU的区别
2.4.4 TPU的使用总结
2.5 预训练模型的常见问题
2.5.1 模型输入的常见问题
2.5.2 模型原理的常见问题
2.5.3 模型进化的常见问题
2.6 预训练模型的源码解读
2.6.1 模型架构
2.6.2 BertModel
2.6.3 BERT预训练任务
2.6.4 BERT微调
2.7 本章小结
2.8 习题
2.9 本章参考文献
第3章多语种文本分析
3.1 多语种文本分析背景介绍
3.2 多语种文本分析技术
3.2.1 Polyglot技术
3.2.2 Multilingual BERT
3.2.3 XLM多语言模型
3.2.4 XLMR多语言模型
3.2.5 模型实验效果
3.3 多语种文本分析源码解读
3.4 本章小结
3.5 习题
3.6 本章参考文献
第4章文本情感分析
第5章文本机器翻译
第6章文本智能纠错
第7章知识图谱构建
第8章知识图谱问答
第9章结构化知识NL2SQL问答
第10章 ChatGPT大语言模型
第11章行业实践案例

标签

缩略图

书名

数据科学技术(文本分析和知识图谱全彩印刷)

副书名

原作名

作者

苏海波//刘译璟//易显维//苏萌

译者

编者

绘者

出版社

清华大学出版社

商品编码（ISBN）

9787302649700

开本

16开

页数

334

版次

装订

平装

字数

580

出版时间

2024-01-01

首版时间

2024-01-01

印刷时间

2024-01-01

正文语种

汉

读者对象

本科及以上

适用范围

发行范围

公开发行

发行模式

实体书

首发网站

连载网址

图书大类

图书小类

重量

728

CIP核字

2023224935

中图分类号

TP274

丛书名

印张

21.5

印次

出版地

北京

长

260

宽

189

高

整理

媒质

用纸

是否注音

影印版本

出版商国别

是否套装

著作权合同登记号

版权提供者

定价

印数

出品方

作品荣誉

主角

配角

其他角色

一句话简介

立意

作品视角

所属系列

文章进度

内容简介

作者简介

文摘

安全警示

适度休息有益身心健康，请勿长期沉迷于阅读小说。

随便看

兰台网图书档案馆全面收录古今中外各种图书，详细介绍图书的基本信息及目录、摘要等图书资料。