首页  软件  游戏  图书  电影  电视剧

请输入您要查询的图书:

 

图书 数据科学技术(文本分析和知识图谱全彩印刷)
内容
内容推荐
数据科学的关键技术包括数据存储计算、数据治理、结构化数据分析、语音分析、视觉分析、文本分析和知识图谱等方面。本书的重点是详细介绍文本分析和知识图谱方面的技术。文本分析技术主要包括文本预训练模型、多语种文本分析、文本情感分析、文本机器翻译、文本智能纠错、NL2SQL问答以及ChatGPT大语言模型等。知识图谱技术主要包括知识图谱构建和知识图谱问答等。本书将理论介绍和实践相结合,详细阐述各个技术主题的实现路线,并对应用于业界算法大赛中的技术方案和技巧进行源代码解读,帮助读者深入理解技术原理。最后,本书还介绍了文本分析和知识图谱技术在政务、公共安全、应急等多个行业中的智能应用实践案例。
本书适合具备Python和机器学习技术基础的高等院校学生、文本分析(或者自然语言处理)以及知识图谱领域的算法工程师和研究机构的研究者阅读,也适合数据科学和人工智能领域的研究者作为参考书。
作者简介
苏海波,清华大学电子工程系博士,副研究员,在文本分析、知识图谱、大模型等人工智能方向拥有超过十年的研发实践经验。多篇SCI和E论文发表于国外顶尖学术会议和期刊,获得国家发明专利20余项,曾担任科技部重点研发计划子课题负责人。获得2019年和2020年北京市科学技术进步奖,带领团队获得多个业界知名算法技术评测的冠军和亚军。
目录
第1章 什么是数据科学
1.1 数据科学的定义
1.1.1 数据科学的背景
1.1.2 数据科学的定义
1.2 数据科学的关键技术
1.2.1 数据存储计算
1.2.2 数据治理
1.2.3 结构化数据分析
1.2.4 语音分析
1.2.5 视觉分析
1.2.6 文本分析
1.2.7 知识图谱
1.3 本章小结
1.4 习题
1.5 本章参考文献
第2章 文本预训练模型
2.1 文本分析技术的发展史
2.2 Transformer模型结构
2.3 预训练模型的结构和变种
2.4 加速处理器GPU和TPU
2.4.1 GPU的介绍
2.4.2 GPU产品命名
2.4.3 TPU和GPU的区别
2.4.4 TPU的使用总结
2.5 预训练模型的常见问题
2.5.1 模型输入的常见问题
2.5.2 模型原理的常见问题
2.5.3 模型进化的常见问题
2.6 预训练模型的源码解读
2.6.1 模型架构
2.6.2 BertModel
2.6.3 BERT预训练任务
2.6.4 BERT微调
2.7 本章小结
2.8 习题
2.9 本章参考文献
第3章 多语种文本分析
3.1 多语种文本分析背景介绍
3.2 多语种文本分析技术
3.2.1 Polyglot技术
3.2.2 Multilingual BERT
3.2.3 XLM多语言模型
3.2.4 XLMR多语言模型
3.2.5 模型实验效果
3.3 多语种文本分析源码解读
3.4 本章小结
3.5 习题
3.6 本章参考文献
第4章 文本情感分析
第5章 文本机器翻译
第6章 文本智能纠错
第7章 知识图谱构建
第8章 知识图谱问答
第9章 结构化知识NL2SQL问答
第10章 ChatGPT大语言模型
第11章 行业实践案例
标签
缩略图
书名 数据科学技术(文本分析和知识图谱全彩印刷)
副书名
原作名
作者 苏海波//刘译璟//易显维//苏萌
译者
编者
绘者
出版社 清华大学出版社
商品编码(ISBN) 9787302649700
开本 16开
页数 334
版次 1
装订 平装
字数 580
出版时间 2024-01-01
首版时间 2024-01-01
印刷时间 2024-01-01
正文语种
读者对象 本科及以上
适用范围
发行范围 公开发行
发行模式 实体书
首发网站
连载网址
图书大类
图书小类
重量 728
CIP核字 2023224935
中图分类号 TP274
丛书名
印张 21.5
印次 1
出版地 北京
260
189
18
整理
媒质
用纸
是否注音
影印版本
出版商国别
是否套装
著作权合同登记号
版权提供者
定价
印数
出品方
作品荣誉
主角
配角
其他角色
一句话简介
立意
作品视角
所属系列
文章进度
内容简介
作者简介
目录
文摘
安全警示 适度休息有益身心健康,请勿长期沉迷于阅读小说。
随便看

 

兰台网图书档案馆全面收录古今中外各种图书,详细介绍图书的基本信息及目录、摘要等图书资料。

 

Copyright © 2004-2025 xlantai.com All Rights Reserved
更新时间:2025/5/8 16:24:32