本书详细地介绍了大数据、人工智能等项目中不可或缺的环节和内容:数据准备和特征工程。书中的每节首先以简明方式介绍了基本知识;然后通过实际案例演示了基本知识的实际应用,并提供了针对性练习项目,将“知识、案例、练习”融为一体;最后以“扩展探究”方式引导读者进入更深广的领域。
本书既适合作为大学相关专业的教材,也适合作为大数据、人工智能等领域的开发人员的参考读物。
图书 | 数据准备和特征工程--数据工程师必知必会技能/新工科建设之路数据科学与大数据系列 |
内容 | 内容推荐 本书详细地介绍了大数据、人工智能等项目中不可或缺的环节和内容:数据准备和特征工程。书中的每节首先以简明方式介绍了基本知识;然后通过实际案例演示了基本知识的实际应用,并提供了针对性练习项目,将“知识、案例、练习”融为一体;最后以“扩展探究”方式引导读者进入更深广的领域。 本书既适合作为大学相关专业的教材,也适合作为大数据、人工智能等领域的开发人员的参考读物。 目录 第1章 感知数据 1.0 了解数据科学项目 1.1 文件中的数据 1.1.1 CSV文件 1.1.2 Excel文件 1.1.3 图像文件 1.2 数据库中的数据 1.3 网页上的数据 1.4 来自API的数据 第2章 数据清理 2.0 基本概念 2.1 转化数据类型 2.2 处理重复数据 2.3 处理缺失数据 2.3.1 检查缺失数据 2.3.2 用指定值填补 2.3.3 根据规律填补 2.4 处理离群数据 第3章 特征变换 3.0 特征的类型 3.1 特征数值化 3.2 特征二值化 3.3 OneHot编码 3.4 数据变换 3.5 特征离散化 3.5.1 无监督离散化 3.5.2 有监督离散化 3.6 数据规范化 第4章 特征选择 4.0 特征选择简述 4.1 封装器法 4.1.1 循序特征选择 4.1.2 穷举特征选择 4.1.3 递归特征消除 4.2 过滤器法 4.3 嵌入法 第5章 特征抽取 5.1 无监督特征抽取 5.1.1 主成分分析 5.1.2 因子分析 5.2 有监督特征抽取 附录A Jupyter简介 附录B NumPy简介 附录C Pandas简介 附录D Maptplotlib简介 后记 |
标签 | |
缩略图 | ![]() |
书名 | 数据准备和特征工程--数据工程师必知必会技能/新工科建设之路数据科学与大数据系列 |
副书名 | |
原作名 | |
作者 | |
译者 | |
编者 | 齐伟 |
绘者 | |
出版社 | 电子工业出版社 |
商品编码(ISBN) | 9787121382635 |
开本 | 16开 |
页数 | 198 |
版次 | 1 |
装订 | 平装 |
字数 | 332 |
出版时间 | 2020-03-01 |
首版时间 | 2020-03-01 |
印刷时间 | 2022-01-01 |
正文语种 | 汉 |
读者对象 | 本科及以上 |
适用范围 | |
发行范围 | 公开发行 |
发行模式 | 实体书 |
首发网站 | |
连载网址 | |
图书大类 | |
图书小类 | |
重量 | 368 |
CIP核字 | 2020020000 |
中图分类号 | TP274 |
丛书名 | |
印张 | 13 |
印次 | 3 |
出版地 | 北京 |
长 | 259 |
宽 | 185 |
高 | 10 |
整理 | |
媒质 | |
用纸 | |
是否注音 | |
影印版本 | |
出版商国别 | CN |
是否套装 | |
著作权合同登记号 | |
版权提供者 | |
定价 | |
印数 | |
出品方 | |
作品荣誉 | |
主角 | |
配角 | |
其他角色 | |
一句话简介 | |
立意 | |
作品视角 | |
所属系列 | |
文章进度 | |
内容简介 | |
作者简介 | |
目录 | |
文摘 | |
安全警示 | 适度休息有益身心健康,请勿长期沉迷于阅读小说。 |
随便看 |
|
兰台网图书档案馆全面收录古今中外各种图书,详细介绍图书的基本信息及目录、摘要等图书资料。