图书 | 数据准备和特征工程——数据工程师必知必会技能 |
内容 | 作者简介 齐伟,自称老齐,现居苏州,所著在线教程《零基础学Python》及《零基础学Python(第2版)》在业内引起很好大的反响。愿意和来自各方的朋友讨论技术问题,并能提供相关技术服务。 目录 章 感知数据001 1.0了解数据科学项目001 1.1文件中的数据003 1.1.1CSV文件003 1.1.2Excel文件009 1.1.3图像文件015 1.2数据库中的数据019 1.3网页上的数据029 1.4来自API的数据039 第2章 数据清理044 2.0基本概念045 2.1转化数据类型046 2.2处理重复数据054 2.3处理缺失数据057 2.3.1检查缺失数据058 2.3.2用指定值填补063 2.3.3根据规律填补069 2.4处理离群数据076 第3章 特征变换083 3.0特征的类型084 3.1特征数值化085 3.2特征二值化088 3.3OneHot编码093 3.4数据变换098 3.5特征离散化104 3.5.1无监督离散化104 3.5.2有监督离散化110 3.6数据规范化113 第4章 特征选择124 4.0特征选择简述124 4.1封装器法127 4.1.1循序特征选择127 4.1.2穷举特征选择135 4.1.3递归特征消除140 4.2过滤器法144 4.3嵌入法149 第5章 特征抽取154 5.1无监督特征抽取154 5.1.1主成分分析154 5.1.2因子分析161 5.2有监督特征抽取167 附录A Jupyter简介173 附录B NumPy简介176 附录C Pandas简介185 附录D Matplotlib简介194 后记199 内容推荐 本书详细地介绍了大数据、人工智能等项目中不可或缺的环节和内容:数据准备和特征工程。书中的每节首先以简明方式介绍了基本知识;然后通过实际案例演示了基本知识的实际应用,并提供了针对性练习项目,将“知识、案例、练习”融为一体;很后以“扩展探究”方式引导读者进入更深广的领域。本书既适合作为大学相关专业的教材,也适合作为大数据、人工智能等领域的开发人员的参考读物。 |
标签 | |
缩略图 | ![]() |
书名 | 数据准备和特征工程——数据工程师必知必会技能 |
副书名 | |
原作名 | |
作者 | 齐伟 |
译者 | |
编者 | |
绘者 | |
出版社 | 电子工业出版社 |
商品编码(ISBN) | 9787121382635 |
开本 | 16开 |
页数 | 198 |
版次 | 1 |
装订 | 平装 |
字数 | 332000 |
出版时间 | 2020-03-01 |
首版时间 | 2020-03-01 |
印刷时间 | 2020-03-01 |
正文语种 | |
读者对象 | |
适用范围 | |
发行范围 | |
发行模式 | 实体书 |
首发网站 | |
连载网址 | |
图书大类 | 教育考试-考试-计算机类 |
图书小类 | |
重量 | |
CIP核字 | |
中图分类号 | TP274,TP18 |
丛书名 | |
印张 | |
印次 | 1 |
出版地 | 北京 |
长 | |
宽 | |
高 | 26cm |
整理 | |
媒质 | |
用纸 | |
是否注音 | |
影印版本 | |
出版商国别 | |
是否套装 | |
著作权合同登记号 | |
版权提供者 | |
定价 | |
印数 | |
出品方 | |
作品荣誉 | |
主角 | |
配角 | |
其他角色 | |
一句话简介 | |
立意 | |
作品视角 | |
所属系列 | |
文章进度 | |
内容简介 | |
作者简介 | |
目录 | |
文摘 | |
安全警示 | 适度休息有益身心健康,请勿长期沉迷于阅读小说。 |
随便看 |
|
兰台网图书档案馆全面收录古今中外各种图书,详细介绍图书的基本信息及目录、摘要等图书资料。