本书详细阐述了与Python数据清洗相关的基本解决方案,主要包括将表格数据导入Pandas中、将HTML和JSON导入Pandas中、衡量数据好坏、识别缺失值和离群值、使用可视化方法识别意外值、使用Series操作清洗和探索数据、聚合时修复混乱数据、组合DataFrame、规整和重塑数据、用户定义的函数和类等内容。此外,本书还提供了相应的示例、代码,以帮助读者进一步理解相关方案的实现过程。
本书适合作为高等院校计算机及相关专业的教材和教学参考书,也可作为相关开发人员的自学用书和参考手册。
图书 | Python数据清洗 |
内容 | 内容推荐 本书详细阐述了与Python数据清洗相关的基本解决方案,主要包括将表格数据导入Pandas中、将HTML和JSON导入Pandas中、衡量数据好坏、识别缺失值和离群值、使用可视化方法识别意外值、使用Series操作清洗和探索数据、聚合时修复混乱数据、组合DataFrame、规整和重塑数据、用户定义的函数和类等内容。此外,本书还提供了相应的示例、代码,以帮助读者进一步理解相关方案的实现过程。 本书适合作为高等院校计算机及相关专业的教材和教学参考书,也可作为相关开发人员的自学用书和参考手册。 作者简介 迈克尔·沃克尔(Michael Walker)在各种教育机构担任数据分析师已有30多年了。自2006年以来,他还为本科生讲授数据科学、研究方法、统计学和计算机程序设计。他制作了大量公共部门和基金会的报告,并在学术期刊上发表了自己的分析成果。 目录 第1章 将表格数据导入Pandas中 1.1 技术要求 1.2 导入CSV文件 1.2.1 准备工作 1.2.2 实战操作 1.2.3 原理解释 1.2.4 扩展知识 1.2.5 参考资料 1.3 导入Excel文件 1.3.1 准备工作 1.3.2 实战操作 1.3.3 原理解释 1.3.4 扩展知识 1.3.5 参考资料 1.4 从SQL数据库中导入数据 1.4.1 准备工作 1.4.2 实战操作 1.4.3 原理解释 1.4.4 扩展知识 1.4.5 参考资料 1.5 导入SPSS、Stata和SAS数据 1.5.1 准备工作 1.5.2 实战操作 1.5.3 原理解释 1.5.4 扩展知识 1.5.5 参考资料 1.6 导入R数据 1.6.1 准备工作 1.6.2 实战操作 1.6.3 原理解释 1.6.4 扩展知识 1.6.5 参考资料 1.7 保留表格数据 1.7.1 准备工作 1.7.2 实战操作 1.7.3 泵理解释 1.7.4 扩展知识 第2章 将HTML和JSON导入Pandas中 2.1 技术要求 2.2 导入简单的JSON数据 2.2.1 准备工作 2.2.2 实战操作 2.2.3 原理解释 2.2.4 扩展知识 2.3 通过API导入更复杂的JSON数据 2.3.1 准备工作 2.3.2 实战操作 2.3.3 原理解释 2.3.4 扩展知识 2.3.5 参考资料 2.4 从网页中导入数据 2.4.1 准备工作 2.4.2 实战操作 2.4.3 原理解释 2.4.4 扩展知识 2.5 持久保存JSON数据 2.5.1 准备工作 2.5.2 实战操作 2.5.3 原理解释 2.5.4 扩展知识 第3章 衡量数据好坏 第4章 识别缺失值和离群值 第5章 使用可视化方法识别意外值 第6章 使用Series操作清洗和探索数据 第7章 聚合时修复混乱数据 第8章 组合DataFrame 第9章 规整和重塑数据 第10章 用户定义的函数和类 |
标签 | |
缩略图 | ![]() |
书名 | Python数据清洗 |
副书名 | |
原作名 | |
作者 | (美)迈克尔·沃克尔 |
译者 | 译者:刘亮 |
编者 | |
绘者 | |
出版社 | 清华大学出版社 |
商品编码(ISBN) | 9787302609360 |
开本 | 16开 |
页数 | 336 |
版次 | 1 |
装订 | 平装 |
字数 | 451 |
出版时间 | 2022-07-01 |
首版时间 | 2022-07-01 |
印刷时间 | 2022-07-01 |
正文语种 | 汉 |
读者对象 | 本科及以上 |
适用范围 | |
发行范围 | 公开发行 |
发行模式 | 实体书 |
首发网站 | |
连载网址 | |
图书大类 | |
图书小类 | |
重量 | 566 |
CIP核字 | 2022088962 |
中图分类号 | TP311.561 |
丛书名 | |
印张 | 22.5 |
印次 | 1 |
出版地 | 北京 |
长 | 231 |
宽 | 184 |
高 | 18 |
整理 | |
媒质 | |
用纸 | |
是否注音 | |
影印版本 | |
出版商国别 | |
是否套装 | |
著作权合同登记号 | |
版权提供者 | |
定价 | |
印数 | |
出品方 | |
作品荣誉 | |
主角 | |
配角 | |
其他角色 | |
一句话简介 | |
立意 | |
作品视角 | |
所属系列 | |
文章进度 | |
内容简介 | |
作者简介 | |
目录 | |
文摘 | |
安全警示 | 适度休息有益身心健康,请勿长期沉迷于阅读小说。 |
随便看 |
|
兰台网图书档案馆全面收录古今中外各种图书,详细介绍图书的基本信息及目录、摘要等图书资料。