图书 | 大数据预处理技术(大数据专业应用型人才培养规划教材) |
内容 | 内容推荐 数据预处理是进行数据挖掘前必不可少的准备工作,更是数据挖掘中的关键一步。数据预处理一方面可以保证数据挖掘的正确性和有效性;另一方面通过对数据格式和内容的调整,可使数据更符合挖掘的需要。本书采用理论与实践相结合的方式,详细讲解了如何通过Ketle和Python实现数据预处理。本书可作为高等院校数据科学与大数据技术、计算机、信息管理等相关专业课程的教材,参考课时为64课时。 目录 第1章 数据预处理概述 1.1 数据预处理的背景与目的 1.2 数据预处理的流程 1.3 数据预处理的工具 第2章 Kettle的初步使用 2.1 Kettle的安装 2.2 Kettle的使用 第3章 基于Kettle的数据导人与导出 3.1 基于文件的数据导入与导出 3.2 基于数据库的数据导入与导出 3.3 基于CDC变更数据的导人与导出 第4章 数据清理 4.1 数据清理概述 4.2 数据排重 4.3 使用脚本组件进行数据清理 第5章 Kettle作业设计 5.1 作业的概念及组成 5.2 作业的执行方式 5.3 作业的创建及常用作业项 5.4 变量 5.5 监控 5.6 命令行启动 5.7 作业实验 第6章 构建数据仓库 6.1 构建维度表 6.2 构建事实表 第7章 基于Python的数据导入与导出 7.1 Pandas 7.2 文本文件的导入与导出 7.3 二进制文件的导人与导出 7.4 数据库的导入与导出 第8章 基于Python的数据整理 8.1 合并多个数据集 8.2 数据重塑 8.3 数据转换 参考文献 |
标签 | |
缩略图 | ![]() |
书名 | 大数据预处理技术(大数据专业应用型人才培养规划教材) |
副书名 | |
原作名 | |
作者 | |
译者 | |
编者 | 谢向东//许桂秋 |
绘者 | |
出版社 | 浙江科学技术出版社 |
商品编码(ISBN) | 9787534188930 |
开本 | 16开 |
页数 | 280 |
版次 | 1 |
装订 | 平装 |
字数 | 416 |
出版时间 | 2020-01-01 |
首版时间 | 2020-01-01 |
印刷时间 | 2020-01-01 |
正文语种 | 汉 |
读者对象 | 本科及以上 |
适用范围 | |
发行范围 | 公开发行 |
发行模式 | 实体书 |
首发网站 | |
连载网址 | |
图书大类 | |
图书小类 | |
重量 | 507 |
CIP核字 | 2020001938 |
中图分类号 | TP274 |
丛书名 | |
印张 | 18 |
印次 | 1 |
出版地 | 浙江 |
长 | 260 |
宽 | 185 |
高 | 14 |
整理 | |
媒质 | |
用纸 | |
是否注音 | |
影印版本 | |
出版商国别 | CN |
是否套装 | |
著作权合同登记号 | |
版权提供者 | |
定价 | |
印数 | |
出品方 | |
作品荣誉 | |
主角 | |
配角 | |
其他角色 | |
一句话简介 | |
立意 | |
作品视角 | |
所属系列 | |
文章进度 | |
内容简介 | |
作者简介 | |
目录 | |
文摘 | |
安全警示 | 适度休息有益身心健康,请勿长期沉迷于阅读小说。 |
随便看 |
|
兰台网图书档案馆全面收录古今中外各种图书,详细介绍图书的基本信息及目录、摘要等图书资料。