首页  软件  游戏  图书  电影  电视剧

请输入您要查询的图书:

 

图书 大数据处理:从采集到可视化
内容
目录
章数据采集
1.1大数据概念
1.2大数据类型及特征
1.3数据采集方法
1.3.1问卷调查方法
1.3.2网络用户数据收集方法
1.3.3系统曰志采集方法
1.3.4网络数据采集方法
第2章数据清洗
2.1数据质量维度
2.2数据预处理之数据可能存在的问题
2.3数据质量问题的原因分析
2.3.1数据源数据质量问题的原因分析
2.3.2数据分析阶段数据质量问题的原因分析
2.4数据预处理之数据问题处理方法
2.4.1变化量识别
2.4.2错误拒绝
2.4.3列清洗
2.4.4行过滤
2.5记录匹配算法
……
内容推荐
本书共分为9章,章数据采集,主要介绍了大数据的概念、类型及其特征,常见的数据采集方法;第2章数据清洗,主要讨论数据质量的维度,数据可能存在的质量问题,常见的数据清洗方法;第3章数据ETL,重点介绍了MGO方法;第4章数据存储,主要介绍了大数据时代的一些主流数据存储平台和相关技术;第5章回归算法,主要介绍了线性回归、决策树回归、随机森林回归等,并介绍了其实现的主要步骤以及相应的Python语言实现代码;第6章分类算法,主要介绍了逻辑回归二分类和多分类、度提升分类树等;第7章聚类算法,主要介绍了分割聚类、层次聚类、基于密度的聚类;第8章推荐算法,主要介绍了基于关联规则的推荐、基于内容过滤的推荐等主流方法;第9章数据可视化的关键技术,主要介绍了数据的降维、可视化隐喻及相关的交互技术。
标签
缩略图
书名 大数据处理:从采集到可视化
副书名
原作名
作者 余肖生,陈鹏,姜艳静 编
译者
编者
绘者
出版社 武汉大学出版社
商品编码(ISBN) 9787307215146
开本 16开
页数 224
版次 1
装订 平装
字数 229000
出版时间 2020-07-01
首版时间 2020-07-01
印刷时间 2020-07-01
正文语种
读者对象
适用范围
发行范围
发行模式 实体书
首发网站
连载网址
图书大类
图书小类
重量
CIP核字
中图分类号 TP274
丛书名
印张
印次 1
出版地
24cm
整理
媒质
用纸
是否注音
影印版本
出版商国别
是否套装
著作权合同登记号
版权提供者
定价
印数
出品方
作品荣誉
主角
配角
其他角色
一句话简介
立意
作品视角
所属系列
文章进度
内容简介
作者简介
目录
文摘
安全警示 适度休息有益身心健康,请勿长期沉迷于阅读小说。
随便看

 

兰台网图书档案馆全面收录古今中外各种图书,详细介绍图书的基本信息及目录、摘要等图书资料。

 

Copyright © 2004-2025 xlantai.com All Rights Reserved
更新时间:2025/5/14 8:24:08