首页  软件  游戏  图书  电影  电视剧

请输入您要查询的图书:

 

图书 数据分析与应用入门(Python版题库版)/计算机技术入门丛书
内容
内容推荐
本书是数据分析类课程的入门教材,系统整理了数据分析的知识体系,以分析流程为主线阐述了数据分析的主要方法和基于Python的技术应用。
全书共分为9章,包括数据分析简介,数据分析的方法,NumPy和pandas基础,数据获取与导入,数据预处理,数据探索,数据挖掘概述,基本统计图形,文本、网络和地理空间可视化。从第2章开始,在阐述基础知识的同时设计了大量例题,按照“分析需求→Python代码展示→例题解析→运行结果”的模式对知识点进行剖析。全书提供习题、答案及程序源码。
本书可作为普通高等院校数据分析处理相关课程的学生的教材使用,也可供刚刚步入数据分析领域的从业人员参考。
目录
第1章 数据分析简介
1.1 开篇案例
1.2 认识数据
1.2.1 数据
1.2.2 数据类型
1.3 认识数据分析
1.3.1 数据管理的产生和发展
1.3.2 机器学习与人工智能
1.4 数据分析步骤
1.5 数据分析作用
1.6 常用数据分析工具
1.7 数据分析思维
小结
习题
第2章 数据分析的方法
2.1 针对现状分析的数据分析方法
2.1.1 对比分析法
2.1.2 分组分析法
2.1.3 结构分析法
2.1.4 平均分析法
2.1.5 综合评价分析法
2.2 针对原因分析的数据分析方法
2.2.1 交叉分析法
2.2.2 漏斗分析法
2.2.3 矩阵关联分析法
2.2.4 聚类分析法
2.2.5 帕累托分析法
2.3 针对预测分析的数据分析方法
2.3.1 回归分析法
2.3.2 时间序列分析法
2.3.3 决策树分析法
2.3.4 神经网络分析法
小结
习题
第3章 NumPy和pandas基础
3.1 NumPy基础
3.1.1 ndarray数组的创建
3.1.2 ndarray的常用属性
3.1.3 ndarray的数据类型
3.1.4 ndarray的算术操作
3.1.5 ndarray的索引和切片
3.1.6 对轴的理解
3.2 pandas基础
3.2.1 pandas数据结构
3.2.2 索引重命名与重新索引
3.2.3 数据基本操作
小结
习题
第4章 数据获取与导入
4.1 数据获取
4.2 网络爬虫
4.2.1 网页结构
4.2.2 爬虫的流程
4.2.3 爬虫Robots协议
4.3 数据导入与导出
4.3.1 一般文件
4.3.2 CSV文件
4.3.3 Excel文件
4.3.4 JSON文件
4.3.5 数据库
小结
习题
第5章 数据预处理
5.1 数据预处理的必要性
5.2 数据清洗
5.2.1 重复值检测与处理
5.2.2 缺失值检测与处理
5.2.3 噪声检测与处理
5.3 数据集成
5.3.1 实体识别问题
5.3.2 数据列冗余问题
5.3.3 数据值冲突问题
5.4 数据规约
5.4.1 策略概述
5.4.2 属性子集选择
5.4.3 抽样
5.5 数据变换
5.5.1 数据合并
5.5.2 数据抽取
5.5.3 数据计算
小结
习题
第6章 数据探索
6.1 基本统计描述
6.1.1 集中趋势
6.1.2 离散程度
6.1.3 分布形状
6.2 数据分组与聚合分析
6.2.1 数据分组
6.2.2 数据聚合
6.3 交叉分析
6.3.1 数据透视表
6.3.2 数据交叉表
6.4 参数估计及假设检验
6.4.1 参数估计
6.4.2 假设检验
6.5 相关分析
6.5.1 简单相关分析
6.5.2 偏相关分析
6.5.3 非参数相关分析
小结
习题
第7章 数据挖掘概述
7.1 什么是数据挖掘
7.2 数据挖掘问题与任务
7.3 分类分析
7.3.1 预备知识
7.3.2 解决分类问题的一般方法
7.3.3 代表性方法之一:K最近邻算法
7.3.4 评估分类器性能的度量
7.4 关联分析
7.4.1 购物篮分析
7.4.2 频繁项集和关联规则
7.4.3 基于Python的Apriori算法
7.4.4 关联模式的评估
7.5 聚类分析
7.5.1 什么是聚类分析
7.5.2 基本的聚类方法
7.5.3 代表性方法之一:k均值
7.5.4 聚类评估
小结
习题
第8章 基本统计图形
8.1 Matplotlib绘图
8.1.1 图形基本设置
8.1.2 基本统计图形
8.2 pandas绘图
8.3 Seaborn绘图
8.3.1 单变量数据分布
8.3.2 双变量数据分布
8.3.3 多变量数据分布
小结
习题
第9章 文本、网络和地理空间可视化
9.1 文本可视化
9.1.1 分词
9.1.2 词云
9.2 网络图可视化
9.2.1 网络与图
9.2.2 NetworkX绘图
9.3 地理空间可视化
9.3.1 GeoPandas和Basemap
9.3.2 分级统计地图
9.3.3 点描法地图
9.3.4 带气泡的地图
小结
习题
参考文献
标签
缩略图
书名 数据分析与应用入门(Python版题库版)/计算机技术入门丛书
副书名
原作名
作者
译者
编者 潘晓//吴雷//王书海
绘者
出版社 清华大学出版社
商品编码(ISBN) 9787302621829
开本 16开
页数 284
版次 1
装订 平装
字数 430
出版时间 2022-12-01
首版时间 2022-12-01
印刷时间 2022-12-01
正文语种
读者对象 本科及以上
适用范围
发行范围 公开发行
发行模式 实体书
首发网站
连载网址
图书大类
图书小类
重量 534
CIP核字 2022214334
中图分类号 TP311.561
丛书名
印张 18.5
印次 1
出版地 北京
260
186
15
整理
媒质
用纸
是否注音
影印版本
出版商国别
是否套装
著作权合同登记号
版权提供者
定价
印数 1500
出品方
作品荣誉
主角
配角
其他角色
一句话简介
立意
作品视角
所属系列
文章进度
内容简介
作者简介
目录
文摘
安全警示 适度休息有益身心健康,请勿长期沉迷于阅读小说。
随便看

 

兰台网图书档案馆全面收录古今中外各种图书,详细介绍图书的基本信息及目录、摘要等图书资料。

 

Copyright © 2004-2025 xlantai.com All Rights Reserved
更新时间:2025/5/17 14:40:07