《小白学数据挖掘与机器学习(SPSS Modeler案例篇)》张浩彬电子工业出版社PDF电子书网盘迅雷下载、免费在线阅读-兰台网

本书用生活中常见的例子、有趣的插图和通俗的语言，把看上去晦涩难懂的数据挖掘与机器学习知识以通俗易懂的方式分享给读者，让读者从入门学习阶段就发现，原来数据挖掘与机器学习不但有用，还很有趣。本书以IBM SPSS Modeler作为案例实践工具，首先介绍了数据挖掘的基本概念及数据挖掘方法，然后介绍了IBM SPSS Modeler工具的基本使用、数据探索、统计检验、回归分析、分类算法、聚类算法、关联规则、神经网络以及集成学习。每一章都会以漫画形式介绍一些日常小例子并作为切入点，用通俗的语言介绍具体的算法理论，同时在每章很后都附上应用案例，让读者更轻松地阅读本书并掌握对应的算法和实践操作。全书内容循序渐进，完整覆盖了数据挖掘与机器学习的主要知识点，适合数据挖掘与机器学习入门读者阅读。

第1章数据挖掘那些事儿1
1.1当我们在谈数据挖掘时，其实在讨论什么2
1.2从CRISP-DM开启数据挖掘实践7
第2章数据挖掘之利器：SPSSModeler17
2.1SPSSModeler简介18
2.2SPSSModeler的下载与安装21
2.3SPSSModeler的主界面及基本操作23
2.3.1SPSSModeler主界面介绍23
2.3.2鼠标基本操作31
2.4将SPSSModeler连接到服务器端31
第3章巧妇难为无米之炊：数据，数据！34
3.1数据的身份35
3.1.1变量的测量级别35
3.1.2变量的角色36
3.2数据的读取37
3.2.1读取Excel文件数据37
3.2.2读取变量文件数据38
3.2.3读取SPSSStatistics（.sav）文件数据40
3.2.4读取数据库数据42
3.3数据的基本设定45
3.3.1变量角色的设定45
3.3.2字段的筛选及命名46
3.4数据的集成47
3.4.1数据的变量集成：合并节点47
3.4.2数据的记录集成：追加节点50
第4章一点都不简单的描述性统计分析53
4.1分类变量的基本分析：“矩阵”节点54
4.2连续变量的基本分析：数据审核节点57
4.2.1连续变量基本分析指标介绍57
4.2.2“数据审核”节点63
第5章何为足够大的差异：常用的统计检验67
5.1假设检验68
5.1.1假设检验的基本原理68
5.1.2假设检验的一般步骤69
5.2连续变量与分类变量之间的关系：t检验70
5.2.1两组独立样本均值比较71
5.2.2两组配对样本均值比较72
5.2.3使用t检验的前提条件73
5.2.4案例：使用均值比较分析电信客户的流失情况73
5.3两个连续变量之间的关系：相关分析75
5.3.1相关分析理论76
5.3.2案例：使用相关分析研究居民消费水平与国内生产总值的相关关系77
5.4两个分类变量之间的关系：卡方检验80
5.4.1卡方检验的原理80
5.4.2卡方检验的前提条件82
5.4.3案例：使用卡方检验研究两个分类字段之间的关系82
第6章从身高和体重的关系谈起：回归分析84
6.1一元线性回归分析85
6.1.1分析因变量与自变量的关系，构建回归模型85
6.1.2估计模型系数，求解回归模型87
6.1.3对模型系数进行检验，确认模型有效性88
6.1.4拟合优度检验，判断模型解释能力89
6.1.5借助回归模型进行预测90
6.2多元线性回归分析90
6.2.1估计模型系数，求解回归模型91
6.2.2对模型参数进行检验，确认模型有效性92
6.2.3拟合优度检验，判断模型解释能力94
6.2.4模型的变量选择95
6.3使用线性回归分析的注意事项97
6.4案例：使用回归分析研究影响房屋价格的重要因素98
第7章回归岂止这么简单：回归模型的进一步扩展102
7.1曲线回归103
7.2Logistic回归110
7.2.1Logistic回归理论110
7.2.2案例：使用Logistic回归模型分析个人收入水平影响因素112
第8章模型评估那些事儿：过拟合与欠拟合117
8.1过拟合与欠拟合118
8.2留出法与交叉验证122
8.2.1留出法与分层抽样122
8.2.2交叉验证124
第9章从看电影的思考到决策树的生成126
9.1决策树概述127
9.2决策树生成129
9.2.1从ID3算法到C5.0算法131
9.2.2CART算法134
9.3决策树的剪枝136
9.3.1预剪枝策略137
9.3.2后剪枝策略137
9.3.3代价敏感学习138
9.4案例：用决策树分析客户违约情况140
9.5关于信息熵的扩展147
第10章人工神经网络：从人脑神经元开始151
10.1从人脑神经元到人工神经网络152
10.2感知机154
10.3人工神经网络159
10.3.1隐藏层的作用159
10.3.2人工神经网络算法160
10.4案例：利用人工神经网络分析某电信运营商的客户流失情况164
第11章物以类聚，人以群分：聚类分析172
11.1聚类思想的概述173
11.2聚类方法的关键：距离175
11.3K-Means算法176
11.3.1K-Means算法原理176
11.3.2轮廓系数（Silhouettecoefficient）177
11.4案例：利用K-Means算法对不同型号汽车的属性进行聚类分群研究179
第12章啤酒+尿布=关联分析？186
12.1一个关于关联分析的传说187
12.2关联分析的基本概念188
12.3关联规则的有效性指标190
12.4Apriori算法192
12.4.1生成频繁项集193
12.4.2生成关联规则195
12.5案例：利用Apriori算法对顾客的个人信息及购买记录进行关联分析195
第13章三个臭皮匠，赛过诸葛亮：集成学习算法199
13.1集成学习算法概述200
13.23种不同的集成学习算法201
13.2.1Bagging算法201
13.2.2Boosting算法203
13.2.3随机森林204
13.3集成学习算法实践205
13.3.1Bagging算法和Boosting算法205
13.3.2随机森林211
13.3.3集成学习算法结果比较214

图书	小白学数据挖掘与机器学习(SPSS Modeler案例篇)
内容	内容推荐本书用生活中常见的例子、有趣的插图和通俗的语言，把看上去晦涩难懂的数据挖掘与机器学习知识以通俗易懂的方式分享给读者，让读者从入门学习阶段就发现，原来数据挖掘与机器学习不但有用，还很有趣。本书以IBM SPSS Modeler作为案例实践工具，首先介绍了数据挖掘的基本概念及数据挖掘方法，然后介绍了IBM SPSS Modeler工具的基本使用、数据探索、统计检验、回归分析、分类算法、聚类算法、关联规则、神经网络以及集成学习。每一章都会以漫画形式介绍一些日常小例子并作为切入点，用通俗的语言介绍具体的算法理论，同时在每章很后都附上应用案例，让读者更轻松地阅读本书并掌握对应的算法和实践操作。全书内容循序渐进，完整覆盖了数据挖掘与机器学习的主要知识点，适合数据挖掘与机器学习入门读者阅读。作者简介张浩彬，人称浩彬老撕，曾任IBM大中华区商业智能事业部SPSS分析工程师，认知解决方案事业部数据分析专家；现任广东柯内特环境科技有限公司首席数据科学家。致力机器学习及SPSS技术分享，专注于人工智能技术与应用。目录第1章数据挖掘那些事儿1 1.1当我们在谈数据挖掘时，其实在讨论什么2 1.2从CRISP-DM开启数据挖掘实践7 第2章数据挖掘之利器：SPSSModeler17 2.1SPSSModeler简介18 2.2SPSSModeler的下载与安装21 2.3SPSSModeler的主界面及基本操作23 2.3.1SPSSModeler主界面介绍23 2.3.2鼠标基本操作31 2.4将SPSSModeler连接到服务器端31 第3章巧妇难为无米之炊：数据，数据！34 3.1数据的身份35 3.1.1变量的测量级别35 3.1.2变量的角色36 3.2数据的读取37 3.2.1读取Excel文件数据37 3.2.2读取变量文件数据38 3.2.3读取SPSSStatistics（.sav）文件数据40 3.2.4读取数据库数据42 3.3数据的基本设定45 3.3.1变量角色的设定45 3.3.2字段的筛选及命名46 3.4数据的集成47 3.4.1数据的变量集成：合并节点47 3.4.2数据的记录集成：追加节点50 第4章一点都不简单的描述性统计分析53 4.1分类变量的基本分析：“矩阵”节点54 4.2连续变量的基本分析：数据审核节点57 4.2.1连续变量基本分析指标介绍57 4.2.2“数据审核”节点63 第5章何为足够大的差异：常用的统计检验67 5.1假设检验68 5.1.1假设检验的基本原理68 5.1.2假设检验的一般步骤69 5.2连续变量与分类变量之间的关系：t检验70 5.2.1两组独立样本均值比较71 5.2.2两组配对样本均值比较72 5.2.3使用t检验的前提条件73 5.2.4案例：使用均值比较分析电信客户的流失情况73 5.3两个连续变量之间的关系：相关分析75 5.3.1相关分析理论76 5.3.2案例：使用相关分析研究居民消费水平与国内生产总值的相关关系77 5.4两个分类变量之间的关系：卡方检验80 5.4.1卡方检验的原理80 5.4.2卡方检验的前提条件82 5.4.3案例：使用卡方检验研究两个分类字段之间的关系82 第6章从身高和体重的关系谈起：回归分析84 6.1一元线性回归分析85 6.1.1分析因变量与自变量的关系，构建回归模型85 6.1.2估计模型系数，求解回归模型87 6.1.3对模型系数进行检验，确认模型有效性88 6.1.4拟合优度检验，判断模型解释能力89 6.1.5借助回归模型进行预测90 6.2多元线性回归分析90 6.2.1估计模型系数，求解回归模型91 6.2.2对模型参数进行检验，确认模型有效性92 6.2.3拟合优度检验，判断模型解释能力94 6.2.4模型的变量选择95 6.3使用线性回归分析的注意事项97 6.4案例：使用回归分析研究影响房屋价格的重要因素98 第7章回归岂止这么简单：回归模型的进一步扩展102 7.1曲线回归103 7.2Logistic回归110 7.2.1Logistic回归理论110 7.2.2案例：使用Logistic回归模型分析个人收入水平影响因素112 第8章模型评估那些事儿：过拟合与欠拟合117 8.1过拟合与欠拟合118 8.2留出法与交叉验证122 8.2.1留出法与分层抽样122 8.2.2交叉验证124 第9章从看电影的思考到决策树的生成126 9.1决策树概述127 9.2决策树生成129 9.2.1从ID3算法到C5.0算法131 9.2.2CART算法134 9.3决策树的剪枝136 9.3.1预剪枝策略137 9.3.2后剪枝策略137 9.3.3代价敏感学习138 9.4案例：用决策树分析客户违约情况140 9.5关于信息熵的扩展147 第10章人工神经网络：从人脑神经元开始151 10.1从人脑神经元到人工神经网络152 10.2感知机154 10.3人工神经网络159 10.3.1隐藏层的作用159 10.3.2人工神经网络算法160 10.4案例：利用人工神经网络分析某电信运营商的客户流失情况164 第11章物以类聚，人以群分：聚类分析172 11.1聚类思想的概述173 11.2聚类方法的关键：距离175 11.3K-Means算法176 11.3.1K-Means算法原理176 11.3.2轮廓系数（Silhouettecoefficient）177 11.4案例：利用K-Means算法对不同型号汽车的属性进行聚类分群研究179 第12章啤酒+尿布=关联分析？186 12.1一个关于关联分析的传说187 12.2关联分析的基本概念188 12.3关联规则的有效性指标190 12.4Apriori算法192 12.4.1生成频繁项集193 12.4.2生成关联规则195 12.5案例：利用Apriori算法对顾客的个人信息及购买记录进行关联分析195 第13章三个臭皮匠，赛过诸葛亮：集成学习算法199 13.1集成学习算法概述200 13.23种不同的集成学习算法201 13.2.1Bagging算法201 13.2.2Boosting算法203 13.2.3随机森林204 13.3集成学习算法实践205 13.3.1Bagging算法和Boosting算法205 13.3.2随机森林211 13.3.3集成学习算法结果比较214
标签
缩略图
书名	小白学数据挖掘与机器学习(SPSS Modeler案例篇)
副书名
原作名
作者	张浩彬
译者
编者
绘者
出版社	电子工业出版社
商品编码（ISBN）	9787121338434
开本	16开
页数	216
版次	1
装订	平装
字数	298
出版时间	2018-07
首版时间	2018-07
印刷时间	2018-07
正文语种	汉
读者对象	普通大众
适用范围
发行范围	公开发行
发行模式	实体书
首发网站
连载网址
图书大类
图书小类
重量	438
CIP核字	2018048262
中图分类号	TP274,TP181
丛书名
印张	14.5
印次	1
出版地	北京
长	234
宽	186
高	12
整理
媒质	图书
用纸	普通纸
是否注音	否
影印版本	原版
出版商国别	CN
是否套装
著作权合同登记号
版权提供者
定价
印数
出品方
作品荣誉
主角
配角
其他角色
一句话简介
立意
作品视角
所属系列
文章进度
内容简介
作者简介
目录
文摘
安全警示	适度休息有益身心健康，请勿长期沉迷于阅读小说。
随便看	如果·爱欲望都城玥蜺的信石幸存者故事一舞凤囚凰清倾人塞壬（all观）红颜惑姐姐你太美了若有来世还是你子夜吴歌花落还开千影无爱纪（吸血鬼骑士）陵舞小伯爵的管家拱手江山那时，我们还没毕业 [娱乐圈]幸福的纪年他和她（猎人）拐点红窗遗梦南柯一梦，知与谁同如果你在就好了同人短篇集永生花能唱出来的表情包 9p 免费版暗云Ⅲ检查工具 v1.0 中文绿色版 Talent Copy(集成系统粘贴增强工具) V0.0.0.151 去广告安装版 32位 Talent Copy(集成系统粘贴增强工具) V0.0.0.151 去广告安装版 64位 HP惠普LaserJet M2727nf一体机驱动程序 for WinXP/Vista/Win7 32位/64位微信全自动采集加群软件 VIP 官方免费安装版(已注册) 精科大头贴制作软件 v2.71 官方免费安装版 h1z1鼠标连点器 v1.3 防封号版 dell显示器分屏软件 v6.0 官方免费版幕匠幕墙软件(CAD图库管理与CAD工具箱) v3.5 官方最新绿色版武林群侠录1.4正式版附隐藏英雄密码及攻略魔兽防守地图武战乾坤1.13正式版附隐藏英雄密码及攻略魔兽防守地图兽潮优化版T4.0 附隐藏英雄密码及游戏攻略魔兽防守地图劫变1.0 附游戏攻略及隐藏英雄密码魔兽防守地图心跳文学俱乐部圣诞服装莫妮卡MOD v0.6.3 免费版心跳文学俱乐部简体中文免安装版万灵药：最后的遗嘱英文免安装版僵尸士兵英文免安装版蝙蝠侠：内敌6号升级档+EP4+未加密补丁3DM 免费版特许经营曲棍球经理4升级档+未加密补丁SKIDROW v4.5.66 免费版情陷聊斋·画皮遇龙一不小心喵上你百灵潭夜色暗涌时玉昭令第二季微笑妈妈微笑妈妈暗夜行者九霄寒夜暖