图书 | 商战数据挖掘 |
内容 | 内容推荐 数据挖掘是现代企业从数据中提取有用信息、获取竞争优势的重要方法。针对数据科学的这一商业应用,本书进行了深入解读,不仅详细介绍了数据挖掘的环节、常用分析技术和基本模型,还提供了数据科学解决方案的提案示例和评估指南。同时,为了便于读者理解,本书不仅分析了大量商业示例,在业务情景下阐释数据挖掘的基本概念和原理,还使用大量图表辅助解释数学细节。因此,读者无需专业数学背景即可阅读本书。 目录 赞誉xiii 前言xv 章绪论:数据分析式思维1 1.1数据机遇无处不在1 1.2案例:飓风Frances2 1.3案例:预测用户流失3 1.4数据科学、数据工程和数据驱动型决策4 1.5数据处理和“大数据”6 1.6从大数据1.0到大数据2.06 1.7数据与数据科学能力:一种战略性资产7 1.8数据分析式思维9 1.9关于本书10 1.10重新审视数据挖掘和数据科学11 1.11数据科学:一门新兴的实验性学科12 1.12小结12 第2章商业问题及其数据科学解决方案14 2.1从商业问题到数据挖掘任务14 2.2有监督方法与无监督方法17 2.3数据挖掘及其结果18 2.4数据挖掘流程19 2.4.1业务理解环节20 2.4.2数据理解环节21 2.4.3数据准备环节22 2.4.4建模环节22 2.4.5评估环节23 2.4.6部署环节24 2.5管理数据科学团队的含义25 2.6其他分析技巧与技术26 2.6.1统计26 2.6.2数据库查询27 2.6.3数据仓库28 2.6.4回归分析28 2.6.5机器学习与数据挖掘28 2.6.6运用以上技术解决商业问题29 2.7小结30 第3章预测建模导论:从相关性到有监督的划分31 3.1建模、归纳与预测32 3.2有监督的划分35 3.2.1选取富信息属性36 3.2.2示例:基于信息增益进行属性选择42 3.2.3使用树形结构模型进行有监督的划分46 3.3划分的可视化52 3.4把树视作规则组53 3.5概率估计54 3.6示例:用树型归纳解决用户流失问题56 3.7小结59 第4章用模型拟合数据61 4.1根据数学函数分类62 4.1.1线性判别函数64 4.1.2目标函数的最优化66 4.1.3示例:基于数据挖掘线性判别式67 4.1.4用线性判别函数对实例进行评分和排序68 4.1.5支持向量机简介69 4.2通过数学函数进行回归71 4.3类概率估计和逻辑“回归”73 4.4示例:对比逻辑回归和树型归纳77 4.5非线性方程、支持向量机和神经网络81 4.6小结83 第5章避免过拟合84 5.1泛化能力84 5.2过拟合85 5.3过拟合检验86 5.3.1保留数据和拟合图86 5.3.2树型归纳的过拟合问题88 5.3.3数值函数的过拟合问题89 5.4示例:线性函数的过拟合90 5.5*示例:过拟合为何有害95 5.6从保留评估到交叉验证96 5.7用户流失数据集回顾99 5.8学习曲线100 5.9避免过拟合与控制复杂度101 5.9.1树型归纳中的过拟合规避102 5.9.2避免过拟合的一般方法102 5.9.3*参数优化中的过拟合规避104 5.10小结106 第6章相似性、近邻和簇107 6.1相似性和距离108 6.2最近邻推理109 6.2.1示例:威士忌分析110 6.2.2用最近邻来进行预测建模111 6.2.3近邻的数量及其影响113 6.2.4几何解释、过拟合和复杂度控制115 6.2.5最近邻方法的问题118 6.3与相似性和最近邻相关的一些重要技术细节119 6.3.1混合属性119 6.3.2*其他距离函数120 6.3.3*组合函数:计算近邻的评分122 6.4聚类124 6.4.1示例:威士忌分析回顾124 6.4.2层次聚类125 6.4.3最近邻回顾:根据形心的聚类128 6.4.4示例:对商业新闻报道进行聚类132 6.4.5理解聚类结果135 6.4.6*用有监督学习产生簇描述136 6.5退一步:解决业务问题与数据探索139 6.6小结140 第7章决策分析思维(一):如何评估一个模型142 7.1对分类器的评估143 7.1.1简单准确率的问题143 7.1.2混淆矩阵144 7.1.3样本类别不均衡的问题144 7.1.4成本收益不均衡的问题147 7.2分类问题的推广147 7.3一个重要的分析框架:期望值148 7.3.1用期望值规范分类器的使用148 7.3.2用期望值规范分类器的评估149 7.4评估、基线性能以及对数据投资的意义155 7.5小结157 第8章模型性能的可视化159 8.1排序,而不是分类159 8.2利润曲线161 8.3ROC图像和曲线163 8.4ROC曲线下面积168 8.5累积响应曲线和提升曲线168 8.6示例:用户流失模型的性能分析171 8.7小结177 第9章证据和概率179 9.1示例:向线上目标用户投放广告179 9.2根据概率合并证据181 9.2.1联合概率与独立性181 9.2.2贝叶斯法则182 9.3将贝叶斯法则应用到数据科学中183 9.3.1条件独立和朴素贝叶斯184 9.3.2朴素贝叶斯的优劣势186 9.4证据“提升度”的模型187 9.5示例:Facebook“点赞”的证据提升度188 9.6小结190 0章文本的表示和挖掘191 10.1为什么文本很重要192 10.2为什么文本很难处理192 10.3表示法193 10.3.1词袋模型193 10.3.2词频193 10.3.3度量稀疏度:逆文档频率195 10.3.4TFIDF196 10.4示例:爵士音乐家197 10.5*IDF和熵的关系200 10.6词袋模型之外的方法202 10.6.1n-grams序列202 10.6.2命名实体提取202 10.6.3主题模型203 10.7示例:通过挖掘新闻报道预测股价变动204 10.7.1任务204 10.7.2数据205 10.7.3数据处理207 10.7.4结果208 10.8小结211 1章决策分析思维(二):面向分析工程212 11.1为慈善机构寻找最佳捐赠人213 11.1.1期望值框架:分解商业问题,重组解决方案213 11.1.2简短的题外话:选择性偏差214 11.2更复杂的用户流失示例回顾215 11.2.1期望值框架:构建更复杂的商业问题215 11.2.2评估激励的影响216 11.2.3从期望值分解到数据科学解决方案217 11.3小结219 2章其他数据科学任务与技术220 12.1共现和关联:寻找匹配项221 12.1.1度量意外:提升度和杠杆率221 12.1.2示例:啤酒和彩票222 12.1.3Facebook点赞的关联223 12.2用户画像:寻找典型行为225 12.3链路预测和社交推荐229 12.4数据约简、潜在信息和电影推荐230 12.5偏差、方差和集成方法233 12.6数据驱动的因果解释和一个病毒式营销示例235 12.7小结236 3章数据科学和经营战略237 13.1数据分析式思维,终极版237 13.2用数据科学取得竞争优势238 13.3用数据科学保持竞争优势239 13.3.1令人敬畏的历史优势240 13.3.2独一无二的知识产权240 13.3.3独一无二的无形抵押资产240 13.3.4优秀的数据科学家241 13.3.5优秀的数据科学管理242 13.4吸引和培养数据科学家及其团队243 13.5检验数据科学案例分析244 13.6做好准备,接受来源各异的创意245 13.7做好准备,评估数据科学项目提案245 13.7.1数据挖掘提案示例246 13.7.2BigRed提案中的缺陷246 13.8企业的数据科学成熟度247 4章总结250 14.1数据科学的基本概念250 14.1.1将基本概念应用于新问题:挖掘移动设备数据252 14.1.2改变对商业问题解决方案的思考方式253 14.2数据做不到的:圈中人回顾254 14.3隐私、道德和挖掘个人数据256 14.4数据科学是否还有更多内容257 14.5最后一例:从众包到云包257 14.6最后的话258 附录A提案评估指南259 附录B另一个提案示例262 参考文献265 术语表273 关于作者278 |
标签 | |
缩略图 | ![]() |
书名 | 商战数据挖掘 |
副书名 | |
原作名 | |
作者 | (美) 福斯特·普罗沃斯特, 汤姆·福西特 |
译者 | |
编者 | |
绘者 | |
出版社 | 人民邮电出版社 |
商品编码(ISBN) | 9787115522337 |
开本 | 16开 |
页数 | 278 |
版次 | 1 |
装订 | 平装 |
字数 | 443000 |
出版时间 | 2019-12 |
首版时间 | 2019-12-01 |
印刷时间 | 2019-12-01 |
正文语种 | |
读者对象 | |
适用范围 | |
发行范围 | |
发行模式 | 实体书 |
首发网站 | |
连载网址 | |
图书大类 | 教育考试-考试-计算机类 |
图书小类 | |
重量 | |
CIP核字 | |
中图分类号 | TP274 |
丛书名 | |
印张 | |
印次 | 1 |
出版地 | |
长 | |
宽 | |
高 | |
整理 | |
媒质 | |
用纸 | |
是否注音 | |
影印版本 | |
出版商国别 | |
是否套装 | |
著作权合同登记号 | |
版权提供者 | |
定价 | 89.00 |
印数 | |
出品方 | |
作品荣誉 | |
主角 | |
配角 | |
其他角色 | |
一句话简介 | |
立意 | |
作品视角 | |
所属系列 | |
文章进度 | |
内容简介 | |
作者简介 | |
目录 | |
文摘 | |
安全警示 | 适度休息有益身心健康,请勿长期沉迷于阅读小说。 |
随便看 |
|
兰台网图书档案馆全面收录古今中外各种图书,详细介绍图书的基本信息及目录、摘要等图书资料。