| 图书 | 数据挖掘与机器学习(基础概念和算法原书第2版)/计算机科学丛书 |
| 内容 | 内容推荐 本书详实介绍了数据挖掘与机器学习相关的各种内容,包括数据矩阵、图数据、核方法、项集挖掘、聚类、贝叶斯分类器、决策树、支持向量机、线性回归、逻辑回归、神经网络、深度学习等,介绍其相关概念和基础算法,并在每章的末尾配有相关练习。第二版新增了几个关于回归的章节,包括神经网络和深度学习的内容。 目录 目 录<br />Data Mining and Machine Learning<br />译者序<br />前言<br />作者简介<br />第一部分 数据分析基础 1<br />第1章 数据矩阵 3<br />1.1 数据矩阵的组成 3<br />1.2 属性 4<br />1.3 数据:代数和几何观点 5<br />1.3.1 距离和角度 7<br />1.3.2 均值和总方差 9<br />1.3.3 正交投影 10<br />1.3.4 线性无关和维数 12<br />1.4 数据:概率观点 13<br />1.4.1 二元随机变量 17<br />1.4.2 多元随机变量 20<br />1.4.3 随机抽样与统计 21<br />1.5 拓展阅读 22<br />1.6 练习 23<br />第2章 数值型属性 24<br />2.1 一元分析 24<br />2.1.1 集中趋势度量 25<br />2.1.2 离散度度量 28<br />2.2 二元分析 32<br />2.2.1 位置和离散度的度量 33<br />2.2.2 相关性度量 33<br />2.3 多元分析 37<br />2.4 数据归一化 41<br />2.5 正态分布 42<br />2.5.1 一元正态分布 43<br />2.5.2 多元正态分布 44<br />2.6 拓展阅读 47<br />2.7 练习 47<br />第3章 类别型属性 49<br />3.1 一元分析 49<br />3.1.1 伯努利变量 49<br />3.1.2 多元伯努利变量 51<br />3.2 二元分析 56<br />3.3 多元分析 65<br />3.4 距离和角度 69<br />3.5 离散化 70<br />3.6 拓展阅读 72<br />3.7 练习 72<br />第4章 图数据 74<br />4.1 图的概念 74<br />4.2 拓扑属性 77<br />4.3 中心度分析 81<br />4.3.1 基本中心度 81<br />4.3.2 Web中心度 82<br />4.4 图模型 89<br />4.4.1 Erd?s-Rényi随机图模型 91<br />4.4.2 Watts-Strogatz小世界图<br />模型 94<br />4.4.3 Barabási-Albert无标度模型 98<br />4.5 拓展阅读 104<br />4.6 练习 105<br />第5章 核方法 107<br />5.1 核矩阵 110<br />5.1.1 再生核映射 111<br />5.1.2 Mercer核映射 113<br />5.2 向量核 115<br />5.3 特征空间中的基本核运算 119<br />5.4 复杂对象的核 124<br />5.4.1 字符串的谱核 124<br />5.4.2 图节点的扩散核 125<br />5.5 拓展阅读 129<br />5.6 练习 129<br />第6章 高维数据 130<br />6.1 高维对象 130<br />6.2 高维体积 133<br / >6.3 超立方体的内接超球面 135<br />6.4 薄超球面壳的体积 136<br />6.5 超空间的对角线 137<br />6.6 多元正态分布的密度 138<br />6.7 附录:超球面体积的推导 140<br />6.8 拓展阅读 143<br />6.9 练习 144<br />第7章 降维 146<br />7.1 背景介绍 146<br />7.2 主成分分析 149<br />7.2.1 最优一维近似 149<br />7.2.2 最优二维近似 152<br />7.2.3 最优r维近似 155<br />7.2.4 主成分分析的几何意义 158<br />7.3 核主成分分析 160<br />7.4 奇异值分解 166<br />7.4.1 奇异值分解中的几何<br />意义 167<br />7.4.2 SVD和PCA之间的<br />联系 168<br />7.5 拓展阅读 169<br />7.6 练习 169<br />第二部分 频繁模式挖掘 171<br />第8章 项集挖掘 173<br />8.1 频繁项集和关联规则 173<br />8.2 项集挖掘算法 176<br />8.2.1 逐层方法:Apriori算法 177<br />8.2.2 事务标识符集的交集方法:<br />Eclat算法 181<br />8.2.3 频繁模式树方法:FPGrowth<br />算法 184<br />8.3 生成关联规则 188<br />8.4 拓展阅读 189<br />8.5 练习 190<br /> ;第9章 项集概览 194<br />9.1 最大频繁项集和闭频繁项集 194<br />9.2 挖掘最大频繁项集:GenMax<br />算法 196<br />9.3 挖掘闭频繁项集:Charm算法 198 |
| 标签 | |
| 缩略图 | ![]() |
| 书名 | 数据挖掘与机器学习(基础概念和算法原书第2版)/计算机科学丛书 |
| 副书名 | |
| 原作名 | |
| 作者 | (美)穆罕默德·J.扎基//(巴西)小瓦格纳·梅拉 |
| 译者 | 译者:计湘婷//卢苗苗//李轩涯 |
| 编者 | |
| 绘者 | |
| 出版社 | 机械工业出版社 |
| 商品编码(ISBN) | 9787111726890 |
| 开本 | 16开 |
| 页数 | 604 |
| 版次 | 1 |
| 装订 | 平装 |
| 字数 | 979 |
| 出版时间 | 2023-06-01 |
| 首版时间 | 2023-06-01 |
| 印刷时间 | 2023-06-01 |
| 正文语种 | 汉 |
| 读者对象 | 普通大众 |
| 适用范围 | |
| 发行范围 | 公开发行 |
| 发行模式 | 实体书 |
| 首发网站 | |
| 连载网址 | |
| 图书大类 | |
| 图书小类 | |
| 重量 | 1042 |
| CIP核字 | 2023034482 |
| 中图分类号 | TP274 |
| 丛书名 | |
| 印张 | 38.5 |
| 印次 | 1 |
| 出版地 | 北京 |
| 长 | |
| 宽 | |
| 高 | |
| 整理 | |
| 媒质 | |
| 用纸 | |
| 是否注音 | |
| 影印版本 | |
| 出版商国别 | |
| 是否套装 | |
| 著作权合同登记号 | |
| 版权提供者 | |
| 定价 | |
| 印数 | |
| 出品方 | |
| 作品荣誉 | |
| 主角 | |
| 配角 | |
| 其他角色 | |
| 一句话简介 | |
| 立意 | |
| 作品视角 | |
| 所属系列 | |
| 文章进度 | |
| 内容简介 | |
| 作者简介 | |
| 目录 | |
| 文摘 | |
| 安全警示 | 适度休息有益身心健康,请勿长期沉迷于阅读小说。 |
| 随便看 |
|
兰台网图书档案馆全面收录古今中外各种图书,详细介绍图书的基本信息及目录、摘要等图书资料。