首页  软件  游戏  图书  电影  电视剧

请输入您要查询的图书:

 

图书 数据挖掘--概念模型方法和算法(第2版国外计算机科学经典教材)
内容
编辑推荐

坎塔尔季奇编著的这本《数据挖掘:概念、模型、方法和算法(第2版)》是面向在校生、毕业生、研究人员和相关从业人员的一本极具价值的指南,介绍了支持向量机(SVM)和Koilonen映射,讲解了DBSCAN、BIRCH和分布式DBSCAN聚类算法,介绍了贝叶斯网络,讨论图形中的Betweeness和Centrality参数测量算法,分析了在建立决策树时使用的CART算法和基尼指数,介绍了Bagging&Boosting集成学习方法,并详述了AdaBoost算法,讨论了Relief以及PageRank算法,讨论了文本挖掘的潜在语义分析(LSA),并分析了如何测定文本文档之间的语义相似性,讲解了时态、空间、Web、文本、并行和分布式数据挖掘等新主题,更详细地讲解了数据挖掘技术商业、隐私、安全和法律方面的内容。本书介绍的这些广泛主题可以帮助读者了解数据挖掘对现代商业、科学甚至整个社会的影响。

内容推荐

随着数据规模和复杂度的持续上升,分析员必须利用更高级的软件工具来执行间接的、自动的智能化数据分析。坎塔尔季奇编著的这本《数据挖掘:概念、模型、方法和算法(第2版)》介绍了通过分析高维数据空间中的海量原始数据来提取用于决策的新信息的尖端技术和方法。

《数据挖掘:概念、模型、方法和算法(第2版)》开篇阐述数据挖掘原理,此后在示例的引导下详细讲解起源于统计学、机器学习、神经网络、模糊逻辑和演化计算等学科的具有代表性的、最前沿的挖掘方法和算法。书中还着重描述如何恰当地选择方法和数据分析软件并合理地调整参数。每章末尾附有复习题。

《数据挖掘:概念、模型、方法和算法(第2版)》主要用作计算机科学、计算机工程和计算机信息系统专业的研究生数据挖掘教材,高年级本科生或具备同等教育背景的读者也完全可以理解本书的所有主题。

目录

第1章 数据挖掘的概念

 1.1 概述

 1.2 数据挖掘的起源

 1.3 数据挖掘过程

 1.4 大型数据集

 1.5 数据仓库

 1.6 数据挖掘的商业方面:为什么数据挖掘项目会失败

 1.7 本书结构安排

 1.8 复习题

 1.9 参考书目

第2章 数据准备

 2.1 原始数据的表述

 2.2 原始数据的特性

 2.3 原始数据的转换

2.3.1 标准化

2.3.2 数据平整

2.3.3 差值和比率

 2.4 丢失数据

 2.5 时间相关数据

 2.6 异常点分析

 2.7 复习题

 2.8 参考书目

第3章 数据归约

 3.1 大型数据集的维度

 3.2 特征归约

3.2.1 特征选择

3.2.2 特征提取

 3.3 Relief算法

 3.4 特征排列的熵度量

 3.5 主成分分析

 3.6 值归约

 3.7 特征离散化:ChiMerge技术

 3.8 案例归约

 3.9 复习题

 3.10 参考书目

第4章 从数据中学习

 4.1 学习机器

 4.2 统计学习原理

 4.3 学习方法的类型

 4.4 常见的学习任务

 4.5 支持向量机

 4.6 KNN:最近邻分类器

 4.7 模型选择与泛化

 4.8 模型的评估

 4.9 90%准确的情形

4.9.1 保险欺诈检测

4.9.2 改进心脏护理

 4.10 复习题

 4.11 参考书目

第5章 统计方法

 5.1 统计推断

 5.2 评测数据集的差异

 5.3 贝叶斯定理

 5.4 预测回归

 5.5 方差分析

 5.6 对数回归

 5.7 对数—线性模型

 5.8 线性判别分析

 5.9 复习题

 5.10 参考书目

第6章 决策树和决策规则

 6.1 决策树

 6.2 C4.5算法:生成决策树

 6.3 未知属性值

 6.4 修剪决策树

 6.5 C4.5算法:生成决策规则

 6.6 CART算法和Gini指标

 6.7 决策树和决策规则的局限性

 6.8 复习题

 6.9 参考书目

第7章 人工神经网络

 7.1 人工神经元的模型

 7.2 人工神经网络的结构

 7.3 学习过程

 7.4 使用ANN完成的学习任务

7.4.1 模式联想

7.4.2 模式识别

 7.5 多层感知机

 7.6 竞争网络和竞争学习

 7.7 SOM

 7.8 复习题

 7.9 参考书目

第8章 集成学习

 8.1 集成学习方法论

 8.2 多学习器组合方案

 8.3 baggin9和boostin9

 8.4 AdaBoost算法

 8.5 复习题

 8.6 参考书目

第9章 聚类分析

 9.1 聚类的概念

 9.2 相似度的度量

 9.3 凝聚层次聚类

 9.4 分区聚类

 9.5 增量聚类

 9.6 DBSCAN算法

 9.7 BIRCH算法

 9.8 聚类验证

 9.9 复习题

 9.10 参考书目

第10章 关联规则

 10.1 购物篮分析

 10.2 Apfiofi算法

 10.3 从频繁项集中得到关联规则

 10.4 提高Apfiofi算法的效率

 10.5 FP增长方法

 10.6 关联分类方法

 10.7 多维关联规则挖掘

 10.8 复习题

 10.9 参考书目

第11章 Web挖掘和文本挖掘

 11.1 Web挖掘

 11.2 Web内容、结构与使用挖掘

 11.3 HITS和LOGSOM算法

 11.4 挖掘路径遍历模式

 11.5 PageRank算法

 11.6 文本挖掘

 11.7 潜在语义分析

 11.8 复习题

 11.9 参考书目

第12章 数据挖掘高级技术

 12.1 图挖掘

 12.2 时态数据挖掘

12.2.1 时态数据表示

12.2.2 序列之间的相似性度量

12.2.3 时态数据模型

12.2.4 数据挖掘

 12.3 空间数据挖掘(SDM)

 12.4 分布式数据挖掘(DDM)

 12.5 关联并不意味着存在因果关系

 12.6 数据挖掘的隐私、安全及法律问题

 12.7 复习题

 12.8 参考书目

第13章 遗传算法

 13.1 遗传算法的基本原理

 13.2 用遗传算法进行优化

13.2.1 编码方案和初始化

13.2.2 适合度估计

13.2.3 选择

13.2.4 交叉

13.2.5 突变

 13.3 遗传算法的简单例证

13.3.1 表述

13.3.2 初始群体

13.3.3 评价

13.3.4 交替

13.3.5 遗传算子

13.3.6 评价(第二次迭代)

 13.4 图式

 13.5 旅行推销员问题

 13.6 使用遗传算法的机器学习

13.6.1 规则交换

13.6.2 规则概化

13.6.3 规则特化

13.6.4 规则分割

 13.7 遗传算法用于聚类

 13.8 复习题

 13.9 参考书目

第14章 模糊集和模糊逻辑

 14.1 模糊集

 14.2 模糊集的运算

 14.3 扩展原理和模糊关系

 14.4 模糊逻辑和模糊推理系统

 14.5 多因子评价

 14.6 从数据中提取模糊模型

 14.7 数据挖掘和模糊集

 14.8 复习题

 14.9 参考书目

第15章 可视化方法

 15.1 感知和可视化

 15.2 科学可视化和信息可视化

 15.3 平行坐标

 15.4 放射性可视化

 15.5 使用自组织映射进行可视化

 15.6 数据挖掘的可视化系统

 15.7 复习题

 15.8 参考书目

附录A 数据挖掘工具

附录B 数据挖掘应用

标签
缩略图
书名 数据挖掘--概念模型方法和算法(第2版国外计算机科学经典教材)
副书名
原作名
作者 (美)坎塔尔季奇
译者 王晓海//吴志刚
编者
绘者
出版社 清华大学出版社
商品编码(ISBN) 9787302307143
开本 16开
页数 403
版次 1
装订 平装
字数 655
出版时间 2013-01-01
首版时间 2013-01-01
印刷时间 2013-01-01
正文语种
读者对象 青年(14-20岁),研究人员,普通成人
适用范围
发行范围 公开发行
发行模式 实体书
首发网站
连载网址
图书大类
图书小类
重量 0.714
CIP核字
中图分类号 TP274
丛书名
印张 26.25
印次 1
出版地 北京
261
185
24
整理
媒质 图书
用纸 普通纸
是否注音
影印版本 原版
出版商国别 CN
是否套装 单册
著作权合同登记号 图字:01-2012-0977
版权提供者 Institute of Electrical and Electronics Engineers
定价
印数 4000
出品方
作品荣誉
主角
配角
其他角色
一句话简介
立意
作品视角
所属系列
文章进度
内容简介
作者简介
目录
文摘
安全警示 适度休息有益身心健康,请勿长期沉迷于阅读小说。
随便看

 

兰台网图书档案馆全面收录古今中外各种图书,详细介绍图书的基本信息及目录、摘要等图书资料。

 

Copyright © 2004-2025 xlantai.com All Rights Reserved
更新时间:2025/5/14 15:56:41