首页  软件  游戏  图书  电影  电视剧

请输入您要查询的图书:

 

图书 数据挖掘导论(原书第2版)/计算机科学丛书
内容
作者简介
陈封能(Pang-Ning Tan)密歇根州立大学计算机科学与工程系教授,主要研究方向是数据挖掘、数据库系统、网络空间安全、网络分析等。
目录
出版者的话
译者序
前言
第1章 绪论
1.1 什么是数据挖掘
1.2 数据挖掘要解决的问题
1.3 数据挖掘的起源
1.4 数据挖掘任务
1.5 本书组织结构
文献注释
参考文献
习题
第2章 数据
2.1 数据类型
2.1.1 属性与度量
2.1.2 数据集的类型
2.2 数据质量
2.2.1 测量和数据收集问题
2.2.2 关于应用的问题
2.3 数据预处理
2.3.1 聚集
2.3.2 抽样
2.3.3 维归约
2.3.4 特征子集选择
2.3.5 特征创建
2.3.6 离散化和二元化
2.3.7 变量变换
2.4 相似性和相异性的度量
2.4.1 基础
2.4.2 简单属性之间的相似度和相异度
2.4.3 数据对象之间的相异度
2.4.4 数据对象之间的相似度
2.4.5 邻近度度量的例子
2.4.6 互信息
*2.4.7 核函数
*2.4.8 Bregman散度
2.4.9 邻近度计算问题
2.4.10 选择正确的邻近度度量
文献注释
参考文献
习题
第3章 分类:基本概念和技术
3.1 基本概念
3.2 一般的分类框架
3.3 决策树分类器
3.3.1 构建决策树的基本算法
3.3.2 表示属性测试条件的方法
3.3.3 选择属性测试条件的方法
3.3.4 决策树归纳算法
3.3.5 示例:Web机器人检测
3.3.6 决策树分类器的特征
3.4 模型的过拟合
3.5 模型选择
3.5.1 验证集应用
3.5.2 模型复杂度合并
3.5.3 统计范围估计
3.5.4 决策树的模型选择
3.6 模型评估
3.6.1 保持方法
3.6.2 交叉验证
3.7 超参数的使用
3.7.1 超参数选择
3.7.2 嵌套交叉验证
3.8 模型选择和评估中的陷阱
3.8.1 训练集和测试集之间的重叠
3.8.2 使用验证错误率作为泛化错误率
*3.9 模型比较
3.9.1 估计准确率的置信区间
3.9.2 比较两个模型的性能
文献注释
参考文献
习题
第4章 分类:其他技术
第5章 关联分析:基本概念和算法
第6章 关联分析:高级概念
第7章 聚类分析:基本概念和算法
第8章 聚类分析:其他问题与算法
第9章 异常检测
第10章 避免错误发现
索引
内容推荐
本书所涵盖的主题包括:数据、分类、关联分析、聚类分析、异常检测和避免错误发现。通过介绍每个主题的基本概念和算法,为读者提供将数据挖掘应用于实际问题所需的必要背景。其中,分类、关联分析和聚类分析各自组织成两章的内容,一章讲述基本概念、代表性算法和评估技术,另一章深入讨论高级概念和算法。
本书适用于数据挖掘专业高年级本科生和研究生教学,也可供相关技术人员参考。
标签
缩略图
书名 数据挖掘导论(原书第2版)/计算机科学丛书
副书名
原作名
作者 (美)陈封能//迈克尔·斯坦巴赫//阿努吉·卡帕坦//维平·库玛尔
译者 译者:段磊//张天庆
编者
绘者
出版社 机械工业出版社
商品编码(ISBN) 9787111631620
开本 16开
页数 480
版次 1
装订 平装
字数
出版时间 2019-08-01
首版时间 2019-08-01
印刷时间 2019-08-01
正文语种
读者对象 本科及以上
适用范围
发行范围 公开发行
发行模式 实体书
首发网站
连载网址
图书大类
图书小类
重量 852
CIP核字 2019136744
中图分类号 TP274
丛书名
印张 30.75
印次 1
出版地 北京
259
185
23
整理
媒质
用纸
是否注音
影印版本
出版商国别 CN
是否套装
著作权合同登记号
版权提供者
定价
印数
出品方
作品荣誉
主角
配角
其他角色
一句话简介
立意
作品视角
所属系列
文章进度
内容简介
作者简介
目录
文摘
安全警示 适度休息有益身心健康,请勿长期沉迷于阅读小说。
随便看

 

兰台网图书档案馆全面收录古今中外各种图书,详细介绍图书的基本信息及目录、摘要等图书资料。

 

Copyright © 2004-2025 xlantai.com All Rights Reserved
更新时间:2025/5/10 14:47:16