首页  软件  游戏  图书  电影  电视剧

请输入您要查询的图书:

 

图书 数据挖掘核心技术揭秘/数据分析与决策技术丛书
内容
编辑推荐

贾双成、王奇编著的这本《数据挖掘核心技术揭秘》是阿里巴巴技术专家多年经验结晶,通过实际数据挖掘项目经验,深入浅出阐明数据挖掘的本质;以案例驱动为导向,结合理论分析,内容涵盖数据挖掘领域的所有关键技术,包括基础知识、聚类、分类、回归与应用。

内容推荐

阿里巴巴高级工程师多年经验结晶,通过实际数据挖掘项目经验,深入浅出阐明数据挖掘的本质。贾双成、王奇编著的这本《数据挖掘核心技术揭秘》以案例驱动为导向,结合理论分析,内容涵盖数据挖掘领域的所有关键技术,包括基础知识、聚类、分类、回归与应用。

本书包括五部分内容。第一部分(第1~3章)涉及数据挖掘技术的基础知识,介绍数据挖掘的定义、数据挖掘工具及应用领域,数据挖掘的数学基础内容,以及海量数据挖掘处理技术。第二部分(第4~5章)分别从聚类技术和离群点挖掘技术阐述聚类在语音区分、新闻分组、销售策略制定、交通事故预测、欺诈检测、入侵检测、异常气候检测等方面的应用。第三部分(第6~11章)分别从决策树、基于实例的学习、支持向量机、贝叶斯学习、人工神经网络、遗传算法在病情诊断、信用卡欺诈、机械装备设计、法律案件审理、动物分类、垃圾邮件过滤、手写文字识别、股票价格预测、人脸识别、音乐生成等方面阐述分类的应用。第四部分(第12章)阐述回归数据挖掘技术的应用,涉及卡尔曼算法在股票价格预测、GPS定位方面的应用。第五部分(第13章)介绍推荐系统这个最典型的数据挖掘应用。附录总结本书内容,阐述数据挖掘技术的数学本质。

目录

前言

第一部分 基础知识

第1章 引言

 1.1 数据挖掘的含义

 1.2 数据挖掘的演变过程

 1.3 数据工具简介

1.3.1 Hadoop与MapReduce

1.3.2 Pig语言

1.3.3 MATLAB编程

1.3.4 SAS

1.3.5 WEKA

1.3.6 R语言编程

 1.4 数据挖掘应用领域

 1.5 小结

第2章 数学基础

 2.1 概率统计

2.1.1 基本概念

2.1.2 随机变量及其分布

 2.2 相似度

2.2.1 期望与方差

2.2.2 距离

2.2.3 相关系数

 2.3 矩阵计算

 2.4 最小二乘法

2.4.1 最小二乘法定义

2.4.2 回归

2.4.3 参数的最小二乘法估计

第3章 海量数据处理技术

 3.1 索引技术

3.1.1 数据库索引

3.1.2 文本索引

 3.2 海量数据处理技术

3.2.1 外排序

3.2.2 分布式处理

3.2.3 Bloom filter

3.2.4 常用技巧

第二部分 聚类

第4章 聚类

 4.1 应用场景

4.1.1 语音区分

4.1.2 新闻分组

4.1.3 选定销售策略

4.1.4 交通事件预测

 4.2 聚类技术

4.2.1 划分聚类

4.2.2 层次聚类

4.2.3 基于密度的聚类

4.2.4 基于网格的聚类

 4.3 多元分析

4.3.1 主成分分析法

4.3.2 因子分析

4.3.3 对比分析

第5章 离群点挖掘技术

 5.1 应用场景

5.1.1 异常交通事件检测

5.1.2 欺诈检测

5.1.3 入侵检测

5.1.4 异常气候检测

 5.2 离群点挖掘技术

5.2.1 基于统计的离群点挖掘技术

5.2.2 基于邻近度的离群点挖掘技术

5.2.3 基于密度的离群点挖掘技术

5.2.4 基于聚类的离群点挖掘技术

5.2.5 高维数据的离群点检测算法

第三部分 分类

第6章 决策树

 6.1 应用场景

6.1.1 病情诊断

6.1.2 信用卡欺诈检测

 6.2 决策树技术

6.2.1 概述

6.2.2 技术实现

6.2.3 多分类决策树

6.2.4 参考实例

第7章 基于实例的学习

 7.1 应用场景

7.1.1 机械装备的总体设计

7.1.2 对新的法律案件的推理

7.1.3 规划或调度问题

 7.2 K近邻算法

 7.3 K-D树

7.3.1 近邻的实现:K-D树

7.3.2 K-D树的构建

7.3.3 K-D树的最近邻搜索算法

第8章 支持向量机

 8.1 应用场景

8.1.1 病情分类

8.1.2 动物分类

 8.2 支持向量机技术

8.2.1 概述

8.2.2 技术实现

8.2.3 核函数

8.2.4 多类分类器

第9章 贝叶斯学习

 9.1 应用场景

9.1.1 垃圾邮件过滤

9.1.2 手写文字识别

9.1.3 拼写检查

9.1.4 分词

9.1.5 语音识别

9.1.6 股票价格预测

9.1.7 病情诊断

9.1.8 选定销售策略

9.1.9 交通事件预测

 9.2 贝叶斯学习技术

9.2.1 概述

9.2.2 技术实现

9.2.3 参考实例

第10章 人工神经网络

 10.1 应用场景

10.1.1 信用卡欺诈检测

10.1.2 病情诊断

10.1.3 足球比赛预测

10.1.4 图像姿势识别

10.1.5 利用图像识别的自动驾驶

10.1.6 人脸识别

10.1.7 语音分类识别

 10.2 人工神经网络技术

10.2.1 概述

10.2.2 技术实现

10.2.3 参考实例

第11章 遗传算法

 11.1 应用场景

11.1.1 私人定制的电影

11.1.2 国际象棋学习

11.1.3 电路设计

11.1.4 机器人的模拟控制

11.1.5 函数设计

11.1.6 唐诗生成器

11.1.7 音乐生成器

 11.2 遗传技术

11.2.1 概述

11.2.2 技术实现

11.2.3 参考实例:背包问题

第四部分 回归

第12章 卡尔曼算法

 12.1 应用场景

12.1.1 股票价格预测

12.1.2 GPS定位预测

 12.2 卡尔曼技术

12.2.1 卡尔曼算法定义

12.2.2 技术实现

12.2.3 参考实例:GPS定位

第五部分 应用

第13章 推荐系统

 13.1 应用场景

13.1.1 歌曲推荐

13.1.2 QQ好友圈子的推荐功能

13.1.3 今日头条

13.1.4 淘宝商品推荐

13.1.5 Netflix电影推荐

13.1.6 豆瓣FM的推荐

13.1.7 为用户定制的广告

13.1.8 苹果APP排名的规则

 13.2 推荐系统技术

13.2.1 协同过滤

13.2.2 基于内容的推荐

13.2.3 推荐系统的缺陷

13.2.4 潜在因子算法

13.2.5 参考实例:音乐推荐

附录A 数据挖掘技术总结

标签
缩略图
书名 数据挖掘核心技术揭秘/数据分析与决策技术丛书
副书名
原作名
作者 贾双成//王奇
译者
编者
绘者
出版社 机械工业出版社
商品编码(ISBN) 9787111519249
开本 16开
页数 201
版次 1
装订 平装
字数
出版时间 2016-01-01
首版时间 2016-01-01
印刷时间 2016-01-01
正文语种
读者对象 普通大众
适用范围
发行范围 公开发行
发行模式 实体书
首发网站
连载网址
图书大类
图书小类
重量 0.374
CIP核字 2015253926
中图分类号 TP274
丛书名
印张 13.5
印次 1
出版地 北京
240
187
10
整理
媒质 图书
用纸 普通纸
是否注音
影印版本 原版
出版商国别 CN
是否套装 单册
著作权合同登记号
版权提供者
定价
印数
出品方
作品荣誉
主角
配角
其他角色
一句话简介
立意
作品视角
所属系列
文章进度
内容简介
作者简介
目录
文摘
安全警示 适度休息有益身心健康,请勿长期沉迷于阅读小说。
随便看

 

兰台网图书档案馆全面收录古今中外各种图书,详细介绍图书的基本信息及目录、摘要等图书资料。

 

Copyright © 2004-2025 xlantai.com All Rights Reserved
更新时间:2025/6/26 18:18:24