本书旨在阐述web数据挖掘的概念及其核心算法,使读者获得相对完整的关于web数据挖掘的算法和技术知识。本书不仅介绍了搜索、页面爬取和资源探索以及链接分析等传统的Web挖掘主题,而且还介绍了结构化数据的抽取、信息整合、观点挖掘和Web使用挖掘等内容,这些内容在已有书籍中没有提及过,但它们在Web数据挖掘中却占有非常重要的地位。全书分为两大部分:第一部分包括第2章到第5章,介绍数据挖掘的基础;第二部分包括第6章到第12章,介绍Web相关的挖掘任务。
图书 | Web数据挖掘/世界著名计算机教材精选 |
内容 | 编辑推荐 本书旨在阐述web数据挖掘的概念及其核心算法,使读者获得相对完整的关于web数据挖掘的算法和技术知识。本书不仅介绍了搜索、页面爬取和资源探索以及链接分析等传统的Web挖掘主题,而且还介绍了结构化数据的抽取、信息整合、观点挖掘和Web使用挖掘等内容,这些内容在已有书籍中没有提及过,但它们在Web数据挖掘中却占有非常重要的地位。全书分为两大部分:第一部分包括第2章到第5章,介绍数据挖掘的基础;第二部分包括第6章到第12章,介绍Web相关的挖掘任务。 内容推荐 过去几十年里,Web的迅速发展使其成为世界上规模最大的公共数据源。Web挖掘的目标是从Web超链接、网页内容和使用日志中探寻有用的信息。 本书旨在阐述web数据挖掘的概念及其核心算法,使读者获得相对完整的关于web数据挖掘的算法和技术知识。本书不仅介绍了搜索、页面爬取和资源探索以及链接分析等传统的Web挖掘主题,而且还介绍了结构化数据的抽取、信息整合、观点挖掘和Web使用挖掘等内容,这些内容在已有书籍中没有提及过,但它们在Web数据挖掘中却占有非常重要的地位。全书分为两大部分:第一部分包括第2章到第5章,介绍数据挖掘的基础;第二部分包括第6章到第12章,介绍Web相关的挖掘任务。 本书不仅可作为本科生的教科书,也是在Web数据挖掘和相关领域研读博士学位的研究生的重要参考用书,同时对Web挖掘研究人员和实践人员获取知识、信息,甚至是创新想法也很有帮助。 目录 第一部分 数据挖掘基础 第1章 概述 1.1 什么是万维网 1.2 万维网和互联网的历史简述 1.3 Web数据挖掘 1.3.1 什么是数据挖掘 1.3.2 什么是Web数据挖掘 1.4 各章概要 1.5 如何阅读本书 文献评注 第2章 关联规则和序列模式 2.1 关联规则的基本概念 2.2 Apriori算法 2.2.1 频繁项目集生成 2.2.2 关联规则生成 2.3 关联规则挖掘的数据格式 2.4 多最小支持度的关联规则挖掘 2.4.1 扩展模型 2.4.2 挖掘算法 2.4.3 规则生成 2.5 分类关联规则挖掘 2.5.1 问题描述 2.5.2 挖掘算法 2.5.3 多最小支持度分类关联规则挖掘 2.6 序列模式的基本概念 2.7 基于GSP挖掘序列模式 2.7.1 GSP算法 2.7.2 多最小支持度挖掘 2.8 基于PrefixSpan算法的序列模式挖掘 2.8.1 PrefixSpan算法 2.8.2 多最小支持度挖掘 2.9 从序列模式中产生规则 2.9.1 序列规则 2.9.2 标签序列规则 2.9.3 分类序列规则 文献评注 第3章 监督学习 3.1 基本概念 3.2 决策树推理 3.2.1 学习算法 3.2.2 混杂度函数 3.2.3 处理连续属性 3.2.4 其他一些问题 3.3 评估分类器 3.3.1 评估方法 3.3.2 查准率、查全率、F-score和平衡点(Brcakeven Point) 3.4 规则推理 3.4.1 序列化覆盖 3.4.2 规则学习:Learn-One-Rule函数 3.4.3 讨论 3.5 基于关联规则的分类 3.5.1 使用类关联规则进行分类 3.5.2 使用类关联规则作为分类属性 3.5.3 使用古典的关联规则分类 3.6 朴素贝叶斯分类 3.7 朴素贝叶斯文本分类 3.7.1 概率框架 3.7.2 朴素贝叶斯模型 3.7.3 讨论 3.8 支持向量机 3.8.1 线性支持向量机:可分的情况 3.8.2 线性支持向量机:数据不可分的情况 3.8.3 非线性支持向量机:核方法 3.9 k-近邻学习 3.10 分类器的集成 …… 第4章 无监督学习 第5章 部分监督学习 第二部分 Web挖掘 第6章 信息检索与Web搜索 第7章 链接分析 第8章 Web爬取 第9章 结构化数据抽取:包装器生成 第10章 信息集成 第11章 观点挖掘 第12章 Web使用挖掘 参考文献 |
标签 | |
缩略图 | ![]() |
书名 | Web数据挖掘/世界著名计算机教材精选 |
副书名 | |
原作名 | |
作者 | (美)刘兵 |
译者 | 俞勇//薛贵荣//韩定一 |
编者 | |
绘者 | |
出版社 | 清华大学出版社 |
商品编码(ISBN) | 9787302193388 |
开本 | 16开 |
页数 | 375 |
版次 | 1 |
装订 | 平装 |
字数 | 594 |
出版时间 | 2009-04-01 |
首版时间 | 2009-04-01 |
印刷时间 | 2009-04-01 |
正文语种 | 汉 |
读者对象 | 青年(14-20岁),研究人员,普通成人 |
适用范围 | |
发行范围 | 公开发行 |
发行模式 | 实体书 |
首发网站 | |
连载网址 | |
图书大类 | |
图书小类 | |
重量 | 0.588 |
CIP核字 | |
中图分类号 | TP311.13 |
丛书名 | |
印张 | 24.5 |
印次 | 1 |
出版地 | 北京 |
长 | 260 |
宽 | 186 |
高 | 15 |
整理 | |
媒质 | 图书 |
用纸 | 普通纸 |
是否注音 | 否 |
影印版本 | 原版 |
出版商国别 | CN |
是否套装 | 单册 |
著作权合同登记号 | 图字01-2008-0564号 |
版权提供者 | Springer Verlag |
定价 | |
印数 | 3000 |
出品方 | |
作品荣誉 | |
主角 | |
配角 | |
其他角色 | |
一句话简介 | |
立意 | |
作品视角 | |
所属系列 | |
文章进度 | |
内容简介 | |
作者简介 | |
目录 | |
文摘 | |
安全警示 | 适度休息有益身心健康,请勿长期沉迷于阅读小说。 |
随便看 |
|
兰台网图书档案馆全面收录古今中外各种图书,详细介绍图书的基本信息及目录、摘要等图书资料。