首页  软件  游戏  图书  电影  电视剧

请输入您要查询的图书:

 

图书 文本挖掘原理
内容
编辑推荐

大量文档集内容的预处理包括特征抽取、文本分类、文本聚类等。文本分类和文本聚类研究的成果比较多,本书只作简单介绍;而对特征生成、特征选择和特征抽取,本书进行深入地讨论。

信息抽取是文本挖掘的核心操作,目前的主要研究方向是命名实体识别、实体关系抽取和事件抽取。实体关系抽取是文本挖掘的关键任务,所以本书用大量篇幅讨论了实体关系发现技术。

由于文本挖掘强调用户交互到知识发现过程的集成性,因此,本书最后讨论了文本挖掘结果可视化方法,并介绍了一种文本挖掘语言——DIAL。

内容推荐

在信息时代,存储大量数据比较容易。通过Web、企业内部网、电传新。闻获得的文本数量在急剧增加,这导致信息过载。然而,数据量虽然增加了,但可用的信息却在减少。文本挖掘是一个新的令人振奋的研究领域,其试图通过综合数据挖掘、机器学习、自然语言处理、信息检索和知识管理等技术来解决信息过载问题。

文本挖掘包括文本集合的预处理(文本分类、信息抽取)、中间结果存储、中间结果分析技术(分布分析、聚类、趋势分析、关联规则抽取)和最终结果的可视化。它与关联分析类似,为人们提供了分析海量文本数据的新工具,并且通过学习模式来指导抽取实体关系。

本书首先讨论了文本挖掘的总体结构以及文本挖掘预处理算法,然后深入地研究了文本挖掘核心操作,最后探讨真实世界中文本挖掘的主要应用和DIAL,弥补了理论和实践的脱节。

本书主要可供对文本挖掘感兴趣的本科高年级学生、研究生、研究人员和专业开发人员参考,对从事文本挖掘开发和使用文本挖掘系统的人也会有很大帮助。

目录

前言

第1章 文本挖掘概述

 1.1 文本挖掘的产生背景

 1.2 文本

1.2.1 文本格式

1.2.2 动态文本集

 1.3 文本挖掘的概念

 1.4 文本挖掘的任务

1.4.1 文本挖掘预处理

1.4.2 文本模式挖掘

1.4.3 挖掘结果可视化

 1.5 文本挖掘系统的通用体系结构

第2章 文本表示

第3章 文本挖掘预处理——文本分类

第4章 文本挖掘预处理——文本聚类

第5章 文本挖掘核心操作——信息抽取

第6章 文本挖掘核心操作——关系抽取

第7章 文本挖掘核心操作——关联分析

第8章 文本挖掘结果的可视化

第9章 文本挖掘的应用

第10章 专门用于文本挖掘的信息抽取语言——DIAL

参考文献

标签
缩略图
书名 文本挖掘原理
副书名
原作名
作者 程显毅//朱倩
译者
编者
绘者
出版社 科学出版社
商品编码(ISBN) 9787030293060
开本 16开
页数 216
版次 1
装订 平装
字数 273
出版时间 2010-11-01
首版时间 2010-11-01
印刷时间 2010-11-01
正文语种
读者对象 研究人员,普通成人
适用范围
发行范围 公开发行
发行模式 实体书
首发网站
连载网址
图书大类
图书小类
重量 0.338
CIP核字
中图分类号 TP274
丛书名
印张 14.25
印次 1
出版地 北京
239
170
11
整理
媒质 图书
用纸 普通纸
是否注音
影印版本 原版
出版商国别 CN
是否套装 单册
著作权合同登记号
版权提供者
定价
印数 3000
出品方
作品荣誉
主角
配角
其他角色
一句话简介
立意
作品视角
所属系列
文章进度
内容简介
作者简介
目录
文摘
安全警示 适度休息有益身心健康,请勿长期沉迷于阅读小说。
随便看

 

兰台网图书档案馆全面收录古今中外各种图书,详细介绍图书的基本信息及目录、摘要等图书资料。

 

Copyright © 2004-2025 xlantai.com All Rights Reserved
更新时间:2025/5/5 23:19:25