首页  软件  游戏  图书  电影  电视剧

请输入您要查询的图书:

 

图书 文本挖掘中若干关键问题研究/博士论丛
内容
编辑推荐

自动文本分类是将自然文本文件根据内容自动分为预先定义的一个或几个类别的过程,基于统计学习、机器学习的文本分类技术已经成为主流技术,本书对基于统计学习的文本分类及其相关技术进行了研究,为解决文本分类的稀疏性和高维性问题,基于偏最小二乘理论,提出一种新的维数约简算法,从提高文本分类性能和准确性出发,运用偏最小二乘的最新理论成果,提出了一种能较好提取潜在语义的新文本分类模型,对于数量庞大的文档类别,传统的平坦文本分类的性能受到很大的制约,层次文本分类是一种有效的解决方法,由此提出了一种新的层次文本分类模型。

内容推荐

本书介绍了文本分类和偏最小二乘回归,提出了基于变量投影重要性指标的文本分类特征选择方法,论述了偏最小二乘Logistic文本分类模型,阐述了CHTC层次文本分类模型的研究工作,本书可供相关领域科研工作者、大学高年级学生和研究生阅读。

目录

前言

第1章 导论

 1.1 研究背景

 1.2 文本分类综述

 1.3 本书的内容结构

 1.4 本书的创新工作

第2章 文本分类概述

 2.1 文本分类的数学定义

 2.2 文本分类任务的特点

 2.3 文本分类系统的组成

 2.4 文档预处理

 2.5 文档的表示

 2.6 常用文本分类模型

 2.7 文本分类器学习、测试和评价

第3章 偏最小二乘回归方法的基本理论

 3.1 偏最小二乘回归的发展历史

 3.2 偏最小二乘回归的基本原理

 3.3 偏最小二乘回归的基本思想

 3.4 数学原理

 3.5 偏最小二乘回归的理论算法

 3.6 成分数的确定

第4章 基于变量投影重要性指标的特征选择方法研究

 4.1 维数约简技术

 4.2 符号约定

 4.3 常用的特征选择方法

 4.4 常用的特征抽取方法

 4.5 基于变量投影重要性指标的特征选择方法

 4.6 实验结果和分析

第5章 偏最小二乘Logistic文本分类模型研究

 5.1 Logistic回归模型

 5.2 偏最小二乘Logistic回归模型

 5.3 偏最小二乘Logistic文本分类模型

 5.4 实验结果和分析

第6章 GHTC层次文本分类模型研究

 6.1 层次分类概述

 6.2 层次特征选择

 6.3 GHTC层次文本分类模型

 6.4 实验结果和分析

第7章 总结与展望

 7.1 总结

 7.2 研究展望

附录1 REUTERS-21578前10个常见类和前10个稀有类的前20个特征VIP值

附录2 复旦文本分类语料库部分类别的前20个特征VIP值

附录3 OHSUMED语料库层次结构

附录4 20 Newsgroups语料库各节点各特征维数的微平均F1值和宏平均F1值变化情况

参考文献

后记

标签
缩略图
书名 文本挖掘中若干关键问题研究/博士论丛
副书名
原作名
作者 陆旭
译者
编者
绘者
出版社 中国科学技术大学出版社
商品编码(ISBN) 9787312022807
开本 16开
页数 117
版次 1
装订 平装
字数 163
出版时间 2008-12-01
首版时间 2008-12-01
印刷时间 2008-12-01
正文语种
读者对象 青年(14-20岁),研究人员,普通成人
适用范围
发行范围 公开发行
发行模式 实体书
首发网站
连载网址
图书大类
图书小类
重量 0.198
CIP核字
中图分类号 TP274
丛书名
印张 8
印次 1
出版地 安徽
241
171
6
整理
媒质 图书
用纸 普通纸
是否注音
影印版本 原版
出版商国别 CN
是否套装 单册
著作权合同登记号
版权提供者
定价
印数
出品方
作品荣誉
主角
配角
其他角色
一句话简介
立意
作品视角
所属系列
文章进度
内容简介
作者简介
目录
文摘
安全警示 适度休息有益身心健康,请勿长期沉迷于阅读小说。
随便看

 

兰台网图书档案馆全面收录古今中外各种图书,详细介绍图书的基本信息及目录、摘要等图书资料。

 

Copyright © 2004-2025 xlantai.com All Rights Reserved
更新时间:2025/5/19 6:30:11