首页  软件  游戏  图书  电影  电视剧

请输入您要查询的图书:

 

图书 中文新闻网页处理与舆情分析/信息管理专业前沿论丛
内容
编辑推荐

《中文新闻网页处理与舆情分析/信息管理专业前沿论丛》编著者钱爱兵。

本书正是以新闻网页为例,结合新闻的专有特性,面向舆情分析,从6个方面对中文新闻网页处理过程中涉及的关键技术问题进行深入系统的研究,即新闻网页正文抽取、新闻重复网页识别、新闻网页关键词抽取、新闻网页自动分类、新闻网页主题聚合、网络舆情分析,并给出相应的解决方法。通过对网络舆情信息进行及时、全面、准确地分析与处理,最终达到随时关注社会动态,为决策者进行正确选择与科学决策提供支持的目标。

目录

第l章 绪论 

 l.l研究背景 

 l.2研究对象 

 1.3研究现状 

 1.4研究内容 

 1.5全书内容安排 

 参考文献 

第2章 中文新闻网页正文抽取 

 2.1概述 

 2.2文本密度判别法 

 2.2.1相关定义及假设 

 2.2.2 统计分析 

 z.2.3密度区分阈值 

 2.3方法实现 

 2.3.1转换HTML为DOM树

 2.3.2获取文本结点 

 2.3.3计算文本密度 

 2.3.4判别分析 

 2.4实验结果及分析 

 2.4.1实验数据 

 2.4.2评价指标 

 2.4.3实验步骤及结果 

 2.4.4结果分析 

 2.5本章 小结 

 参考文献

第3章 中文新闻重复网页识别 

 3.1概述 

 3.2算法设计 

 3.2.1重复网页的界定 

 3.2.2算法思想 

 3.2.3后缀树 

 3.2.4 u“Konen算法 

 3.2.5 Mat e:hing Statistics算法 

 3.2.6相似度计算 

 3.3算法实现 

 3.3.1改进的ukkonen算法 

 3.3.2改进的Matching Statistic:s算法 

 3.3.3中文新闻重复网页识别算法 

 3.4实验结果及分析 

 3.4.1实验说明 

 3.4.2评价标准 

 3.4.3实验结果与分析 

 3.5本章 小结 

 参考文献 

第4章 中文新闻网页关键词抽取 

 4.1概述 

 4.2网页内容及关键词构成分析 

 4.2.1网页内容分析 

 4.2.2关键词特征分析 

 4.3关键词抽取 

 4.3.1网页正文抽取 

 4.3.2新闻文本分词 

 4.3.3综合加权 

 4.3.4候选关键词组配 

 4.4实验结果与分析 

 4.4.1实验数据 

 4.4.2评价标准 

 4.4.3实验结果与分析 

 4.5本章 小结 

 参考文献 

第5章 中文新闻网页自动分类 

 5.1概述 

 5.2新闻网页预处理 

 5 2.1创建新闻分类标注语料库 

 5.2.2抽取新闻网页正文 

 5.2.3正文文本分词及创建索引 

 5.3基于标题的自动分类方法 

 s.3.1词长加权法 

 5.3.2简单类目加权法 

 5.3.3经典类目加权法 

 5.3.4改进的类目加权法 

 5.4实验结果与分析 

 5.4.1性能评价指标 

 5.4.2实验结果 

 5.4.3结果分析 

 5.5本章 小结 

 参考文献 

第6章 中文新闻网页主题聚合 

 6.1概述 

 6.2模型设计 

 6.2.1系统模型 

 6.2.2系统流程 

 6.3系统关键技术 

 6.3.1主题选择模块 

 6.3.2 RSs Feed初始集合选择模块 

 6.3.3 RSS聚合模块 

 6.3.4 RSS Feed分析模块 

 6.3.5 RSShem分析过滤模块 

 6.3.6超链接自动提取模块 

 6.3.7 RSSFeed自动发现模块 

 6.4系统的实现 

 6.4.1测试硬件配置 

 6.4.2测试集的选择 

 6.4.3系统测试 

 6.5本章 小结 

 参考文献 

第7章 基于主题的网络舆情分析 

 7.1概述 

 7.2模型设计 

 7.3基于主题的网络舆情分析 

 7.3.1舆情主题规划 

 7.3.2舆情信息采集 

 7.3.3舆情信息分析 

 7.3.4舆情预警处理 

 7.4模型实现 

 7.4.1实现环境 

 7.4.2技术支撑 

 7.4.3实现流程 

 7.4.4测试集的选择 

 7.4.5测试结果分析 

 7.5本章小结 

 参考文献 

第8章 结束语 

 8.1总结 

 8.2进一步的研究工作

附录A 关键词抽取对照数据表 

附录B 新闻语料库来源网站 

附录C 江苏法院网络舆情分析系统

后记

标签
缩略图
书名 中文新闻网页处理与舆情分析/信息管理专业前沿论丛
副书名
原作名
作者 钱爱兵
译者
编者
绘者
出版社 南京大学出版社
商品编码(ISBN) 9787305110467
开本 16开
页数 152
版次 1
装订 平装
字数 183
出版时间 2012-12-01
首版时间 2012-12-01
印刷时间 2012-12-01
正文语种
读者对象 青年(14-20岁),普通成人
适用范围
发行范围 公开发行
发行模式 实体书
首发网站
连载网址
图书大类 计算机-操作系统
图书小类
重量 0.216
CIP核字
中图分类号 G210.7
丛书名
印张 10.25
印次 1
出版地 江苏
231
171
9
整理
媒质 图书
用纸 普通纸
是否注音
影印版本 原版
出版商国别 CN
是否套装 单册
著作权合同登记号
版权提供者
定价
印数
出品方
作品荣誉
主角
配角
其他角色
一句话简介
立意
作品视角
所属系列
文章进度
内容简介
作者简介
目录
文摘
安全警示 适度休息有益身心健康,请勿长期沉迷于阅读小说。
随便看

 

兰台网图书档案馆全面收录古今中外各种图书,详细介绍图书的基本信息及目录、摘要等图书资料。

 

Copyright © 2004-2025 xlantai.com All Rights Reserved
更新时间:2025/5/13 4:50:24