首页  软件  游戏  图书  电影  电视剧

请输入您要查询的图书:

 

图书 基于注疏文献的孟子信息处理研究
内容
内容推荐
本书为作者主持的国家社会科学基金项目“基于注疏文献的先秦汉语语料信息处理研究”(项目批准号:15BYY096)阶段性成果。
本书主要以《孟子》及《孟子注疏》《孟子集注》《孟子正义》等《孟子》相关注疏文献为资源,对比《论语》《左传》等先秦文献的研究,对《孟子》进行了较深层次的加工和处理,尝试探索出一条基于注疏文献的《孟子》自动分词、词性标注等信息处理的新方法、新思路,研究了《孟子》及其注疏文献的句子对齐和词语对齐,《孟子》的自动分词、词性标注、词义消歧,《孟子》及其注疏的文本特征和语言风格统计,《孟子》中的排比句自动识别等问题。
目录
引言
一、《孟子》及其注疏信息处理研究现状
(一)传统的《孟子》及其注疏的研究
(二)句子对齐技术研究
(三)自动分词研究
(四)词性标注研究
(五)词义消歧研究
(六)风格计算研究
(七)修辞格的识别
(八)余论
二、研究思路和研究内容
(一)研究思路
(二)研究内容
三、本书的结构安排
第一章 注疏对齐
一、注疏结构和注疏文献的作用
(一)注疏结构
(二)注疏文献的作用
二、注疏文献的平行对齐
(一)原文与引文句子对齐
(二)原文与引文注释对齐
三、本章小结
第二章 自动分词
一、先秦汉语分词规范
二、基于规则的自动分词方法
(一)最大匹配法简介
(二)词表介绍
(三)实验结果
三、基于统计模型的自动分词方法
(一)条件随机场模型
(二)CRFs分词原理
(三)基于CRFs的分词实验
四、利用注疏文献的自动分词方法
(一)利用注疏文献自动分词方法概述
(二)利用注疏文献自动分词实验
五、本章小结
第三章 词性标注
一、词性标记集的构建
(一)名词作状语
(二)其他词类活用作动词
(三)使动用法
(四)意动用法
(五)为动用法
二、基于条件随机场模型的词性标注
(一)CRFs自动词性标注原理
(二)基于CRFs的词性标注实验
(三)标注错误分析
三、利用注疏信息自动校正词性
(一)注疏文献中的词性提示信息
(二)利用去声信息的词性自动校正方法
(三)实验和分析
四、本章小结
第四章 词义消歧
一、词义消歧的概念和难点
(一)词义消歧的概念
(二)词义消歧的难点
二、词义消歧树算法消歧
(一)义项的划分
(二)上下文的有效范围
(三)消歧方法的设计
三、CRFs模型词义消歧
(一)特征的选择提取
(二)特征模板的构造
四、实验结果与分析
(一)实验的语料
(二)实验环境与测评指标
(三)两种消歧算法比较
五、本章小结
第五章 风格计算
一、文本特征及语言风格分析
(一)基于字的文本特征及语言风格统计
(二)基于词的文本特征及语言风格统计
(三)基于句子的文本特征及语言风格统计
二、排比句的自动识别
(一)排比句自动识别的算法设计
(二)实验及结果分析
三、本章小结
结语
一、本研究的主要工作
二、进一步的研究计划
附录
附录A:注疏文献中抽取出的去声字表
附录B:注疏文献中抽取出的反切字表
附录C:人工标注的《孟子》排比句
附录D:人工标注的《论语》排比句
参考文献
后记
标签
缩略图
书名 基于注疏文献的孟子信息处理研究
副书名
原作名
作者 梁社会
译者
编者
绘者
出版社 北京大学出版社
商品编码(ISBN) 9787301320983
开本 16开
页数 187
版次 1
装订 平装
字数 201
出版时间 2021-05-01
首版时间 2021-05-01
印刷时间 2021-05-01
正文语种
读者对象 普通大众
适用范围
发行范围 公开发行
发行模式 实体书
首发网站
连载网址
图书大类 计算机-操作系统
图书小类
重量 304
CIP核字 2021055604
中图分类号 G256.1
丛书名
印张 12.25
印次 1
出版地 北京
240
170
9
整理
媒质
用纸
是否注音
影印版本
出版商国别 CN
是否套装
著作权合同登记号
版权提供者
定价
印数
出品方
作品荣誉
主角
配角
其他角色
一句话简介
立意
作品视角
所属系列
文章进度
内容简介
作者简介
目录
文摘
安全警示 适度休息有益身心健康,请勿长期沉迷于阅读小说。
随便看

 

兰台网图书档案馆全面收录古今中外各种图书,详细介绍图书的基本信息及目录、摘要等图书资料。

 

Copyright © 2004-2025 xlantai.com All Rights Reserved
更新时间:2025/5/11 11:26:29