王家钺编著的《通过句法位置提取中文关键词的实验研究》是基于我的博士学位论文Chinese Keyword Extraction byTerm Positions改写而成。
本书详尽描述了自然语言处理尤其是信息检索的各种主要方法,并对信息检索领域“相关性”这一核心概念做了非常充分的回顾与文献综述(这部分内容单独发表在《现代外语》2001年第2期上),在此基础上提出了基于句法位置提取关键词的初步设想。
图书 | 通过句法位置提取中文关键词的实验研究/独秀外国语言文学博士文库 |
内容 | 编辑推荐 王家钺编著的《通过句法位置提取中文关键词的实验研究》是基于我的博士学位论文Chinese Keyword Extraction byTerm Positions改写而成。 本书详尽描述了自然语言处理尤其是信息检索的各种主要方法,并对信息检索领域“相关性”这一核心概念做了非常充分的回顾与文献综述(这部分内容单独发表在《现代外语》2001年第2期上),在此基础上提出了基于句法位置提取关键词的初步设想。 内容推荐 《通过句法位置提取中文关键词的实验研究》由王家钺编著。 《通过句法位置提取中文关键词的实验研究》详尽描述了自然语言处理尤其是信息检索的各种主要方法,并对信息检索领域“相关性”这一核心概念进行了回顾与综述,在此基础上提出了基于句法位置提取关键词的初步设想,通过小型问卷调查证明了基本名物性短语的重要性。在实验部分,作者以从某技术型网站搜集的小型文本库为实验对象,首先证明了不同文本位置以及不同句法层级上产生关键词的可能性有显著差异。随后使用向量空间模型(VSM)提取其关键词,然后对文本库中的基本名物性短语的句法位置进行手工标注,通过这些位置提取关键词,再将二者进行对比。实验表明,通过句法位置提取的关键词与通过VSM提取的关键词没有显著差异。最后作者对这些实验结果进行了讨论。 目录 Chapter 1 Introduction 1.2 Discussions on KE methods Chapter 2 Information retrieval: the ultimate goal 2.1 Introduction 2.2 Theories and practices 2.3 Traditional methods 2.3.1 Free text string searching 2.3.2 Indexing 2.4 Advanced strategies 2.4.1 The Vector Space Model 2.4.2 Probabilistic approaches 2.4.3 Document classification and clustering 2.5 Linguistic approaches to IR 2.5.1 Problems with statistical methods 2.5.2 Non-statistical methods 2.7 Nominal phrases 2.7.1 Significance 2.7.2 Phrase detection and extraction 2.7.3 Base NPs 2.8 Summary Chapter 3 Web search and relevance: trigger and rationale 3.1 Web search: a good landing for IR discussions 3.2 The "hypertext challenge"? 3.3 Search engines: performance and problems 3.4 IR and relevance 3.5 Relevance studies 3.5.1 Anatomy of the concept 3.5.2 Relevance assessment variation 3.5.3 System-oriented relevance , 3.5.4 User-oriented relevance 3.5.5 System-oriented definitions of relevance 3.6 Discussion and re-definition Chapter 4 Keyword extraction: methodology and practices 4.1 KE: a good aid for IR 4.2 What is "topic"? 4.3 KE review 4.3.1 Text segmentation and topic extraction 4.3.2 Basic methods 4.3.3 Studies and practice in keyword extraction 4.3.4 Comments 4.3.5 Implications for IE 4.4 The hypothesis Chapter 5 Experiments 5.1 Design 5.2 Experiment A: testing the hypothesis 5.2.1 The tagging scheme 5.2.2 Corpus material 5.2.3 Tagging 5.2.4 Manual keywords 5.2.5 Outcome and analysis 5.2.6 Validity of data and residual issues 5.3 Subsequent experiments : testing the effect 5.3.1 Automatically extracted keywords 5.3.2 Outcome of the four keyword extraction methods 5.4 Discussions 5.5 Summary Chapter 6 Conclusions and further research 6.1 Summary of the study 6.2 Further research Bibliography Appendices |
标签 | |
缩略图 | ![]() |
书名 | 通过句法位置提取中文关键词的实验研究/独秀外国语言文学博士文库 |
副书名 | |
原作名 | |
作者 | 王家钺 |
译者 | |
编者 | |
绘者 | |
出版社 | 苏州大学出版社 |
商品编码(ISBN) | 9787811378214 |
开本 | 32开 |
页数 | 149 |
版次 | 1 |
装订 | 平装 |
字数 | 180 |
出版时间 | 2011-10-01 |
首版时间 | 2011-10-01 |
印刷时间 | 2011-10-01 |
正文语种 | 汉 |
读者对象 | 普通青少年,普通成人 |
适用范围 | |
发行范围 | 公开发行 |
发行模式 | 实体书 |
首发网站 | |
连载网址 | |
图书大类 | 计算机-操作系统 |
图书小类 | |
重量 | 0.204 |
CIP核字 | |
中图分类号 | TP391 |
丛书名 | |
印张 | 5.125 |
印次 | 1 |
出版地 | 江苏 |
长 | 210 |
宽 | 148 |
高 | 8 |
整理 | |
媒质 | 图书 |
用纸 | 普通纸 |
是否注音 | 否 |
影印版本 | 原版 |
出版商国别 | CN |
是否套装 | 单册 |
著作权合同登记号 | |
版权提供者 | |
定价 | |
印数 | |
出品方 | |
作品荣誉 | |
主角 | |
配角 | |
其他角色 | |
一句话简介 | |
立意 | |
作品视角 | |
所属系列 | |
文章进度 | |
内容简介 | |
作者简介 | |
目录 | |
文摘 | |
安全警示 | 适度休息有益身心健康,请勿长期沉迷于阅读小说。 |
随便看 |
|
兰台网图书档案馆全面收录古今中外各种图书,详细介绍图书的基本信息及目录、摘要等图书资料。