是时候创建属于你自己的用于机器学习的自然语言训练语料库了。无论你使用英语、汉语或者其他任何一种自然语言,普斯特若夫斯基、斯塔布斯著的《自然语言标注--用于机器学习(影印版)》都可以手把手地指导你一种经验证的标注开发周期一一把元语添加到你的训练语料库中来帮助机器学习算法更有效工作的过程。你无需任何编程或者语言学方面的经验就可以上手。
图书 | 自然语言标注--用于机器学习(影印版) |
内容 | 编辑推荐 是时候创建属于你自己的用于机器学习的自然语言训练语料库了。无论你使用英语、汉语或者其他任何一种自然语言,普斯特若夫斯基、斯塔布斯著的《自然语言标注--用于机器学习(影印版)》都可以手把手地指导你一种经验证的标注开发周期一一把元语添加到你的训练语料库中来帮助机器学习算法更有效工作的过程。你无需任何编程或者语言学方面的经验就可以上手。 内容推荐 是时候创建属于你自己的用于机器学习的自然语言训练语料库了。无论你使用英语、汉语或者其他任何一种自然语言,《自然语言标注--用于机器学习(影印版)》都可以手把手地指导你一种经验证的标注开发周期一一把元语添加到你的训练语料库中来帮助机器学习算法更有效工作的过程。你无需任何编程或者语言学方面的经验就可以上手。 普斯特若夫斯基、斯塔布斯著的《自然语言标注--用于机器学习(影印版)》通过每一步中的详细示例,你将学到“标注开发过程”是如何帮助你建模、标注、训练、测试、评估和修正你的训练语料库。你也将了解到一个实际标注项目的完整演示。 本书内容: 在收集你的数据集(语料库)之前定义一个清晰的标注目标 学习用于分析你的语料库中语言内容的工具搭建用于你的标注项目的模型和规范 检查从基本的XML到语言标记框架这样一些不同的标注格式 创建适合于训练和测试机器学习算法的黄金标准语料库 选择用来处理你的标注数据的机器学习算法 评估测试结果并修正你的标注任务 学习如何使用用于标注文本和调整标注的轻量级软件 目录 Preface 1.The Basics The Importance of Language Annotation The Layers of Linguistic Description What Is Natural Language Processing? A Brief History of Corpus Linguistics What Is a Corpus? Early Use of Corpora Corpora Today Kinds of Annotation Language Data and Machine Learning Classification Clustering Structured Pattern Induction The Annotation Development Cycle Model the Phenomenon Annotate with the Specification Train and Test the Algorithms over the Corpus Evaluate the ResuIts Revise the Model and Algorithms Summary 2.DefiningYourGoal andDataset 3.Corpus Analytics 4.Building Your Model and Specification 5.Applying and Adopting Annotation Standards 6.Annotation and Adjudication 7.Training:Machine Learning 8.Testing and Evaluation 9.Revising and Reporting 10.Annotation:TimeML 11.Automatic Annotation:Generatinq 11meM L 12.Afterword:The Future ofAnnotation A.List of Available Corpora and Specifications B.ListofSoftwareResources C.MAEUserGuide D.MAIUserGuide E.Bibliography Index |
标签 | |
缩略图 | ![]() |
书名 | 自然语言标注--用于机器学习(影印版) |
副书名 | |
原作名 | |
作者 | (美)普斯特若夫斯基//斯塔布斯 |
译者 | |
编者 | |
绘者 | |
出版社 | 东南大学出版社 |
商品编码(ISBN) | 9787564142810 |
开本 | 16开 |
页数 | 324 |
版次 | 1 |
装订 | 平装 |
字数 | 421 |
出版时间 | 2013-06-01 |
首版时间 | 2013-06-01 |
印刷时间 | 2013-06-01 |
正文语种 | 英 |
读者对象 | 青年(14-20岁),普通成人 |
适用范围 | |
发行范围 | 公开发行 |
发行模式 | 实体书 |
首发网站 | |
连载网址 | |
图书大类 | 计算机-操作系统 |
图书小类 | |
重量 | 0.518 |
CIP核字 | 2013113429 |
中图分类号 | TP391 |
丛书名 | |
印张 | 21.5 |
印次 | 1 |
出版地 | 江苏 |
长 | 233 |
宽 | 177 |
高 | 15 |
整理 | |
媒质 | 图书 |
用纸 | 普通纸 |
是否注音 | 否 |
影印版本 | 原版 |
出版商国别 | CN |
是否套装 | 单册 |
著作权合同登记号 | |
版权提供者 | |
定价 | |
印数 | |
出品方 | |
作品荣誉 | |
主角 | |
配角 | |
其他角色 | |
一句话简介 | |
立意 | |
作品视角 | |
所属系列 | |
文章进度 | |
内容简介 | |
作者简介 | |
目录 | |
文摘 | |
安全警示 | 适度休息有益身心健康,请勿长期沉迷于阅读小说。 |
随便看 |
|
兰台网图书档案馆全面收录古今中外各种图书,详细介绍图书的基本信息及目录、摘要等图书资料。