罗刚编著的《解密搜索引擎技术实战》分为相关技术总体介绍部分、爬虫部分、全文检索部分、自然语言处理部分以及相关案例分析。
本书适合需要具体实现搜索引擎的程序员使用,对于信息检索等相关研究人员也有一定的参考价值,同时猎兔搜索技术团队也已经开发出以本书为基础的专门培训课程和商业软件。
图书 | 解密搜索引擎技术实战(附光盘Lucene & Java精华版) |
内容 | 编辑推荐 罗刚编著的《解密搜索引擎技术实战》分为相关技术总体介绍部分、爬虫部分、全文检索部分、自然语言处理部分以及相关案例分析。 本书适合需要具体实现搜索引擎的程序员使用,对于信息检索等相关研究人员也有一定的参考价值,同时猎兔搜索技术团队也已经开发出以本书为基础的专门培训课程和商业软件。 内容推荐 罗刚编著的《解密搜索引擎技术实战》是猎兔搜索开发团队的软件研发和教学实践的经验汇总。 《解密搜索引擎技术实战》总结搜索引擎相关理论与实际解决方案,并给出了Java实现,其中利用了流行的开源项目Lucene和Solr,而且还包括原创的实现。 《解密搜索引擎技术实战》主要包括总体介绍部分、爬虫部分、自然语言处理部分、全文检索部分以及相关案例分析。爬虫部分介绍了网页遍历方法和如何实现增量抓取,并介绍了从网页等各种格式的文档中提取主要内容的方法。自然语言处理部分从统计机器学习的原理出发,包括了中文分词与词性标注的理论与实现以及在搜索引擎中的实用等细节,同时对文档排重、文本分类、自动聚类、句法分析树、拼写检查等自然语言处理领域的经典问题进行了深入浅出的介绍并总结了实现方法。在全文检索部分,结合Lucene 3.0介绍了搜索引擎的原理与进展。用简单的例子介绍了Lucene的最新应用方法。包括完整的搜索实现过程:从完成索引到搜索用户界面的实现。《解密搜索引擎技术实战》还进一步介绍了实现准实时搜索的方法,展示了Solr 1.4版本的用法以及实现分布式搜索服务集群的方法。最后介绍了在地理信息系统领域和户外活动搜索领域的应用。 目录 第1章 搜索引擎总体结构 第2章 网络爬虫的原理与应用 第3章 索引内容提取 第4章 中文分词原理与实现 第5章 让搜索引擎理解自然语言 第6章 Lucene原理与应用 第7章 搜索引擎用户界面 第8章 使用Solr实现企业搜索 第9章 地理信息系统案例分析 第10章 户外活动搜索案例分析 |
标签 | |
缩略图 | ![]() |
书名 | 解密搜索引擎技术实战(附光盘Lucene & Java精华版) |
副书名 | |
原作名 | |
作者 | 罗刚 |
译者 | |
编者 | |
绘者 | |
出版社 | 电子工业出版社 |
商品编码(ISBN) | 9787121133930 |
开本 | 16开 |
页数 | 544 |
版次 | 1 |
装订 | 平装 |
字数 | 891 |
出版时间 | 2011-06-01 |
首版时间 | 2011-06-01 |
印刷时间 | 2011-06-01 |
正文语种 | 汉 |
读者对象 | 普通青少年,普通成人 |
适用范围 | |
发行范围 | 公开发行 |
发行模式 | 实体书 |
首发网站 | |
连载网址 | |
图书大类 | 人文社科-社会科学-社会科学总论 |
图书小类 | |
重量 | 0.944 |
CIP核字 | |
中图分类号 | G354.4 |
丛书名 | |
印张 | 34.25 |
印次 | 1 |
出版地 | 北京 |
长 | 260 |
宽 | 186 |
高 | 32 |
整理 | |
媒质 | 图书 |
用纸 | 普通纸 |
是否注音 | 否 |
影印版本 | 原版 |
出版商国别 | CN |
是否套装 | 单册 |
著作权合同登记号 | |
版权提供者 | |
定价 | |
印数 | 4000 |
出品方 | |
作品荣誉 | |
主角 | |
配角 | |
其他角色 | |
一句话简介 | |
立意 | |
作品视角 | |
所属系列 | |
文章进度 | |
内容简介 | |
作者简介 | |
目录 | |
文摘 | |
安全警示 | 适度休息有益身心健康,请勿长期沉迷于阅读小说。 |
随便看 |
|
兰台网图书档案馆全面收录古今中外各种图书,详细介绍图书的基本信息及目录、摘要等图书资料。