本书是国内第一本讲解搜索引擎开发的畅销书。
本书内容新颖、实用,提供了价值上百万元的大型数码产品搜索引擎开发案例,可直接应用于项目。
本书用案例的方式讲解,便于读者实践。
图书 | 开发自己的搜索引擎(附光盘Lucene+Heritrix第2版) |
内容 | 编辑推荐 本书是国内第一本讲解搜索引擎开发的畅销书。 本书内容新颖、实用,提供了价值上百万元的大型数码产品搜索引擎开发案例,可直接应用于项目。 本书用案例的方式讲解,便于读者实践。 内容推荐 本书是一本介绍搜索引擎开发的书籍,通过本书,读者可以独立构建一个企业级的搜索引擎网站。本书讲解了搜索引擎与信息检索基础,Lucene入门实例,索引的建立,使用Lucene来搜索,排序,分析器,对Word、Excel和PDF格式文档的解析,Compass搜索引擎框架,Lucene分布式,爬虫Heritrix,HTMLParser,DWR等内容。最后综合这些技术,构建了一个典型的垂直搜索系统,具有很强的商业实用价值。 本书是一本使用Lucene和Heritrix来讲解搜索引擎构建的书,通过对API和源代码的分析,力求使读者在应用的基础上,能够深入其核心,自行扩展和开发相应组件,发挥想象力,开发出更具有创意的搜索引擎产品。 本书适合Java程序员和从事计算机软件开发的编程人员阅读,同时也可以作为搜索引擎爱好者的入门书籍。 目录 第1章 搜索引擎与信息检索 第2章 Lucene入门实例 第3章 索引的建立 第4章 Lucene搜索 第5章 排序、过滤和分页 第6章 Lucene的分析器 第7章 Word、Excel和PDF的处理 第8章 Compass:封装了Lucene的框架 第9章 Lucene分布式 第10章 无比强大的网络爬虫Heritrix 第11章 搜索引擎综合实例:准备篇 第12章 搜索引擎综合实例:下载篇 第13章 使用正则表达式与HTML Parser分析网页 第14章 网页内容存储与索引 第15章 搜索引擎综合实例:交互篇 第16章 搜索引擎综合实例:Web篇 附录 Lucene 2.4更新内容 |
标签 | |
缩略图 | ![]() |
书名 | 开发自己的搜索引擎(附光盘Lucene+Heritrix第2版) |
副书名 | |
原作名 | |
作者 | 邱哲//符滔滔//王学松 |
译者 | |
编者 | |
绘者 | |
出版社 | 人民邮电出版社 |
商品编码(ISBN) | 9787115215291 |
开本 | 16开 |
页数 | 562 |
版次 | 2 |
装订 | 平装 |
字数 | 773 |
出版时间 | 2010-01-01 |
首版时间 | 2010-01-01 |
印刷时间 | 2010-01-01 |
正文语种 | 汉 |
读者对象 | 青年(14-20岁),普通成人 |
适用范围 | |
发行范围 | 公开发行 |
发行模式 | 实体书 |
首发网站 | |
连载网址 | |
图书大类 | 教育考试-考试-计算机类 |
图书小类 | |
重量 | 0.788 |
CIP核字 | |
中图分类号 | TP393.09 |
丛书名 | |
印张 | 36 |
印次 | 1 |
出版地 | 北京 |
长 | 235 |
宽 | 187 |
高 | 21 |
整理 | |
媒质 | 图书 |
用纸 | 普通纸 |
是否注音 | 否 |
影印版本 | 原版 |
出版商国别 | CN |
是否套装 | 单册 |
著作权合同登记号 | |
版权提供者 | |
定价 | |
印数 | 3500 |
出品方 | |
作品荣誉 | |
主角 | |
配角 | |
其他角色 | |
一句话简介 | |
立意 | |
作品视角 | |
所属系列 | |
文章进度 | |
内容简介 | |
作者简介 | |
目录 | |
文摘 | |
安全警示 | 适度休息有益身心健康,请勿长期沉迷于阅读小说。 |
随便看 |
|
兰台网图书档案馆全面收录古今中外各种图书,详细介绍图书的基本信息及目录、摘要等图书资料。