本书是国内第一本讲解搜索引擎开发的畅销书。
本书内容新颖、实用,提供了价值上百万元的大型数码产品搜索引擎开发案例,可直接应用于项目。
本书用案例的方式讲解,便于读者实践。
| 图书 | 开发自己的搜索引擎(附光盘Lucene+Heritrix第2版) |
| 内容 | 编辑推荐 本书是国内第一本讲解搜索引擎开发的畅销书。 本书内容新颖、实用,提供了价值上百万元的大型数码产品搜索引擎开发案例,可直接应用于项目。 本书用案例的方式讲解,便于读者实践。 内容推荐 本书是一本介绍搜索引擎开发的书籍,通过本书,读者可以独立构建一个企业级的搜索引擎网站。本书讲解了搜索引擎与信息检索基础,Lucene入门实例,索引的建立,使用Lucene来搜索,排序,分析器,对Word、Excel和PDF格式文档的解析,Compass搜索引擎框架,Lucene分布式,爬虫Heritrix,HTMLParser,DWR等内容。最后综合这些技术,构建了一个典型的垂直搜索系统,具有很强的商业实用价值。 本书是一本使用Lucene和Heritrix来讲解搜索引擎构建的书,通过对API和源代码的分析,力求使读者在应用的基础上,能够深入其核心,自行扩展和开发相应组件,发挥想象力,开发出更具有创意的搜索引擎产品。 本书适合Java程序员和从事计算机软件开发的编程人员阅读,同时也可以作为搜索引擎爱好者的入门书籍。 目录 第1章 搜索引擎与信息检索 第2章 Lucene入门实例 第3章 索引的建立 第4章 Lucene搜索 第5章 排序、过滤和分页 第6章 Lucene的分析器 第7章 Word、Excel和PDF的处理 第8章 Compass:封装了Lucene的框架 第9章 Lucene分布式 第10章 无比强大的网络爬虫Heritrix 第11章 搜索引擎综合实例:准备篇 第12章 搜索引擎综合实例:下载篇 第13章 使用正则表达式与HTML Parser分析网页 第14章 网页内容存储与索引 第15章 搜索引擎综合实例:交互篇 第16章 搜索引擎综合实例:Web篇 附录 Lucene 2.4更新内容 |
| 标签 | |
| 缩略图 | ![]() |
| 书名 | 开发自己的搜索引擎(附光盘Lucene+Heritrix第2版) |
| 副书名 | |
| 原作名 | |
| 作者 | 邱哲//符滔滔//王学松 |
| 译者 | |
| 编者 | |
| 绘者 | |
| 出版社 | 人民邮电出版社 |
| 商品编码(ISBN) | 9787115215291 |
| 开本 | 16开 |
| 页数 | 562 |
| 版次 | 2 |
| 装订 | 平装 |
| 字数 | 773 |
| 出版时间 | 2010-01-01 |
| 首版时间 | 2010-01-01 |
| 印刷时间 | 2010-01-01 |
| 正文语种 | 汉 |
| 读者对象 | 青年(14-20岁),普通成人 |
| 适用范围 | |
| 发行范围 | 公开发行 |
| 发行模式 | 实体书 |
| 首发网站 | |
| 连载网址 | |
| 图书大类 | 教育考试-考试-计算机类 |
| 图书小类 | |
| 重量 | 0.788 |
| CIP核字 | |
| 中图分类号 | TP393.09 |
| 丛书名 | |
| 印张 | 36 |
| 印次 | 1 |
| 出版地 | 北京 |
| 长 | 235 |
| 宽 | 187 |
| 高 | 21 |
| 整理 | |
| 媒质 | 图书 |
| 用纸 | 普通纸 |
| 是否注音 | 否 |
| 影印版本 | 原版 |
| 出版商国别 | CN |
| 是否套装 | 单册 |
| 著作权合同登记号 | |
| 版权提供者 | |
| 定价 | |
| 印数 | 3500 |
| 出品方 | |
| 作品荣誉 | |
| 主角 | |
| 配角 | |
| 其他角色 | |
| 一句话简介 | |
| 立意 | |
| 作品视角 | |
| 所属系列 | |
| 文章进度 | |
| 内容简介 | |
| 作者简介 | |
| 目录 | |
| 文摘 | |
| 安全警示 | 适度休息有益身心健康,请勿长期沉迷于阅读小说。 |
| 随便看 |
|
兰台网图书档案馆全面收录古今中外各种图书,详细介绍图书的基本信息及目录、摘要等图书资料。