软件 | Apache Nutch(Java搜索引擎框架) v2.3.1 官方免费版 |
内容 |
Apache Nutch(Java搜索引擎框架)是一个开放源代码的Java搜索引擎框架,它提供了运行自己的搜索引擎所需要的全部工具,包括全文搜索和Web爬虫,使用Nutch不仅可以建立自己内部网的搜索引擎,同时也可以针对整个网络建立搜索引擎。除了基本的功能之外,Nutch也还有不少自己的特色,如Map-Reduce、Hadoop、Plugin等。 Nutch目标: Nutch 致力于让每个人能很容易, 同时花费很少就可以配置世界一流的Web搜索引擎. 为了完成这一宏伟的目标, Nutch必须能够做到: 每个月取几十亿网页 为这些网页维护一个索引 对索引文件进行每秒上千次的搜索 提供高质量的搜索结果 Nutch的运行流程: 1.将起始 URL 集合注入到 Nutch 系统之中。 2.生成片段文件,其中包含了将要抓取的 URL 地址。 3.根据URL地址在互联网上抓取相应的内容。 4.解析所抓取到的网页,并分析其中的文本和数据。 5.根据新抓取的网页中的URL集合来更新起始URL集合,并再次进行抓取。 6.同时,对抓取到的网页内容建立索引,生成索引文件存放在系统之中。 |
标签 | Nutch,搜索引擎,Apache,Java |
缩略图 | ![]() |
软件名称 | Apache Nutch(Java搜索引擎框架) v2.3.1 官方免费版 |
软件图标 | |
软件大小 | 4.16MB |
发布时间 | |
软件平台 | |
软件语言 | 简体中文 |
软件授权 | 免费软件 |
操作系统 | Windows平台 |
系统类型 | |
用户评分 | 3 |
软件版本 | |
官方网站 | |
官方网址 | |
软件截图 | |
软件总类 | 电脑游戏 |
软件大类 | 软件下载-应用软件-编程开发-java相关-nutch下载 |
软件小类 | java相关 |
开发者 | |
主办单位名称 | |
ICP备案名 | |
备案号 | |
使用年龄 | |
下载链接 | ![]() |
攻略教程 | |
详细介绍 | |
操控设备 | |
隐私政策 | |
查看权限 | |
敏感权限获取说明 | |
软件类型 | 国产软件 |
安全警示 | 适度休息有益身心健康,请勿长期沉迷于使用电脑或刷手机。 |
随便看 |
|
传承兰台文化,共同保存历史记忆!兰台网收藏软件、游戏、图片、图书、电影、电视剧等互联网档案,是免费和可借阅文本、电影、音乐等档案的数字图书馆。