软件 | 水淼关键词网址采集器 v2.0.2.0 绿色版 |
内容 |
水淼关键词网址采集器能够根据关键词搜索百度、360、搜狗、谷歌等,采集搜索结果的网址和标题输出保存。 水淼关键词网址采集器主要用途:分析竞争对方,挖掘长尾词;研究平台;采集外链;采集例子等等。关键词可以附带搜索引擎限定语法,如百度里搜索结果网址中必须包含bbs的关键词,则输入“关键词 inurl:bbs”。 基本简介输入关键字采集各搜索引擎的网址、域名、标题、描述等信息,支持百度、搜狗、谷歌、必应、雅虎、360等。每个关键词600到800条,采集例子,关键词可以附带搜索引擎参数,就跟网页里输入关键词搜索一样,如百度里搜索结果网址中必须包含bbs的关键词,则输入“关键词 inurl:bbs.” 引用数据#网址#:采集的原始网址 #标题#:网址对应的网页标题 #域名#:原始网址的域名部分,如“http://test.shuimiao.net/123.htm”中的“test.shuimiao.net” #顶级域名#:取原始网址的顶级域名部分,如“http://test.shuimiao.net/123.htm”中的“shuimiao.net” #描述#:网页标题下面的一段描述文字 常见问题1.为什么采集一段时间之后,无法采集? 这可能采集多了被搜索引擎限制,重启软件可继续采集,如果不换,只能等待搜索引擎取消屏蔽之后才能继续采集。百度的屏蔽时间通常半小时到数小时。 不过,现在即使出现验证码屏蔽,软件也会弹出验证码手动输入的(百度、谷歌) 2.不同批次关键词采集的结果为什么会存在部分网址重复? 尤其是只引用了 #域名# 或 #顶级域名# 之后,这种部分网址重复的情况比较多。这也是正常的,因为每个网站的内页可能包含很多主题,不同关键词都可能采集到该网站的不同内页,当引用域名后,相同网站的不同内页的域名结果自然就相同了。 另外,软件里的自动去重,是针对本次采集的结果内部进行去重,以前采集的结果是不在本次去重范围的。如果两次采集的结果存在部分网址重复,可以把他们合并一起,使用软件去重(水淼·文本去重打乱器)。 3.为什么采集回来的网址的主题与关键词不符? 是因为引用了 #域名# 或 #顶级域名# 后,取的是域名部分,域名打开的是该网站的首页,而采集的原网址可能不是首页,而是该网站的某一篇文章的内页,该内页包含关键词主题,因此被搜索引擎收录,软件才能采集得到。但取域名后,你打开的域名首页就不一定包含该关键词。 为了比对采集是否正确,可以在保存模板里输入:#标题#,保存为htm文件,采集完后可以自己打开该文件查看比对。 升级日志1.改造为支持OEM代理 2.增加必应和雅虎采集;多项改动 3.将必应、雅虎、谷歌改为https请求以避免一些情况下的采集失败问题。 4.增加百度新闻采集。 5.一些更新。 6.增加关键词分割线选项。 7.修复百度最新变动无法采集的问题。 8.修复必应改动采集失效问题;修复某些电脑不能使用xmlhttps的问题(涉及谷歌、必应、雅虎)。 |
标签 | 关键词,水淼,网址采集器 |
缩略图 | ![]() |
软件名称 | 水淼关键词网址采集器 v2.0.2.0 绿色版 |
软件图标 | |
软件大小 | 579KB |
发布时间 | |
软件平台 | |
软件语言 | 简体中文 |
软件授权 | 免费软件 |
操作系统 | Windows平台 |
系统类型 | |
用户评分 | 3 |
软件版本 | |
官方网站 | |
官方网址 | |
软件截图 | |
软件总类 | 电脑游戏 |
软件大类 | 软件下载-网络软件-网站推广 |
软件小类 | 网站推广 |
开发者 | |
主办单位名称 | |
ICP备案名 | |
备案号 | |
使用年龄 | |
下载链接 | ![]() |
攻略教程 | |
详细介绍 | |
操控设备 | |
隐私政策 | |
查看权限 | |
敏感权限获取说明 | |
软件类型 | 国产软件 |
安全警示 | 适度休息有益身心健康,请勿长期沉迷于使用电脑或刷手机。 |
随便看 |
|
传承兰台文化,共同保存历史记忆!兰台网收藏软件、游戏、图片、图书、电影、电视剧等互联网档案,是免费和可借阅文本、电影、音乐等档案的数字图书馆。