软件 | 爬山虎数据采集器 v3.0.4.5 官方安装版 |
内容 |
爬山虎采集器简单易学,通过可视化界面,鼠标点击即可抓取数据。内置一套高速浏览器内核,加上HTTP引擎模式,实现快速采集数据。爬山虎采集器能够采集互联网99%的网站,包括单页应用Ajax加载等等动态类型网站,需要的朋友赶紧下载吧。 功能介绍向导模式 简单易用,轻松通过鼠标点击自动生成脚本 定时运行 可按照计划定时运行,无需人工 独创高速内核 自研的浏览器内核,速度飞快,远超对手 智能识别 对于网页中的列表、表单结构(多选框下拉列表等)能够智能识别 广告屏蔽 定制的广告屏蔽模块,兼容AdblockPlus语法,可添加自定义规则 多种数据导出 支持Txt 、Excel、MySQL、SQLServer、SQlite、Access、网站等 软件特色一键提取数据 简单易学,通过可视化界面,鼠标点击即可抓取数据 快速高效 内置一套高速浏览器内核,加上HTTP引擎模式,实现快速采集数据 适用各种网站 能够采集互联网99%的网站,包括单页应用Ajax加载等等动态类型网站 使用流程1、输入采集网址 打开软件,新建任务,输入需要采集的网站地址。 2、智能分析,全程自动化提取数据 进入到第二步后,爬山虎采集器全自动智能分析网页,并且从中提取出列表数据。 3、导出数据到表格、数据库、网站等 运行任务,将采集到的数据导出为Csv、Excel以及各种数据库,支持api导出。 常见问题问:如何过滤列表中的前N个数据? 1.有时我们需要对采集到的列表进行过滤,比如过滤掉第一组数据(在采集表格时,过滤掉表格列名) 2.点击列表模式菜单中的,设置列表xpath 问:如何抓包获取Cookie,并且手动设置? 1.首先,使用谷歌浏览器打开要采集的网站,并且登陆。 2.然后按下 F12,会出现开发者工具,选择 Network 3.然后按下F5,刷新下页面, 选择其中一个请求。 4.复制完成后,在爬山虎采集器中,编辑任务,进入第三步,指定HTTP Header。 更新日志3.0.2.8 2021/6/24 修复部分系统下任务结束时异常退出问题 修复编辑器中脚本命令一直等待问题 优化默认导出路径,记录上次保存目录 修复数据处理-文本替换不能保存换行问题 爬山虎采集器v3.0.2.7更新: 1、修复分页的采集优先级 2、提前检验xpath和正则的正确性 3、其他使用了Inputbox的验证修改 4、增加数据处理-前后缀 5、修复英文系统下乱码问题 6、修复小分辨率下,窗口超过屏幕问题 7、新增路由拨号和adsl拨号功能 8、对等待命令增加等待某元素 9、修复form的解析 10、任务列表按时间顺序排列 11、完善探测列表数据(列表就是a元素 12、修复下载文件无后缀问题 13、新增高级过滤功能 14、添加鼠标和键盘的模拟操作 15、增大滚动页数 |
标签 | 数据采集器,爬山虎采集器 |
缩略图 | ![]() |
软件名称 | 爬山虎数据采集器 v3.0.4.5 官方安装版 |
软件图标 | |
软件大小 | 60.4MB |
发布时间 | |
软件平台 | |
软件语言 | 简体中文 |
软件授权 | 免费软件 |
操作系统 | Windows平台 |
系统类型 | |
用户评分 | 3 |
软件版本 | |
官方网站 | |
官方网址 | |
软件截图 | |
软件总类 | 电脑游戏 |
软件大类 | 软件下载-网络软件-网络辅助-爬山虎采集器下载 |
软件小类 | 网络辅助 |
开发者 | |
主办单位名称 | |
ICP备案名 | |
备案号 | |
使用年龄 | |
下载链接 | ![]() |
攻略教程 | |
详细介绍 | |
操控设备 | |
隐私政策 | |
查看权限 | |
敏感权限获取说明 | |
软件类型 | 国产软件 |
安全警示 | 适度休息有益身心健康,请勿长期沉迷于使用电脑或刷手机。 |
随便看 |
|
传承兰台文化,共同保存历史记忆!兰台网收藏软件、游戏、图片、图书、电影、电视剧等互联网档案,是免费和可借阅文本、电影、音乐等档案的数字图书馆。