首页  软件  游戏  图书  电影  电视剧

请输入您要查询的软件:

 

软件 爬山虎数据采集器 v3.0.4.5 官方安装版 
内容

爬山虎采集器简单易学,通过可视化界面,鼠标点击即可抓取数据。内置一套高速浏览器内核,加上HTTP引擎模式,实现快速采集数据。爬山虎采集器能够采集互联网99%的网站,包括单页应用Ajax加载等等动态类型网站,需要的朋友赶紧下载吧。

功能介绍

  向导模式

  简单易用,轻松通过鼠标点击自动生成脚本

  定时运行

  可按照计划定时运行,无需人工

  独创高速内核

  自研的浏览器内核,速度飞快,远超对手

  智能识别

  对于网页中的列表、表单结构(多选框下拉列表等)能够智能识别

  广告屏蔽

  定制的广告屏蔽模块,兼容AdblockPlus语法,可添加自定义规则

  多种数据导出

  支持Txt 、Excel、MySQL、SQLServer、SQlite、Access、网站等

软件特色

  一键提取数据

  简单易学,通过可视化界面,鼠标点击即可抓取数据

  快速高效

  内置一套高速浏览器内核,加上HTTP引擎模式,实现快速采集数据

  适用各种网站

  能够采集互联网99%的网站,包括单页应用Ajax加载等等动态类型网站

使用流程

  1、输入采集网址

  打开软件,新建任务,输入需要采集的网站地址。

  2、智能分析,全程自动化提取数据

  进入到第二步后,爬山虎采集器全自动智能分析网页,并且从中提取出列表数据。

  3、导出数据到表格、数据库、网站等

  运行任务,将采集到的数据导出为Csv、Excel以及各种数据库,支持api导出。

常见问题

  问:如何过滤列表中的前N个数据?

  1.有时我们需要对采集到的列表进行过滤,比如过滤掉第一组数据(在采集表格时,过滤掉表格列名)

  2.点击列表模式菜单中的,设置列表xpath

  问:如何抓包获取Cookie,并且手动设置?

  1.首先,使用谷歌浏览器打开要采集的网站,并且登陆。

  2.然后按下 F12,会出现开发者工具,选择 Network

  3.然后按下F5,刷新下页面, 选择其中一个请求。

  4.复制完成后,在爬山虎采集器中,编辑任务,进入第三步,指定HTTP Header。

更新日志

  3.0.2.8

  2021/6/24

  修复部分系统下任务结束时异常退出问题

  修复编辑器中脚本命令一直等待问题

  优化默认导出路径,记录上次保存目录

  修复数据处理-文本替换不能保存换行问题

爬山虎采集器v3.0.2.7更新:

  1、修复分页的采集优先级

  2、提前检验xpath和正则的正确性

  3、其他使用了Inputbox的验证修改

  4、增加数据处理-前后缀

  5、修复英文系统下乱码问题

  6、修复小分辨率下,窗口超过屏幕问题

  7、新增路由拨号和adsl拨号功能

  8、对等待命令增加等待某元素

  9、修复form的解析

  10、任务列表按时间顺序排列

  11、完善探测列表数据(列表就是a元素

  12、修复下载文件无后缀问题

  13、新增高级过滤功能

  14、添加鼠标和键盘的模拟操作

  15、增大滚动页数

标签 数据采集器,爬山虎采集器
缩略图
软件名称 爬山虎数据采集器 v3.0.4.5 官方安装版
软件图标
软件大小 60.4MB
发布时间
软件平台
软件语言 简体中文
软件授权 免费软件
操作系统 Windows平台
系统类型
用户评分 3
软件版本
官方网站
官方网址
软件截图
软件总类 电脑游戏
软件大类 软件下载-网络软件-网络辅助-爬山虎采集器下载
软件小类 网络辅助
开发者
主办单位名称
ICP备案名
备案号
使用年龄
下载链接
攻略教程
详细介绍
操控设备
隐私政策
查看权限
敏感权限获取说明
软件类型 国产软件
安全警示 适度休息有益身心健康,请勿长期沉迷于使用电脑或刷手机。
随便看

 

传承兰台文化,共同保存历史记忆!兰台网收藏软件、游戏、图片、图书、电影、电视剧等互联网档案,是免费和可借阅文本、电影、音乐等档案的数字图书馆。

 

Copyright © 2004-2025 xlantai.com All Rights Reserved
更新时间:2025/5/4 23:12:00