返回 上网辅助

展开

可可软件园> 网络工具> 上网辅助

网络神采

大小:5.0M时间:2020-05-26 07:23:50 类别:上网辅助系统:WinAll
简介|教程
软件介绍

网络神采免费版是一款非常好用的网页数据采集工具,软件小巧便携,绿色无需安装,操作简单,能够帮助用户一键进行各类网站的数据采集工作。

网络神采

网络神采介绍

《网络神采》是一款轻量级的采集软件,用于快速采集、下载网页数据。软件速度快、好用、免费。支持智能采集(不用配规则)、可视化采集(不用看源文件),支持二次开发、分布式部署。为用户的大数据分析、信息化平台,提供稳定、持续、准确的数据资源。

网络神采功能

1、采集强度

网络神采官方版支持JS解析、POST分页、登录采集、跨层采集。对于疑难采集页面,有成熟的解决方案。

2、速度快

网络神采官方版是一款十分优秀的采集软件,网络神采官方版体积不大,但是功能非常的好用,可以快速采集、下载网页数据。并且支持智能采集、可视化采集,支持二次开发、分布式部署。支持多任务同时运行,每个任务又可以设置多线程,确保运行效率。

3、规模化

支持任务多级分类、批量管理。支持云服务器分布式部署,管理员团队协合。

4、流程化

支持定时采集,任务定时自动启动。通过二次开发,实现流程化的信息采集、信息处理。

5、运行稳定

系统运行稳定,要求“0 bug”。目标网页改版后,自动通知管理员。

6、准确性

定制好任务后,采集准确率可达100%,即一条不漏。

网络神采特色

A、通用:根据制定采集规则,可以采集任何通过浏览器看得到的东西。

B、灵活:支持网站登录采集、网站跨层采集、POST采集、脚本采集、动态页面采集等高级功能。

C、扩展性强:支持存储过程调用、插件调用等,可以通过二次开发扩展功能。

D、高效:为了让用户节省一分钟去做其它事情,对软件做了精细设计。

E、速度快:速度最快、效率最高的采集软件。

F、稳定:系统资源占用少、有详细的运行报告、采集性能稳定,而且,软件要求“零BUG”。

G、人性化:注重软件细节,在乎用户体验。

网络神采使用说明

1、下载完成后不要在压缩包内运行软件直接使用,先解压;

2、软件同时支持32位64位运行环境;

3、如果软件无法正常打开,请右键使用管理员模式运行。

更新日志

1、增加定期重启软件功能。

2、修复bug:定时采集启动任务时会进队列2次。

3、增加设置:特殊结果设置 -> 记录任务名称。

4、修复bug:Win7下启动服务IO异常。

5、按任务统计插件。

6、修复bug:文本查看器切换到空白单元格会出错。

7、如果不下载文件,不要再生成子目录(即使选中设置)。

8、F9运行文件夹下所有任务后,子文件夹的任务状态没有改变。

9、修复bug:访问休息间隔设置为“0-1秒”时失效。

10、处理JS中的相对地址时,可识别“'”前面的转义符“”。

11、发生 Worker Thread Error 的异常时,可记录异常的详细内容。

12、读取网址时出错后,可暂停任务。

13、发生 Worker Thread Error 的异常时,任务可暂停;若暂停失败,则停止任务。

14、修复bug:继续任务时,如果任务进入任务队列,则会重新开始任务。

15、停止任务,同样要写日志。

16、改进了任务队列的查询算法。

17、改进了机器码的可读性。

18、Worker Thread Error: 引发类型为“System.OutOfMemoryException”的异常。该异常发生后,可暂停任务。

19、保存“提取网址”时如果出错,可恢复。

20、增加设置:如果“使用插件处理采集结果数据行”失败(即返回“false”),仍显示采集结果。

21、废弃设置:关闭软件时,如果有软件正在运行,强制停止所有任务。

22、改进“源文件查看器”用户体验3处:Cookie变化、粘贴POST参数时自动分离、菜单快捷键。

23、捕获地址时,如果某个参数有变化,文本框背景色则变红。

24、将检查“关键规则”调整到“采集结果筛选”之前。

25、更新插件接口(IBget 3.4),更新内容:CheckSchedule、Create 新增参数:lastTaskState、lastPausingReason。

26、请求休息间隔,支持随机数。

27、请求重试可以设置为无限次数,同时增加“重试休息间隔”、“重试错误范围”设置。

28、任务增加设置:动作失败后不暂停任务。

29、下载文件时,只请求一次。

30、运行整个文件夹的任务时,增加快捷键:F9。

31、修复bug:批量暂停正在启动的任务时,会有“运行中”状态闪过。

32、解决:运行信息窗口资源释放问题。

33、使用插件处理结果数据行后,如果返回false,则数据行不再显示。

34、循环采集拆分字符串数组时,保留空值。

35、修复内存bug一处。

36、修复bug:查看等待区出错:集合已修改;可能无法执行枚举操作。

37、修复bug:由于插件日志回调事件,会引发异常:远程对象已断开。

38、修复bug:设置窗口如果不操作,2分钟后会抛异常:远程对象已断开。

39、更新插件接口(IBget 3.3),更新内容:ExtractResult 新增参数:rowIndex;Create 新增参数:supportAsyncCall。

40、创建插件时如果出错,任务不再提示连接数据库。

41、特殊结果 -》 记录当前网址,如果有POST参数,则包含在其中。

42、修复bug:任务完成后取消定时采集,在选中“使用插件检查定时采集”时仍起作用。

43、修复bug:源文件查看器预览功能,不能预览框架页。

44、增加复制采集规则功能。

45、提取下一网址时,如果与网址队列重复,则提示:提取 n 条, 已去重.

46、连续提取下一层网址失败已达到 n 次后,不再提取下一页网址,不然下次请求时会重复提取。

47、修复几处内存溢出问题。

48、修复bug:文本查看器 html 方式查看,关闭窗口后,再打开出错“未将对象引用设置到实例”。

49、改进定时采集检查思路:取当前时间并缓存,这样就没有了定时偏差。

加载全部内容

热门推荐
推荐教程
猜你喜欢
相关合集
本类排行