火车采集器(LocoySpider) 2010 Sp1OS:2003/XP/Win2000/NT/Win9xLicense:免费软件 Size:26.75 M Evaluation: Uudate:2010-6-30 Downloads: 0 火车采集器(LocoySpider) 2010 Sp1 Description:
火车采集器 (LocoySpider)是一款专业的功能强大的网络数据/信息挖掘软件,通过灵活的配置,您可以很轻松的从网页上抓取文字、图片、文件等任何资源。程序支持远程下载图片文件,支持网站登陆后的信息采集,支持探测文件真实地址,支持代理,支持防盗链的采集,支持采集数据直接入库和模仿人手工发布等许多功能特点。火车采集器支持从任何类型的网站采集获取您所需要的信息,如各种新闻类网站、论坛、电子商务网站、求职招聘网站等。同时具有强大的网站登录采集、多页和分页的采集、网站跨层采集、POST采集、脚本页面采集、动态页面采集等高级采集功能。强大的php和c#插件支持,让您可以通过二次开发实现您所想要的任何更强大的功能。 火车采集器特有功能: 1、支持所有网站编码:完美支持采集所有编码格式的网页,程序还可以自动识别网页编码。 2、多种发布方式:支持目前所有主流和非主流的CMS,BBS等网站程序,通过系统的发布模块能实现采集器和网站程序间的完美结合。 3、全自动:无人值守工作,配置好程序后,程序将依据您的设置自动运行,完全无需人工干预。 4、本地编辑:本地可视化编辑已采集的数据。 5、采集测试:这是其它任何同类采集软件所不能比的,程序支持直接查看采集结果并测试发布。 6、管理方便:使用站点+任务方式管理采集节点,任务支持批量操作,再多的数据管理也很轻松。 应用范围 垂直搜索(或称为专业搜索)服务 信息汇聚和门户服务 企业网信息汇聚 商业情报采集 论坛或博客迁移 智能信息代理 个人信息检索 信息挖掘 适用群体 1、公司集团 2、政府机关与军队 3、门户网站 4、新闻媒体 5、广告与市场研究机构 6、金融机构 7、电信移动联通 8、科学与技术研究单位 9、网站站长 10、电子商务(如淘宝店长等) 11、其他 2010-04-25自动升级更新已解决以下问题—————— 1.修复了采集内容或网址时出错导致程序退出的问题. 2.下载文件并下载时文件地址错误导致程序退出的问题. 3.使用插件时测试发布使用的数据不是插件处理后的数据的bug. 4.修正了一个智能提取时SY标签提取错误的问题. 5.列表页标签部分情况下提示重复的bug. 6.在分词或摘要时不存在某个标签时可能出错的bug. 7.在采集时提供了更多的细节显示.更方便用户查看进度. 8.探测文件并下载给加了不区分大小写功能. 9.修复倒序发布时部分次序不对的问题. 2010-05-06自动升级更新已解决以下问题—————— 10.MSsql会出现 所唯一索引之类的问题. 11.内置浏览器访问某些网站出错的问题. 12.网址库过大时提示内存不足的问题. 13.全局设置[换行]不起作用的问题. 14.添加全局替换后部分情况下替换不起作用的问题. 15.使用自动更新时,如果设置错误的时间导致程序无法运行的问题. 16.以SqlServer做数据库时网址重复检测失败的bug. 17.导入导出时增加了文件夹的设置. 18.更新了加密程序,支持更高版本.net. 19.修复了以MySql做数据库时数据库错误会导致程序退出的bug. 20.修复了入数据库时,大小写错误引起入库失败的bug. 2010-05-11自动升级更新已解决以下问题—————— 21.mysql中同时添加多个字段提示错误的bug. 22.修改了一个使用自定义网址过滤时不得包含不起作用的bug. 23.增强了检测文件并下载的功能. 24.自定义中时间网址生成的一个bug. 25.更新Sqlite驱动到最新版. 26.编辑任务修改和最后采集时间没有显示的bug. 2010-05-13自动升级更新已解决以下问题—————— 27.修复了删除有索引的标签时错误的bug. 28.修复了测试采网址时显示的一个错误. 29.修复了当网址链接使用basehref时如果basehref不是根目录网址获取错误的bug. 30.增加了备份用户配置文件功能. 31.修复了删除有索引的标签时错误的bug. 32.修复了测试采网址时显示的一个错误. 33.修复了当网址链接使用basehref时如果basehref不是根目录网址获取错误的bug. 34.增加了备份用户配置文件功能. 35.修复了mysql中同时添加多个字段提示错误的bug. 36.修改了一个使用自定义网址过滤时不得包含不起作用的bug. 37.增强了检测文件并下载的功能. 38.自定义中时间网址生成的一个bug. 39.更新Sqlite驱动到最新版. 40.编辑任务修改和最后采集时间没有显示的bug. 41.Sqlite数据库压缩失效的bug. 42.http请求工具User-agent菜单第一项设置为本机User-Agent. 43.修复了企业版在使用直接入库时不下载图片的bug. 2010-06-01自动升级更新已解决以下问题—————— 44.修复了当使用php插件时给标签赋值为null导致采集器退出的bug. 45.在处理不符合记录时,如删除记录,也会删除该记录所下载的文件. 46.增加了随机代理功能.该功能在旗舰版及更高版本中可用. 47.增加了任务完成后数据自检功能. 48.修复了标签替换时,如果出错,将弹出很多出错误框的提示的问题. 49.新增加一选项,当使用多个发布配置时,如果没有全部发布成功,可以设置为已发或未发. 50.增加代码调试,当Web发布失败时,将返回所有的采集器提交的数据及返回的数据. 51.处理了部分FTP上传时提示 在其上下文中,该请求的地址无效 的问题. 52.修复提取内容图片为缩略图时不下载时不保存图片地址的bug. 53.FTP上传文件时没显示进度条的小bug. 54.增加任务运行时禁止修改任务名,防止修改任务名后出现采集错误. 55.将网址采集重复的累计计算方法改成原来的正确的连续重复计算方法. 56.优化采集过程,减少系统资源使用. 2010-06-09自动升级更新已解决以下问题—————— 57.将同时运行任务数限制取消. 58.更新本地数据导出CSV工具到2010版. 59.修复批量工具中整个站点删除不起作用的bug. 60.关键词替换支持读取utf-8格式文件. 官方网站:http://www.locoy.com/ 联系方式:admin@locoy.com support@locoy.com |
Related Software Download of Class
Related Software New Downloads
|
*In order to achieve the fastest download speeds, recommended FlashGet Download software. |