文章采集软件|红叶文章采集器V3.6绿色中文版

优采云 发布时间: 2020-08-07 06:19

  Hongye Article Collector是一款非常强大的文章采集软件. 通过该软件,可以采集指定网站上的文章,并可以自动删除广告和垃圾部分,从而保持其本质. 该软件使用300种线程操作模式,采集效率很高. 一台计算机平均每天可以采集200,000件必需品,这非常实用.

  如何操作红叶文章采集器:

  (1)使用前,必须确保计算机可以连接到网络并且防火墙不会阻止软件.

  (2)运行SETUP.EXE和setup2.exe以安装操作系统system32支持库.

  (3)运行spider.exe,输入URL条目,首先单击“手动添加”按钮,然后单击“开始”按钮以开始采集.

  红叶采集器的注意事项

  (1)抓取深度: 填写0表示捕获深度不受限制;填写3表示已捕获第三层.

  (2)普通蜘蛛模式与分类蜘蛛模式之间的区别: 假设URL条目为“”,如果选择了普通蜘蛛模式,则将遍历“”中的每个网页;如果选择了分类蜘蛛模式,则将遍历所有页面中的“”.

  (3)按钮“从MDB导入”: URL条目是从TASK.MDB批量导入的.

  (4)该软件集合的原则是不越站. 例如,如果给定的条目为“”,则只会在百度站点内捕获它.

  (5)在此软件的获取过程中,偶尔会弹出一个或几个“错误对话框”. 请忽略它们. 如果关闭“错误对话框”,则采集软件将挂断.

  (6)用户如何选择主题: 例如,如果要采集“股票”文章,则只需使用这些“股票”网站作为URL条目.

  Red Leaf Article Collector软件功能:

  (1)该软件采用北京大学天网的MD5指纹重复算法. 对于相似且相同的网页信息,将不会重复保存.

  (2)所采集信息的含义: [[HT]]代表网页的标题,[[HA]]代表文章的标题,[[HC]]代表10个加权关键字,[[UR] ]]表示网页链接上的图片,[[TXT]]后的文字.

  (3)正式版和免费版的区别在于,正式版允许将采集的基本商品数据自动保存为ACCESS数据库.

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线