免费的:金石极速网页采集器1.7 免费版金石极速网页采集器绿色版
优采云 发布时间: 2020-09-07 03:09金石极速网页采集器金石极速网页采集器专营采集并订阅了您自己的指定信息源网站,您可以采集指定网页上的所有信息,也可以按关键词匹配采集。您可以为采集指定线程数,以找到最有效的采集设置。该软件是市场上唯一可以通过自定义列和关键词 采集
创建自己的桌面新闻页面的软件。
Jinshi速度网页采集器专营采集并订阅了您自己的指定信息源网站,您可以采集指定网页上的所有信息,或按关键词匹配采集 ]。您可以为采集指定线程数,以找到最有效的采集设置。
该软件是市场上唯一可以通过自定义列和关键词至采集创建自己的桌面新闻系统的软件。新闻源完全由您指定,运行线程的数量也可以自定义。建立。该软件将自动过滤Internet上重复的信息,并允许您设置不再重复多少相似信息采集,从而使您可以轻松地控制重要信息。
Jinshi快速网页采集器的说明
系统设置中的采集选项用于个性化自定义软件的采集行为。单击工具栏中的“系统设置”按钮后,界面如下:
1.不具有采集标题,并且现有信息相似度大于XX:软件将花费一定的时间比较每个信息与先前的采集信息是否相似度超出设置的标准。那些超出标准的被视为类似信息,将不再重复采集。将该值设置为98或更高时,软件将不再进行比较,从而节省了比较时间,但可能会出现类似信息。因为当采集信息量很大时,比较比较耗时,因此用户可以适当选择。
2.当相同的信息与不同的关键词匹配时:只能有采集个,或者每个采集个不同。根据您的喜好进行选择。
3.订阅采集线程数和关键词 采集线程数:如果指定几个线程,系统将生成多个线程到采集,增加采集线程数可以加快速度采集,但是如果它太高,则可能导致系统生成线程问题,但会使采集中断。建议普通计算机中两个线程的总数不超过20。如果线程数为0或负数,则系统将不会执行此采集工作。
4.信息时效:设置为10天时,该软件仅会采集最近10天内发布的有效信息,并在每次激活10天后自动删除信息。 (注意:1天是指24小时内的信息,而不仅仅是一天中的信息)
5. 关键词匹配方法:可以选择“完全匹配”和“模糊匹配”。精确匹配要求采集信息必须收录完整的关键词,而模糊匹配则允许采集仅收录关键词信息的一部分。为了避免采集无关信息,设置完全匹配更为合适。
6. 关键词匹配范围:“全文匹配”和“标题匹配”可以选择,对应于全文范围内的关键词匹配或仅匹配标题。
7.使用代理服务器:该软件允许您使用代理服务器访问网络,但是您的代理服务器必须可用并且可以匿名访问,否则该软件将无法采集网络信息。