解决方案:关键词网址采集器 2.0.2.0 绿色版

优采云 发布时间: 2021-01-12 08:12

  解决方案:关键词网址采集器 2.0.2.0 绿色版

  关键词URL采集器绿色版是一款可以帮助用户按关键词继续进行采集网站的软件,其中用户可以快速采集指定的关键词网站,以减少其他网页的外观。

  

  概述

  输入关键字采集每个搜索引擎的URL,域名,标题,描述和其他信息,支持百度,搜狗,谷歌,必应,雅虎,360等。每个关键词600至800个项目,采集例如,关键词可以附带搜索引擎参数,就像在网页中输入关键词搜索一样,例如,百度中的搜索结果URL必须收录关键词bbs,然后输入“ 关键词inurl :bbs。“

  数据参考

  #URL#:采集的原创网址

  #Title#:URL对应的网页标题

  #domain#:原创URL的域名部分,例如“”中的“”

  #顶级域名#:采用原创URL的顶级域名部分,例如“”中的“”

  #Description#:页面标题下方的描述文本

  常见问题

  1.为什么采集过一会儿不能采集?

  这可能是采集受到搜索引擎的更多限制,请重新启动软件以继续采集,如果不进行更改,则只能在取消阻止搜索引擎采集后才能继续。百度的屏蔽时间通常为半小时到几个小时。

  但是,即使验证码被阻止,该软件也会弹出手动输入的验证码(百度,Google)

  2.不同批次的关键词采集结果中有一些重复的网址?

  尤其是仅引用#domain#或#top-level domain#之后,这种部分URL复制更为常见。这也是正常现象,因为每个网站的内页可能收录许多主题,并且采集的不同内页可能与采集不同。引用域名时,同一网站页的不同内部页面自然会具有相同的域名结果。

  此*敏*感*词*内。如果两个采集的结果中有重复的URL,则可以将它们合并在一起,并使用软件删除重复项(优采云·重复数据删除加扰器)。

  3.为什么采集返回的URL主题与关键词不匹配?

  因为在引用#domain#或#top-level domain#后,将采用域名部分。域名打开网站的主页,采集的原创URL可能不是主页,但是网站文章文章的内页,该内页收录以下主题: 关键词,因此可以通过搜索引擎收录和软件采集获得。但是在获取域名后,您打开的域名的首页可能不收录关键词。

  为了比较采集是否正确,您可以在保存模板中输入:,将其另存为htm文件,在采集之后,您可以打开文件以查看比较。

  更新日志

  1.已转换为支持OEM代理

  2.添加了必应和Yahoo 采集;多次更改

  3.将Bing,Yahoo,Google更改为https请求,以在某些情况下避免采集失败。

  4.添加了百度新闻采集。

  5.一些更新。

  6.添加了关键词分界线选项。

  7.修复了百度的最新更改不能为采集的问题。

  8.修复了必应更改失败的问题采集;修复了某些计算机无法使用xmlhttps(涉及Google,Bing,Yahoo)的问题。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线