关键词 采集(这款软件,只需要输入关键字就可以采集各搜索引擎收录信息)

优采云 发布时间: 2021-12-20 21:15

  关键词 采集(这款软件,只需要输入关键字就可以采集各搜索引擎收录信息)

  分享是一切,但价值是关键。相遇不易,请珍惜。

  使用本软件,您只需在采集各个搜索引擎收录的网址、域名、标题、描述等信息中输入关键字即可。

  

  优采云·关键词网址采集器

  搜索引擎支持:搜狗、谷歌、雅虎、百度、360、必应等。

  关键词可以收录搜索引擎参数,就像在网页中输入关键词搜索一样,如果百度搜索结果URL必须收录bbs的关键词,则输入“关键词网址:bbs。”

  Excel导出:

  CSV是一个文本表格,Excel可以显示为多列多行数据。只需在保存模板中设置为:

  “#URL#”、“#title#”、“#描述#”

  此格式为 csv 格式。每个项目用引号括起来,多个项目用逗号隔开,然后保存扩展名,填入csv。

  保存模板可以引用的数据:

  关于#URL#

  采集对象的网站 URL

  关于#Title#

  网站标题

  关于#domain#

  取原网址,不要添加/.html、/index.php等,如“xxxxx/1.html”中的“xxxxx com”

  关于#顶级域#

  顶级域名,不要添加二级和三级域名,如“muge.xxxxx/1.html”中的“xxxxx com”

  关于#描述#

  页面标题下方的一段描述性文字

  部分软件使用问题解答:

  1.为什么采集返回的URL主题与关键词不匹配?

  这是因为在引用#domain# 或#top-level domain# 后,取的是域名部分。域名打开网站的首页,采集的原网址可能不是首页,而是网站文章的文章内页,内页收录关键词的主题,所以可以通过搜索引擎收录和软件采集获取。但是获取域名后,您打开的域名首页可能不收录关键词。

  为了比较采集是否正确,可以在保存模板中输入:

  , 保存为htm文件,采集后可以打开文件查看对比。

  2.不同批次的关键词采集 为什么有些重复的网址?

  尤其是只引用#domain#或#top-level domain#后,这种部分URL重复的情况更为常见。这也是正常的,因为网站的每个内部页面可能收录很多主题,而不同的关键词可能会采集去不同的网站内部页面,当域name是引用的,同一个网站的不同内页的域名结果自然是一样的。

  另*敏*感*词*内。如果两个采集的结果中存在重复的URL,可以将它们合并在一起,使用软件去重(优采云·text deduplication scrambler)。

  3为什么一段时间后采集不能采集?

  可能是采集受搜索引擎限制比较多。一般可以通过更改IP来继续采集(如使用VPN更改IP)。如果不改,只能在搜索引擎解封采集后继续。百度的屏蔽时间一般是半小时到几个小时。

  但是,即使验证码被屏蔽,软件也会弹出手动输入的验证码(百度、谷歌)

  百度云盘地址:

  软件正常上报病毒。不放心的话可以用360沙盒、影子系统、虚拟机等来运行软件~

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线