怎样使用优采云采集指定网站内容?
优采云 发布时间: 2016-12-18 11:42
该功能依托于私有词库功能。私有词库使用教程>>>
为提高方便性,现私有词库已作如下调整:
1. 每个栏目至少添加5个关键词的限定,现已取消,但仍然建议尽量多设置关键词,否则越到后期采集效率越低。
2. 私有词库现在提供删除功能。
要采集指定网站,只需要在填写关键词时,在关键词之前添加"site:www.site.com"这样的前缀(域名不加http://或https://),就跟使用搜索引擎的site功能一样。
如果想要采集目标网站所有内容,则后面不跟关键词。
如果想要采集目标网站指定内容,则在site:www.xxx.com后面添加相应关键词,中间用空格隔开。 注意:仍然是每行一个关键词,site命令只对其所在行的关键词生效,允许任意混合模式:部分关键词指定网站,另一部分关键词不指定,则全网采集。
其他操作跟就普通私有词库一样。
为提高方便性,现私有词库已作如下调整:
1. 每个栏目至少添加5个关键词的限定,现已取消,但仍然建议尽量多设置关键词,否则越到后期采集效率越低。
2. 私有词库现在提供删除功能。
要采集指定网站,只需要在填写关键词时,在关键词之前添加"site:www.site.com"这样的前缀(域名不加http://或https://),就跟使用搜索引擎的site功能一样。
如果想要采集目标网站所有内容,则后面不跟关键词。
如果想要采集目标网站指定内容,则在site:www.xxx.com后面添加相应关键词,中间用空格隔开。 注意:仍然是每行一个关键词,site命令只对其所在行的关键词生效,允许任意混合模式:部分关键词指定网站,另一部分关键词不指定,则全网采集。
其他操作跟就普通私有词库一样。