文章采集组合工具,让你快速上手和掌握它

优采云 发布时间: 2021-03-13 08:00

  文章采集组合工具,让你快速上手和掌握它

  文章采集组合工具deagent是google推出的,它把采集(如googleapi)、在线投票和社交媒体分析这三种最常用的三个功能集成在一起,可以快速地同时解决上述问题。即使是你暂时离开google、不想在“谷歌”上找到你满意的客户(实际上你总会有),deagent也能让你轻松从googleapi和facebook上采集来自社交媒体的信息。

  我们会以“美国员工是否知道公司在卖廉价产品”这个问题作为示例,让大家快速上手和掌握它。请注意,这只是案例,无法作为完整网站的任何细节。首先,我们在google上找到了美国公司“hentoncompany”(亨特企业)的产品广告和客户合同,也就是包含相关信息的图片。这里使用的是英文,因此,谷歌是找不到的。

  但我们可以找到一个网址:-us,它使用了googleapi:"alt":"london",如下图所示:那么接下来,我们需要用到deagent软件中的投票功能。首先,打开我们deagent-->preferences-->feedsonlyinthechromewebstore,添加一个信息,名为“hentoncompany",如下图所示:可以看到,这个“hentoncompany”的页面名称是“hotmail”,然后我们输入"hotmail",就能看到“哈佛大学推荐?”这样的类似的结果。

  其中,这个“哈佛大学推荐”的链接就是postword的服务页面,即在网站找到的json地址。如果是以“哈佛大学推荐”作为地址而不是以“hotmail”作为地址,它就会返回“ah!youreallydon'tknowhere!/googleapiserverd:google/hostnameby'google/hostname'”这样的结果,这就不是合适的地址了。

  接下来,需要转向deagent客户端。deagent客户端使用的是谷歌推出的一个googlewebservicesapi,可以同时提供jsonurl地址和查询。下面是这个api的简单介绍:deagent客户端内置了jsonapi提供给我们查询网页上a、b、c、d列出的信息。这些信息可以是来自谷歌、facebook、apple、雅虎、百度这样的实体搜索引擎或其他文档类搜索引擎,还可以是来自facebook、google+、wikipedia等社交媒体,或者来自在线视频网站、电子邮件网站等等。

  通过使用这些api,你可以提供各种实体和文档类的搜索结果。例如,我们的文档类搜索结果就包含在列表中。正如你所看到的,它返回的不是查询完整链接,而是包含查询alt+关键字+service名称的查询,如下所示:因此,如果你想要获取美国员工之类的关键词的查询,只需要把关键字和service名称写入deagent的地址列表中即可。

  该网址列表可以在下面这个页面看到:/vwjcdes?lang=enalt通过service名称来指定关键字,而service就是。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线