网页抓取qq( 谷歌宣布抓取海量APP300多页页面内容和信息量开发商合作 )
优采云 发布时间: 2021-10-17 23:10网页抓取qq(
谷歌宣布抓取海量APP300多页页面内容和信息量开发商合作
)
<IMG alt="APP不再是信息孤岛 谷歌宣布抓取300亿APP页面" src="http://img1.gtimg.com/tech/pics/hv1/98/165/1822/118517723.jpg">
腾讯科技新闻搜索引擎是继内容门户之后的互联网第二次重大技术革命。但是,随着智能手机的普及,应用软件(APP)已经取代了网页,成为主流技术。由于APP的内容一时间无法被搜索引擎抓取,人们惊呼移动互联网将给搜索引擎带来生存危机。
不过,通过与应用软件开发商的合作,谷歌()在一定程度上解决了这一危机。日前,谷歌宣布从大量APP中抓取了超过300页的内容。手机上搜索的信息量也会更加丰富。
谷歌搜索团队在 4 月 16 日的官方博客文章中宣布了这一消息。
谷歌工程师 Rajan Patel 向媒体透露,谷歌两年前就开始抓取外部应用的内部链接和内容,目前累计抓取超过 300 亿。
在传统的WEB页面中,谷歌可以通过软件“蜘蛛”自动访问和抓取,无需网站管理员的许可。
在App内容的抓取上,谷歌需要与应用软件开发商建立合作。谷歌提供了相应的软件开发接口(API),开发者可以通过这些接口向谷歌搜索开放数据,从而实现搜索引擎的内容抓取。
据悉,已有大量移动端软件与谷歌合作,包括微博Twitter、短租工具Airbnb、消费者点评工具Yelp、手机订餐工具OpenTable、图片采集社交网络Pinterest、房地产搜索工具Trulia以及很快。
当然,还有大量的移动媒体应用,也被谷歌抓取用于新闻报道。
超过 300 亿个链接的内容与 Google 抓取的网络数据库相比微不足道。此前有报道称,谷歌蜘蛛抓取的网页数量高达数百亿。
然而,在智能手机时代,人们使用搜索的目的更加明确,拥有更多的场景信息。因此,主流应用和超过300亿个链接足以为用户提供所需的信息。
据介绍,此前在手机上进行搜索时,谷歌客户端会观察用户智能手机中安装了哪些应用,谷歌只会返回已安装应用的搜索结果。
日前,谷歌团队还宣布,对收录在搜索结果中的APP进行了修改。即使用户没有安装某个APP,只要有相关性,它的内容就会出现在搜索结果中。
例如,如果用户的手机中没有安装点餐工具OpenTable,但在搜索餐厅时,谷歌仍可能会从OpenTable中呈现消费者评论信息。
不过,对于谷歌来说,能够抓取大量APP的内容,并不意味着它已经彻底摆脱了“搜索危机”。
有观点认为,在智能手机端,手机一族希望以最快的速度获得最准确的搜索结果,因此各种专业APP逐渐取代了传统网页搜索的地位。例如,人们可能会在流行的团购应用中搜索当地餐馆和电影,而不是在 Google 中输入 关键词,然后查看庞大网络的结果。
手机上搜索消费者行为的变化也给谷歌的发展前景蒙上了一层阴影。Google 90% 的收入来自搜索结果右侧的搜索广告。如果人们远离电脑和传统搜索引擎,谷歌将成为一个非常危险的公司,没有可观的替代收入。(黎明)
<IMG alt="APP不再是信息孤岛 谷歌宣布抓取300亿APP页面" src="http://img1.gtimg.com/tech/pics/hv1/62/109/1810/117723107.jpg">