Google如何搜集互联网信息、不计其数的趋势信息和Google用户

优采云 发布时间: 2021-06-25 00:31

  Google如何搜集互联网信息、不计其数的趋势信息和Google用户

  如果你问别人什么是权力。培根会说“知识就是力量”,谷歌会说“信息就是力量”,有人会说“隐私就是力量”。不用说,谷歌早就认识到信息(数据)的力量。我相信其他公司,无论是互联网公司还是其他类型的公司,都应该或多或少意识到这一点。否则哪里会出现贩卖用户信息的情况?本文主要讲谷歌如何采集互联网信息,无数的趋势信息,以及关于谷歌用户(包括你我)的信息。

  如果你问别人什么是权力。培根会说“知识就是力量”,谷歌会说“信息就是力量”,有人会说“隐私就是力量”。不用说,谷歌早就认识到信息(数据)的力量。我相信其他公司,无论是互联网公司还是其他类型的公司,都应该或多或少地意识到这一点。否则哪里会出现贩卖用户信息的情况?

  本文主要讲谷歌如何采集互联网信息,无数的趋势信息,以及关于谷歌用户(包括你我)的信息。

  那么 Google 知道多少关于您的信息?你的上网习惯呢?请坐下来,登录您的 Google 帐户,查看您正在使用的 Google 服务列表。您会知道自己向 Google 提供了多少信息。

  图 2:登录 Google 帐户后的“我的产品”

  (注:此图片中的产品因人而异。只要您在登录 Google 帐户时使用过某项服务,它就会自动添加到此列表中。)

  这些服务造成了许多隐私问题。 2009 年底,谷歌 CEO 埃里克·施密特曾说过:“如果你有不想让别人知道的东西,也许你不应该那样做。” (这听起来有点像“别伸手”,伸手就会被抓住。)

  那么现在让我们来看看 Google 如何从您那里采集您的信息。

  Google 信息采集渠道

  Google 的使命是:“整合全球信息,让所有人都可以使用,并使所有人受益。”它也很好地履行了这一承诺。但是,Google 采集的信息似乎比我们意识到的要多。

  1.搜索(网页、图片、新闻、博客等)——众所周知,谷歌是全球最受欢迎的搜索引擎,全球市场占有率接近70%(例如美国66%)。谷歌跟踪所有搜索,其目前的搜索方式越来越个性化,个性化势必会越来越精细。

  2.点击搜索结果——谷歌不仅知道我们在寻找什么,它还知道我们点击了哪些搜索结果。 (编者注:这位SEO朋友应该很清楚,可以从谷歌分析中知道。)

  3. 网络搜索-Google 的网络爬虫 Googlebot 是一只不知疲倦的小蜜蜂,不断“阅读”和收录 数十亿个网页。

  4. 网站Analysis-Google Analytics 是目前最流行的网站 分析工具。因为它是免费的,并且支持多种高级功能,全球有大量网站在使用。

  5. 广告服务——Adwords 和 Adsense 是谷歌财务成功的基石,但它们也为谷歌提供了大量有价值的数据。网民点击了那些广告,广告商在争夺哪些关键词,哪些关键词最有价值,等等。这些信息非常有用。

  6. Email-Gmail 是全球三大电子邮件服务之一,面临来自微软 Hotmail 和雅虎电子邮件的竞争。可以解析和分析电子邮件的内容,包括发送和接收的内容。即使从安全角度来看,这也是 Google 提供的一项出色服务。 Google 的电子邮件安全服务 Postini 需要接收来自大量 Gmail 用户的大量数据,包括垃圾邮件、恶意软件和电子邮件安全趋势数据。 (编者注:2007 年,Google 以 6.25 亿美元收购了互联网安全服务提供商 Postini,以便为 Google 的小型企业客户提供更好的电子邮件安全服务。)

  7.推特-“你说有些推特消息是我们的”,这句话用来解释早期的互联网快速传播现象(也称为“互联网爆炸现象”)。 2009 年与 Twitter 达成协议后,Google 可以直接访问 Twitter 上的所有新闻。

  8.谷歌应用服务(文档、电子表格、日历等)——谷歌的办公套件用户众多,当然也是谷歌的数据采集源。

  9. Google 的公开*敏*感*词* - Google 鼓励您在互联网上公开您的*敏*感*词*。这些*敏*感*词*包括您在网站(Facebook 或 Linkedin)中活跃的社交网络、您的个人主页和在线图片等。等等。

  10.Orkut-虽然谷歌的社交网络不是很成功,但Orkut在巴西和印度取得了很大的成功。 (编者按:为什么还没有成功?请参考博乐在线的这篇文章:“Google 的社交网络为什么还没有成功”。)

  11.谷歌公共DNS——谷歌于2009年底推出的DNS服务,不仅帮助网民获得更快的DNA解析,也帮助谷歌自身。因为通过这项服务,谷歌可以获得很多统计数据,比如哪些网站网友访问了。

  12. Chrome 浏览器-Chrome 可以采集您的浏览器行为以及您访问的网站。

  13.谷歌财经-除了财务数据,用户在谷歌财经上搜索和使用的信息都是谷歌的重要数据。

  14.YouTube-这是目前世界上最大和最受欢迎的视频网站,归谷歌所有。它还为 Google 提供了大量关于用户观看习惯的数据。

  15. Google Translate - 帮助 Google 改进其自然语言分析和翻译。

  16.Google Books——虽然现在不是很大,但有潜力帮助Google了解网民的阅读习惯和想读什么。

  17. Google 阅读器-迄今为止世界上最受欢迎的提要阅读器。您订阅了哪些 RSS 提要?你在看哪些博客文章?谷歌会知道。

  18. Feedburner - 许多博主使用 Feedburner 发布他们的 RSS 提要。 Google 会跟踪 Feedburner 的每个链接。

  19.谷歌地图和谷歌地球-你对哪里感兴趣? (谷歌也会知道)

  20. 您的联系人网络——您在 Gtalk、Gmail 等上的联系人构成了一个错综复杂的用户网络。如果都用谷歌,网络映射就更深刻了。虽然我们不知道谷歌有没有做到这一点,但上面的数据是可以采集的。

  即将推出 - Chrome 操作系统和其他可能取得成功的 Google 产品。

  新推出的即时搜索和Goo.gl等服务

  Destroyed-Google Wave 等(虽然已经死了,但是死前应该采集一些数据。)

  由于 Google 的产品太多,所以上面的列表会扩大。现在,您应该已经知道要点了。

  图 3:Google 服务列表

  这些数据(由 Google 采集)大部分都是匿名的,因此并不总是正确的。日志可保存9个月,服务相关cookies可保存18个月。即便如此,对于大多数公司来说,谷歌持有的一般用户数据仍然具有很大的竞争优势,是名副其实的金山。

  谷歌——停不下来的数据采集机器

  Google 采集数据的方式有很多种。登录站点时产生的IP地址请求用于设置和跟踪目标cookie。如果您登录您的 Google 帐户,您在 Google 的网站 上的一举一动通常都可以链接到您的个人帐户,而不是您的计算机。

  简而言之,如果你使用谷歌的服务,谷歌就会知道你在搜索什么,你访问过什么网站,你读过什么新闻和博客等等。随着谷歌增加更多的服务,它的曝光率会更高范围广泛,几乎所有内容都将被称为“Google 化”。

  编者注:Googlization 的意思是“Google 化”,由 Ohn Batelle 和 Alex Salkever 于 2003 年创造。

  您使用任何单个 Google 服务提供的数据,您无需为此烦恼。当您使用多个 Google 服务时,就会出现真正有趣的困境。今年谁不是?

  您可以尝试在没有任何 Google 服务的情况下上网一周。这意味着没有 YouTube,没有 Gmail,没有 Google Docs,没有 Feedburner 的链接,没有 Google 搜索引擎等等。严格来说,你甚至必须避免与 Google 合作的服务,所以,我很抱歉,Twitter不能用,(编者按:无论你是否使用梯子,都不要使用YouTube和Twitter)

  这种日益增长的 Google 化可能是某些人不想使用 Google Chrome 操作系统的原因。因为 Chrome OS 可以强力整合 Google 的多项服务,很可能会为 Google 提供前所未有的关于您的习惯的数据。

  谷歌为什么要这样做?

  正如本文开头所说,信息就是力量!

  利用这些信息,Google 可以非常有效地整合数据。除了每个用户或访问者之外,Google 还可以检测整个城市或国家/地区的趋势和行为。

  Google 采集的信息用于多种用途。在 Google 活跃的所有领域,采集的数据可用于制定市场决策、研究和改进产品。

  例如,如果您能提前发现特定的市场趋势,就可以有效地对市场做出反应。如果您能找到人们正在寻找什么以及他们需要什么,您就可以根据这些发现做出决定。当然,这对于像 Google 这样的大公司来说非常有用。

  别忘了,Google 的大部分收入都来自广告。 Google 越了解您,其广告为您提供的服务就越有效,这也会直接影响 Google 的底线。

  不只是(顾)哥这样做

  必须指出,Google 并不是唯一一家进行此类数据采集的公司。别担心,微软也在用 Bing 和 Hotmail 做类似的事情。这只是一个例子。

  谷歌的问题(如果你想称之为“问题”)是它就像一只大章鱼,触手伸向每一个角落。谷歌已经变得如此混合,以至于它涵盖了我们在线生活的方方面面。 Google 掌握了有关我们(在线运营)行动、行为和关系的前所未有的大量信息。

  图 4:谷歌是一只章鱼?

  访问谷歌数据库

  值得称赞的是,Google 正在使用其通过各种服务采集的数据来进一步为您提供服务。

  谷歌趋势

  Google网站 趋势

  谷歌搜索分析

  Google 广告计划

  Wonder Wheel 等其他搜索工具

  如果谷歌能发布这么多数据,你可以想象谷歌知道的数据量和详细程度。而且这些服务还可以向谷歌提供更多的数据,比如我们对哪些趋势感兴趣,我们在寻找哪些网站等等。

  在使用谷歌趋势等这些工具时,我们发现了一个有趣的现象:我们几乎可以知道一切,但我们就是无法知道谷歌自己的产品。例如,“谷歌广告计划”和“谷歌网站潮”在谷歌自己的网站上不显示信息,但你可以在其他网站上找到信息。

  这太讽刺了!昨天“谷歌广告计划”更新了2010年9月的“全球Top1000网站”数据。你可以像Facebook一样看到网站的每月独立访问者和PV,但在谷歌下却看不到网站的数据.

  天下没有免费的午餐

  您有没有想过为什么几乎所有的 Google 服务都是免费的?好的,你现在知道答案了。还是那句老话:天下没有免费的午餐。您可能不向 Google 付费(除了点击 Google 广告),但您已经为信息付费。虽然这不一定是坏事,但您应该了解并注意这一点。

  最后,请问哪位朋友知道非谷歌公司是如何采集隐私的?哦,对不起,我错了,你是怎么采集数据的。欢迎在评论中共同交流。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线