谷歌抓取网页视频教程( 谷歌的工程师讲解的谷歌平台的工作原理是什么?)
优采云 发布时间: 2022-01-15 18:15谷歌抓取网页视频教程(
谷歌的工程师讲解的谷歌平台的工作原理是什么?)
大家都用搜索引擎,比如百度、谷歌、搜狗、360,这些都是大家都用的。它们向我们展示了我们想要搜索的内容,但是您知道这些搜索引擎是如何工作的吗?它们是如何工作的?让我们听听 Google 工程师怎么说。
当我们用谷歌搜索时,我们实际上并不是在搜索网页,而是在搜索谷歌的网页索引。搜索是通过称为“蜘蛛”的爬虫进行的。“蜘蛛”先爬取少量网页,然后跟踪这些网页上的链接,再爬取这些链接指向的网页,然后追踪这些网页上的所有页面。链接,并爬取它们链接到的页面,等等。在几乎所有网页都被索引之前,它存储了来自世界上所有计算机的数百亿个网页。
例如,如果我想知道高铁的运行速度,我在搜索框中输入“高铁速度”,点击搜索按钮后,它会搜索这些索引,找到所有的网页收录这些搜索词,然后系统将显示收录 关键词 的数千个结果。
谷歌如何给我们想要的确切答案?取决于关键字在网页上出现的频率,也取决于关键字是否出现在标题、内容或网址中,包括是否有同义词等一系列条件逐层过滤。页面的PR值也应该考虑。PR值为PageRank,即页面排名。PR值越高,页面的权重和重要性就越高。
最终,搜索引擎会结合所有因素对每个页面进行评分,并在我们提交搜索后立即显示搜索结果。
以上是谷歌工程师讲解的谷歌平台工作原理。虽然我们平时使用的搜索引擎比较多,比如百度、搜狗、360,但是它们的工作原理是一样的。