谷歌搜索引擎的基本结构搜索排名略有不同?

优采云 发布时间: 2021-07-14 20:32

  谷歌搜索引擎的基本结构搜索排名略有不同?

  “Google 搜索”和“雅虎搜索”是日本的主要搜索引擎。虽然您可能认识很多人,但两个搜索引擎都使用 Google 提供的搜索技术。根据每个公司处理的业务和政策,搜索排名略有不同,但在这里我想看看谷歌搜索引擎的机制。

  

  搜索引擎的基本结构

  搜索引擎只收录三个程序,“爬虫”、“索引器”和“搜索器”。

  

  曲目

  我们在 Internet 上抓取网页并采集信息(抓取)。

  索引

  对爬虫采集到的信息进行分析,根据需要将其转换成可即时检索的数据格式,并存储(索引)到数据库中。

  搜索

  根据用户的搜索关键词,从数据库中索引器存储的信息中提取相关信息,并根据相关程度和重要程度确定排名,作为搜索结果传输。

  当搜索正在进行时,必须采取行动。与搜索关键字“查询执行”相关的信息列表用于对列表中的网页进行排名,其机制和行为称为“搜索算法”。

  搜索引擎信息采集“抓取”

  爬虫采集数据,包括互联网上的网页。 Crawler 是一个围绕 Internet 的程序。我们称之为“爬虫”爬虫

  在网站 内移动以采集信息。未抓取的信息一开始就不能成为搜索的对象,所以在你的网站上调用爬虫是搜索引擎衡量的起点。

  爬虫以人们浏览网站的相同方式读取页面上的信息,并跟随链接移动到另一个页面站点。除了构成网页的 HTML 文件中的链接外,PDF、Word 等文档中的链接以及 JavaScript 生成的链接也需要巡查。

  使用 Google Fetch 方法请求抓取工具

  “Fetch as Google” 这是Google 提供的Google Search Console 工具提供的功能之一。通过使用此功能,您可以请求抓取,而无需等待抓取工具自然出现。 Search Console 帮助:将 Fetch 用作 Google 的 网站

  搜索引擎信息存储“索引”

  索引器对爬虫采集的信息进行组织和分析,将其转换为可根据需要即时检索的数据格式,并存储在数据库中。我们称之为“索引”。

  与人不同,索引器无法直观地理解内容。例如,如果将其视为标题,则即使理解在页面顶部突出显示的字母很大,它也不会传递给索引器。因此,我们使用如下所示的 HTML 标签来表示这是一个标题。

  示例)此博客的标题

  对业务和 IT 有用的信息

  

  HTML 源代码

  

  除了标题,您还将了解带有各种 HTML 标签的网页的句子结构和内容,例如标题和图片内容。如果索引器能够准确理解页面内容,页面信息就会以正确理解方式存储,从而创造一个用户可以轻松将信息与搜索用户匹配的环境。

  搜索引擎排名“搜索算法”

  搜索结果的排名由“搜索算法”决定,但搜索算法尚未公布,排名决定机制也未公开。

  但是,Google 告诉了以下搜索引擎应该如何。

  谷歌联合创始人拉里佩奇说:“完美的搜索引擎是一种能够准确把握用户意图并返回与用户需求完全匹配的内容的引擎。”从这句话开始,谷歌一直在不断进化。 ..... 拉里话中的真意没有变。 Google:引用自公司信息

  换句话说,搜索引擎是“向用户提供有用信息”的机制。

  重要的是有意识地只关注搜索引擎,在不失其本质的情况下提供用户需求高的信息。

  总结

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线