百度搜索引擎优化原理(相关性和重要性意味着什么?索引索引中的行为有哪些?)

优采云 发布时间: 2022-02-19 17:21

  百度搜索引擎优化原理(相关性和重要性意味着什么?索引索引中的行为有哪些?)

  指数

  索引是将有关网页的信息添加到搜索引擎索引的行为,该索引是一组网页 - 一个数据库 - 收录有关由搜索引擎蜘蛛抓取的页面的信息。

  索引内容和组织:

  每个网页内容的性质和主题相关性的详细数据;

  · 每个页面链接到的所有页面的地图;

  · 任何链接的可点击(锚)文本;

  · 关于链接的附加信息,例如它们是否是广告、它们在页面上的位置以及链接上下文的其他方面,以及接收链接的页面的含义......等等。

  索引是百度等搜索引擎在用户向搜索引擎输入查询时存储和检索数据的数据库,在决定从索引中显示哪些页面以及按什么顺序显示之前,搜索引擎会应用算法来帮助对这些页面进行排名。

  排行

  为了向搜索引擎的用户提供搜索结果,搜索引擎必须执行一些关键步骤:

  1. 解释用户查询的意图;

  2.在索引中识别与查询相关的网页;

  3.按相关性和重要性对这些页面进行排序和返回;

  这是搜索引擎优化的主要领域之一,有效的 SEO 有助于影响这些网页对相关查询的相关性和重要性。

  那么相关性和重要性是什么意思呢?

  相关性:页面上的内容与搜索者的意图相匹配的程度(意图是搜索者试图完成的事情,这对于搜索引擎(或 SEO)来说是一项不小的任务)。

  重要性:他们在别处引用的越多,页面被认为越重要(将这些引用视为对该页面的信任投票)。传统上,这是从其他 网站 链接到页面的形式,但其他因素也可能在起作用。

  为了完成分配相关性和重要性的任务,搜索引擎具有复杂的算法,旨在考虑数百个信号,以帮助确定任何给定网页的相关性和重要性。

  这些算法通常会随着搜索引擎努力改进其向用户提供最佳结果的方法而改变。

  虽然我们可能永远不知道像百度这样的搜索引擎在其算法中使用的完整信号列表(这是一个严密保密的秘密,并且有充分的理由,以免某些*敏*感*词*使用它来对系统进行排名),但搜索引擎已经揭示了一些基础知识通过与网络出版社区分享知识,我们可以用来创建持久的 SEO 策略。

  搜索引擎如何评估内容?

  作为排名过程的一部分,搜索引擎需要了解其搜索的每个网页内容的性质,事实上,百度非常重视网页内容作为排名信号。

  2016 年,百度证实了我们许多人已经相信的:内容是页面排名的前三个因素之一。

  为了理解网页的内容,搜索引擎会分析网页上出现的单词和短语,然后构建一个称为“语义图”的数据地图,这有助于定义网页上概念之间的关系。

  您可能想知道网页上的“内容”实际上是什么。独特的页面内容由页面标题和正文内容组成。在这里,导航链接通常不在等式中,这并不是说它们不重要,但在这种情况下,它们不被视为页面上的唯一内容。

  搜索引擎可以在网页上“看到”什么样的内容?

  为了评估内容,搜索引擎在网页上查找数据来解释它,并且由于搜索引擎是软件程序,它们“看到”网页的方式与我们看到的非常不同。

  搜索引擎爬虫以 DOM 的形式(如我们上面定义的)查看网页。作为一个人,如果你想看看搜索引擎看到了什么,你可以做的一件事就是查看页面的源代码,你可以通过在浏览器中单击鼠标右键并查看源代码来做到这一点。

  

  这和 DOM 的区别在于我们看不到 Javascript 执行的效果,但是作为人类我们还是可以用它来学习很多关于页面内容的,页面上的 body 内容经常可以找到在源代码中,以下是上述网页中一些独特内容的 HTML 代码示例:

  除了页面上的独特内容外,搜索引擎爬虫还会向页面添加其他元素,以帮助搜索引擎了解页面的内容。

  这包括以下内容:

  · 网页元数据,包括HTML代码中的标题标签和元描述标签,在搜索结果中用作网页的标题和描述,应由网站的所有者维护。

  · 网页上图像的alt属性,这些是网站所有者应该保留的描述图像内容的描述。由于搜索引擎无法“看到”图像,这有助于他们更好地了解网页上的内容,并且对于使用屏幕阅读器描述网页内容的残障人士也起着重要作用。

  我们已经提到了图像以及 alt 属性如何帮助爬虫了解这些图像的含义。搜索引擎看不到的其他元素包括:

  Flash 文件:百度表示可以从 Adob​​e Flash 文件中提取一些信息,但这很困难,因为 Flash 是一种图像介质,设计人员在使用 Flash 设计 网站 时,通常不会插入有帮助的解释文件内容的文本,许多设计师采用 HTML5 作为 Adob​​e Flash 的替代品,它对搜索引擎很友好。

  音频和视频:就像图像一样,搜索引擎很难在没有上下文的情况下理解音频或视频。例如,搜索引擎可以从 Mp3 文件中的 ID3 标签中提取有限的数据,这也是许多出版商将音频和视频连同文字记录一起放在网页上以帮助搜索引擎提供更多上下文的原因之一。

  程序中收录的内容:这包括在网页上动态加载内容的 AJAX 和其他形式的 JavaScript 方法。

  iframe:iframe 标签通常用于将您自己的 网站 中的其他内容嵌入到当前页面中,或者将其他 网站 中的内容嵌入到您的页面中 百度可能不会将此内容视为您网页的一部分,特别是如果它来自第三方 网站。从历史上看,百度一直忽略 iframe 中的内容,但在某些情况下,这条一般规则可能存在例外情况。

  综上所述

  面对 SEO,搜索引擎似乎很简单:在搜索框中输入查询,然后噗!显示你的结果。但是这种即时演示是由一组复杂的幕后流程支持的,这些流程有助于识别与用户搜索最相关的数据,因此搜索引擎可以寻找食谱、研究产品或其他奇怪和难以形容的东西。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线