如何实现几万个页面能在一秒钟内做到有序排名?(图)
优采云 发布时间: 2021-08-09 22:26如何实现几万个页面能在一秒钟内做到有序排名?(图)
刚刚闲逛,南京SEO博主看到这个文章,把基础知识讲解的非常全面透彻,转来这个博客分享给大家。
当我刚接触 SEO 时,我曾经仔细观察搜索引擎。一方面,SEO本身就是靠搜索引擎生存的,我们要照顾好这个大哥;另一方面,我们想看看他是如何工作的,他是如何在一个页面上实现数万页的,在几秒钟内达到有序的排名。事实上,今天我们对这些问题有了更清晰的认识。
想要在某个搜索引擎上有一定的排名,只知道网上的那些SEO基础是不够的。我也遇到过一些朋友把自己的站排名搞上去的,但是他不知道怎么做。他跟我说的是做个外链,更新文章就上去了。我们不能排除这种可能性。毕竟关键词的竞争是不同的。但是我遇到的最多的还是排名,但是很快又掉下来了,不知道怎么维持这个排名。废话不多说,按照何涛的思路一步一步来。
一些搜索引擎的基本抓取知识
首先,我们不得不提到一个搜索引擎优化术语“蜘蛛”。这也是每个搜索引擎用来抓取和访问页面的程序,也称为机器人。在这里我将解释蜘蛛蜘蛛这个词:在我看来,他被称为蜘蛛蜘蛛的原因。因为蜘蛛是按照网上的链接代码去访问网上的每一个网站,而网站的每一个链接实际上就像一个非常复杂的网络。所有蜘蛛要做的就是在这个网上。捕捉信息的形式与蜘蛛和蜘蛛非常相似,因此也有图像隐喻。
我们知道蜘蛛蜘蛛这个词吗?事实证明,一些必须在搜索引擎中更新的数据库和排名依赖于这样的程序来抓取和检索它们,然后才能定期更新。所以换句话说:如果我们想要我们的网站有排名,我们是不是要让搜索引擎收录我们站先,想要搜索引擎收录,我们是不是要让蜘蛛爬我们的站?先站? 其实这里会有一个过程,怎么让蜘蛛爬到我们网站这里我也大致说一下:
一般来说,我们称这种方法为“链接诱饵”。也就是说,通过某种方式来吸引蜘蛛爬到我们的网站。常见的方法比如把我们刚做的网站提交给搜索引擎,发链接给高权重的网站,引导搜索引擎*敏*感*词*站,都是比较好用的方法。
先来看看蜘蛛蜘蛛的一些习性,让我们更好的掌握它,以便继续喂他,培养蜘蛛蜘蛛访问网站的速度和习惯,从而增加网站的权重并获得一定的排名
说到蜘蛛习性,我们得有个“深度优先,广度优先”的概念。我们已经提到蜘蛛蜘蛛归根结底是一个程序,网站和网站之间的链接可以引导他爬行。你有印象吗?看一些基本的SEO教程时,都提到网站结构必须是树形的,目录层次不能太深。其实这个论点来自于深度优先和广度优先。
深度优先:比如蜘蛛访问网站的链接时,他会一直跟着这个链接往下爬,直到没有更多的链接,才回到第一页,跟着另一个链接再往前爬。例如,当蜘蛛访问我们的网站主页时,它的爬行习惯一定是从导航中的某一列往下爬,它可能爬到我们的最终页面然后再次返回。
广度优先:这与深度优先有点不同。当蜘蛛在一个页面上发现多个链接时,他会先爬取第一级的所有链接,然后按照第二级页面上找到的链接爬到下一级。现在给大家看一张图来了解一下:
其实在我们的现实中,Spider Spider经常采用广度优先和深度优先的组合方式,这样我们就可以尽可能多的照顾网站(广度优先),以及@的一部分网站的内页(深度优先)
根据这种数据抓取原理,搜索引擎首先要对蜘蛛检索到的信息进行组织和存储,并为每条信息赋予一个特定的编号。
搜索引擎对索引条目的处理
我们都知道Spider Spider毕竟只是一个程序。他所做的不会通过网站的前台分析一个网站的内容,而是通过网站的代码抓取信息。而在网站的源码中我们会看到很多html、js等程序语句。而Spider Spider只对文章里面感兴趣,也就是说他只从网页中提取了一些文字。可能有朋友提到过,那我们写什么代码呢?代码不是不能用了吗?
事实上,事实并非如此。在网站的标签优化中,我们都知道,比如H标签、nofollow标签、alt标签等等。当蜘蛛蜘蛛抓取我们的网站信息时,这些标签仍然可以起到强调和修饰的作用。比如遇到一张图片,但蜘蛛无法识别图片中的信息,那么我们会考虑设置一个alt标签,帮助搜索引擎识别图片中的信息;为了不让网站的部分权重不散,我们在链接中添加nofollow。
由于搜索引擎Spider Spider对网站文字特别感兴趣,所以是针对中文SEO优化的。里面会不会有概念性的东西,那就是“分词”
最简单的例子,比如我们中文中的“网站optimization”四个词,在百度搜索引擎数据词汇表中,其实网站和优化这两个不同的词是分开存储的。当用户搜索词网站optimization时,搜索引擎的步骤是将词库网站中的网页信息与优化词库中的信息结合起来进行检索和排序。这一点将在后面讨论。
说到分词,不得不提一件事,那就是我们看网站一个分词情况:在百度搜索引擎中搜索“宁波河套SEO”。在出来的搜索结果中,我们看看网站的快照如图
我们是否容易看到快照中显示的结果?百度把这个词分成三个不同背景颜色的词组。这只是其中之一。我们在百度的搜索结果中也可以看到,只要是我们搜索到的词,就会被标记为红色。这也是分词的另一种表现。
可能有朋友说你说的这些话是个别情况。我们在实际过程中搜索的词远比这个复杂,可能会有一些模态粒子。作为一个日益复杂的搜索引擎。他们其实早就考虑过这个问题,首先是因为这些模态粒子实际上在搜索过程中没有任何作用。搜索引擎在进行预处理时,也会对这些词进行过滤。一方面是为了减轻搜索负担,另一方面也是为了增加内容的准确度。
在搜索引擎将蜘蛛抓取的信息归档之前,还有一个程度是必不可少的,他必须对内容进行反复审核。一个重要的意思:搜索引擎必须删除同一个网站中的数据。有一种情况:比如有人搜索我的网站宁波SEO,有可能我们的首页和内容页会出现在排名结果的第一页。其实,作为一个成熟的搜索引擎,这种情况是应该避免的。因为这样的内容对用户没有多大用处,就相当于同一个内容被排了两次。第二点:对于不同的网站,因为网络上有成千上万的内容。会有两个不同的网站,但内容相同。这就是我们常说的网站内容转载。搜索引擎也会考虑重复的信息进行删除和选择。
有了前面步骤的反复复习,接下来要做的就是做一个有效的数据组织。我给你看两张表,你就会明白:
正向索引
文件 ID
内容
文件 1
关键词1、关键词2、关键词7……关键词x
文件 2
关键词1、关键词7、关键词8……关键词Y
…………
……
文件 N
关键词6、关键词50、……关键词z
倒排索引
文件 ID
内容
关键词1
文件 1、文件 2、文件 10、...文件 m
关键词2
文件 1、文件 4、...文件 n
…………
…………
关键词7
文件 1、文件 2、文件 8、...文件 o
我简单解释一下上表的含义:前向索引表,是搜索引擎暂时不能直接用于排名的数据表。在此,他根据文件分配每个关键词。换句话说,主键是文件。我们切换到第二张表,看到搜索引擎已经把关键词作为主键了,这和我们搜索某个关键词时找到我们想要的信息是一样的。我们可以发现,当用户搜索关键词7时,此时搜索引擎并不需要检索每一条内容。它需要做的就是从关键词 的词汇表中提取文件 1、文件 2。文件8等
关于这些文件的排名,请看下一节。
搜索引擎如何确定网站ranking
在搜索引擎工作原理的最后一节中,应该提到搜索引擎的排名。网络上的信息被蜘蛛抓取并存储,实际上是为了终端用户搜索某个关键词搜索引擎,可以提供他真正想要的内容。
当用户搜索一个词时,搜索引擎做的第一件事就是根据需要对我们的词进行分段。这个在前面文章也有提到,原理还是一样的。 但是,在排名的处理中,搜索引擎会先进行一个交集处理。我们都知道,搜索引擎的存储是以词为单位进行存储的。比如搜索宁波SEO的时候,搜索引擎的词库会先搜索宁波这个词中收录的文件,然后再搜索SEO相关的文件。然后进行交集处理和删除选择。
在此,不得不特别提到搜索引擎中拼写纠正的处理。我们可以在百度搜索宁波SEO培训新闻,查看百度返回页值。
我们可以清楚地看到,百度会自动给出链接提示:你在找宁波SEO培训吗?之前有个朋友也跟我说,我正在考虑优化一些词。大概的意思是这样的:比如我们想做一个比较流行的关键词,但是由于我们自身的能力,我们可能会考虑优化一些错别字,就像我上面提到的那个例子,其实在我看来,并不是你这样的操作是不可能的,在用户体验上是很差的。 网站的转化率也高不了多少。
细心的朋友会问一些关于搜索引擎排名显示页面的问题:互联网上有这么多页面,百度搜索引擎在用户搜索某个词时会列出它吗?在百度搜索引擎中,他最多只会列出76页左右的关键词排名结果。因为不管给用户多少,其实都没有这个考虑,毕竟搜索引擎也会把最相关的数据排在第一位。
那么搜索引擎用什么形式来确定最终的关键词排名?
首先,我认为最重要的是我们关键词的密度。这也是我们在做SEO的时候经常会提到的一个话题。当然,也会有关键词没有出现在title和description标签中。取而代之的是他的排名。这个后面也会提到。 关键词密度的同一句话:不要太追求密度而忘记用户体验。
关键词的位置和表情。我们都知道网站的title标签权重比较高。相比之下,在其他条件相同的情况下,首页标题中出现某个关键词,排名相对比没有好。 当然,还会有其他形式,比如:加H标签,加黑等
关键词 距离。在搜索结果页面中,我们会看到我们搜索到的词会被标记为红色。但是我们经常看到,我们搜索的词都是分开的,并用红色标记。这给了我们一个信息。也就是我们在写网站标签和描述的时候,一定要考虑用户的搜索和搜索引擎的分词。尤其是百度。
网站 的页面权重。这一点绝对是重点。说到重量,肯定会涉及到外链的数量和质量。这也是我们SEO会认真做的一点。
总结
从搜索引擎的工作原理分析来看,SEO有必要了解搜索引擎,但我们也从中发现了很多规律。搜索引擎如何改变和增加用户体验是永恒的。所以在运营网站SEO的时候,应该更多的考虑让用户得到搜索引擎的认可。