百度搜索引擎优化原理(如何建立索引(收录)、反思一下我们应该如何来做?)
优采云 发布时间: 2022-01-08 20:23百度搜索引擎优化原理(如何建立索引(收录)、反思一下我们应该如何来做?)
百度今年过得真不好。首先,我不谈论它自己的收入损失。后来百度老将(S先生)被带走,估计生意会亏很多。后来听说收到YY了,好像亏了100+。1亿(以上整理于网络)
不知道百度不好,影响了李达的心情。现在,对于 SEO,收录 也不好。从最初的熊掌号,到百度快车收录,再到后来的MIP,再到一无所有,一切如丝般顺滑,让广大SEO收录无处可去!
现在就做个前奏,说一下百度收录的一些原理,以及其中蕴含的机会。我希望每个人都能理解搜索引擎是如何工作的收录。
上图是百度蜘蛛爬取页面并创建索引的*敏*感*词*。从图中可以看出,建立索引(收录)的前提是爬取。下面只是从我的角度,给大家讲一下搜索引擎爬取,确立收录的原理,反思一下应该怎么做!
1、获取网址
就目前的搜索引擎而言,它有自己的收录 数据库。根据现有的收录库,爬取新的页面;或者通过百度站长工具平台提交的数据发现新的页面。
为什么现在收录很难做,和提交界面直接相关(现在提交界面基本无效,没有蜘蛛,更别说收录了);和之前的熊掌一样,快收录权限界面和提交基本都是隔天收录;现在不是酒香不怕巷子深的时代。
2、解析文档
当百度的爬虫队列抓取到足够多的网址时,百度就开始抓取这堆网址,解析文档,判断页面主题和页面质量。然后通过【去重算法】和一些算法,去掉一些低质量的页面。
3、索引
搜索引擎读取并解析文档后,选择一些优质的页面,然后将这些优质的页面通过一些算法、分类、倒排索引,然后加入百度数据库,基本完成了索引。
以上三步基本可以帮你搞清楚百度是如何搭建收录(索引)的,那么我们就来一波逆推,说说收录的机会吧!
从把握的角度
根据[1]中的描述,搜索引擎发现新的URL有两种方式:1、通过已有的可信URL发现新的URL;2、 通过百度提交界面发现URL。
对于第一种方法,如果我们做收录,我们完全可以发送外部链接。根据抗冬学徒的实战验证,外链确实可以改进收录。
其实还有另一种方式,就是蜘蛛池;其实很多人并不了解蜘蛛池的原理。蜘蛛池的原理其实就是将我们想要的URL插入到大量的页面中。可以自己查~
对于第二种方法,百度的提交现在基本没用了,倪东亲自测试了10个网站,不管域名有没有被归档,现在一个月都没有被索引。
总结一下:如果你不使用收录的方式增加URL出现在蜘蛛面前的机会,你就是在玩流氓!
从解析文档的角度来看
从解析文档的角度来看,百度需要的是高质量的页面,而不是垃圾页面。前面说了,优质的页面主要和自己页面的模板和内容质量有关。可以从这两个方面来提高!
SEO不会死,只会淘汰一批低素质的SEOer,留下一小部分优质的SEOer。困难并不意味着问题,挑战和机遇往往并存。物竞天择,适者生存,希望我们只是幸存者!