seo优化搜索引擎工作原理(seo的工作大体可以分为三个阶段吗?(一))
优采云 发布时间: 2022-02-14 00:08seo优化搜索引擎工作原理(seo的工作大体可以分为三个阶段吗?(一))
SEO是网络推广的主流技术手段之一。可以说,不懂SEO不是一个合格的网络推广。虽然做seo不需要懂编程,但要了解搜索引擎的基本工作原理。从这个原理出发,你可以探索搜索引擎优化的更深层次的含义。
一般情况下,搜索引擎的工作大致可以分为三个阶段。
(1)爬爬爬爬
我们知道搜索引擎通过对大量网页进行相关性排序来生成查询结果,所以搜索引擎要做的第一步就是通过一个叫做蜘蛛和文件爬取的程序在互联网上发现新的网页,恢复海量网页数据库。该程序从搜索引擎自己的数据库中的已知网页开始,像普通用户的浏览器一样访问现有网页上的链接,并将访问的代码存储在数据库中。
蜘蛛访问一个已知网页后,它会跟随网页上的链接,从一个页面爬到下一页。整个过程就像蜘蛛在蜘蛛网上移动。这就是搜索引擎蜘蛛名字的由来。当通过链接找到一个新的 URL 时,蜘蛛将新的 URL 记录到搜索引擎自己的数据库中,等待抓取。
整个互联网由无数相互关联的网站 和页面组成。理论上,蜘蛛可以从任何页面开始爬取和爬取所有页面。搜索引擎蜘蛛爬取页面询问价格,往往与用户浏览器中看到的页面有很大不同,而蜘蛛将这些爬取的网页文件存储在数据库中以备后用。
注意:理论上蜘蛛可以爬取并爬取所有页面,但这样做是不可行的。一般来说,蜘蛛只抓取它认为重要的页面,包括网站和权限高、更新速度快的页面,还有传入链接、离首页距离近等因素。SEO工作也必须考虑这些方面,才能吸引蜘蛛爬行。
(2)预处理
预处理叶子通常被称为索引,因为索引是预处理的主要步骤。
搜索引擎蜘蛛抓取到的原创页面不能直接用于查询排名处理,而是由另一个程序分解和分析网页的价格,并以特定的形式存储在自己的庞大数据库中。这个过程就是索引。
在索引数据库中,网页的文本内容、关键词出现的位置、字体、颜色等信息都有相应的记录。预处理一般包括以下过程:文本提取、分词、去停用词、去噪、去重和索引。
(3)排名
搜索引擎将蜘蛛爬取的页面编入索引后,可以随时处理用户的搜索。用户在搜索引擎界面输入关键词,搜索引擎程序会在单机“搜索”按钮后处理输入的搜索词。
这个过程非常繁琐,中间过程对用户是不可见的,也是搜索引擎的核心机密之一。常见的搜索词处理包括中文分词、去停用词、拼写纠错、触发集成搜索等。
处理完搜索词后,搜索引擎排序程序开始工作:从索引数据库中找出所有收录搜索词(或关键词)的网页,并根据搜索引擎自己计算出哪些网页排名算法 他们应该在搜索结果的前面,那些应该在后面;然后搜索引擎将这些排序后的网页按照一定的格式输出到“搜索结果”页面,并为用户提供最终的搜索结果。
以上简单介绍了搜索引擎的工作。其实这是一个非常复杂的过程:排序算法需要实时从索引数据库中找到所有相关页面,实时计算相关性,并添加过滤算法。难以置信的。可以说,搜索引擎是当今最大、最复杂的计算系统之一。
从搜索引擎的基本工作原理可以看出,在搜索引擎工作的整个过程中,虽然搜索引擎有足够多的页面可以爬取,有自己非常好的排名算法,并且有很强的计算能力,但它仍然是一个“程序”,不具备人的思维能力,因此很难理解和区分网页的内容。这就是为什么很多时候当您使用搜索引擎时,您无法准确找到您想要的信息。