搜索引擎优化原理(搜索引擎的核心技术架构,大体结构的切分架构的架构)
优采云 发布时间: 2022-01-03 00:06搜索引擎优化原理(搜索引擎的核心技术架构,大体结构的切分架构的架构)
搜索引擎的核心技术架构一般包括以下三部分,
首先是蜘蛛爬行技术;
二是索引技术;
第三是查询展示技术;
当然,我不是搜索引擎的架构师,我只能用比较肤浅的方式做一个结构化的切分。
1、 蜘蛛,也称为爬虫,是一种从 Internet 捕获和存储信息的技术。
搜索引擎信息收录,很多不知道的人会有很多误解,以为是付费的收录,或者其他什么特殊的投稿技巧。
其实不然。搜索引擎利用网络上一些众所周知的网站抓取内容并分析其中的链接,然后有选择地抓取链接中的内容,再分析其中的链接,以此类推,通过有限的入口,基于相互联系,形成强大的信息捕获能力。
有些搜索引擎也有链接提交入口,但基本上不是收录的主要入口。不过,作为创业者,还是建议多了解一下相关信息。百度和谷歌有站长平台和管理背景。这里有很多内容需要非常非常认真地对待。
反过来说,在这个原则下,一个网站,只有被其他网站链接,才有机会被搜索引擎抓取。
如果这个网站没有外链,或者外链在搜索引擎中被认为是垃圾链接或无效链接,那么搜索引擎可能不会抓取他的页面。
分析判断搜索引擎是否抓取了您的页面,或者在抓取您的页面时,您只能通过服务器上的访问日志进行查询。如果是CDN就比较麻烦了。
基于网站嵌入代码的方法,无论是cnzz、百度统计,还是googleanalytics,都无法获取到蜘蛛爬取的信息,因为这些信息不会触发这些代码的执行。
本文由Anyang seo整理整理。