搜狗搜索引擎优化(百度站长学院引擎工作原理及应用)
优采云 发布时间: 2021-12-31 09:01搜狗搜索引擎优化(百度站长学院引擎工作原理及应用)
一.引擎的工作原理
百度站长学院对搜索引擎的原理有比较详细的分析。总的来说,有以下几点是SEOer必须掌握的。
1. 抓取网页。每个独立的搜索引擎都有自己的网络爬虫蜘蛛。爬虫跟踪网页中的超链接,从这个网站爬到另一个网站,通过超链接分析不断访问和获取更多的网页。抓取到的网页称为网页快照。因为超链接在互联网上的应用非常普遍,理论上从一定范围的网页开始,可以采集到绝大多数网页。
2.处理网页。搜索引擎抓取到网页后,还需要做大量的预处理工作,才能提供检索服务。其中,最重要的是提取关键词,构建索引库和索引。其他包括去除重复网页、分词(中文)、判断网页类型、分析超链接、计算网页的重要性/丰富度等。
3.提供检索服务。用户输入关键词进行搜索,搜索引擎从索引库中找到与关键词匹配的网页;为方便用户,除了页面标题和URL,还会提供页面摘要等信息。
二.当用户搜索关键词时,搜索引擎做了什么?
1.提交网站 搜索。站长主动向搜索引擎提交网址,并在一定时间内向您的网站发送爬虫,扫描您的网站并将相关信息保存在数据库中,供用户查询。由于搜索引擎索引规则和过去相比变化很大,主动提交网址并不能保证你的网站可以进入搜索引擎数据库,所以站长应该在网站的内容上下功夫,让搜索引擎有更多机会找到您并自动发送您的网站收录。
2.当用户使用关键词搜索信息时,搜索引擎会在数据库中进行搜索。如果找到符合用户要求的网站,则使用特殊算法——通常根据网页中关键词的匹配程度、位置、频率、链接质量等——计算相关性以及每个网页的排名级别,然后根据相关性将这些网页链接依次返回给用户。
三.搜索引擎喜欢什么样的页面收录?
好的内容和独特的页面。如果您的页面内容与互联网上已经存在的其他页面高度相似,则可能无法被搜索引擎收录 搜索到。链接级别较浅的页面。太深的链接,尤其是动态网页的链接,会被丢弃而不是收录。
如果是动态网页,请控制参数的数量和网址的长度。搜狗更喜欢 收录 静态网页。重定向次数多的页面更容易被搜索引擎丢弃,
四.哪些SEO行为会被判定作弊
隐藏文本/隐藏链接。一般是指网页为搜索引擎设计但普通访问者看不到的文字内容或链接。在各种隐藏技术中,最常见的是将文本或链接文本的字体颜色设置为与背景颜色相同或非常接近。其他方法包括使用超小文本、将文本置于图像层后面、页面底部出现冗余内容、滥用图像ALT等;
该网页与搜狗的描述不符。当您首先向搜索引擎提交网站,等待网站成为收录,然后将网站替换为另一个页面时,通常会发生这种情况。一种常见的“诱饵行为”就是这种隐身——创建一个优化页面和一个普通页面,然后将优化页面提交给搜索引擎,然后当优化页面为收录时替换为普通页面通过搜索引擎。
误导关键词。在页面中使用与页面无关的误导性关键词来吸引查询主题的访问者访问网站。这种做法严重影响了搜索引擎提供的结果的相关性和客观性,为搜索引擎所痛恨。
重复性关键词。这种作弊手法也被称为“关键词堆叠欺骗”。它利用搜索引擎注意关键词出现在网页正文和标题中,不合理地进行关键词(过度)重复。其他类似的方法包括在 HTML 元标记中堆叠大量关键字或使用多个关键字元标记来提高 关键词 的相关性。这种技术很容易被搜索引擎检测到并受到相应的惩罚。
恶意交换链接。在网页上建立大量相互链接网站。
不可见页面。对实际访问者或搜索引擎隐藏真实的网站内容,为搜索引擎提供虚幻的搜索引擎友好内容,以提高排名。
欺骗性重定向。指快速将用户访问的第一页(登陆页)重定向到内容完全不同的页面。
日志欺诈。指在页面级别较高的站点上进行大量虚假点击,以列在这些站点的最高referrer日志中,从而获取其导入链接。
建立大量的网站镜像,将网站或网页的内容复制到不同的域名和服务器上,诱使搜索引擎多次索引同一页面内容。
该页面收录恶意广告、恶意代码或恶意插件
如果页面有作弊网站的链接,则可视为作弊网站。