网站SEO内容页关键词布局在SEO中的具体落地方法
优采云 发布时间: 2021-08-23 05:25网站SEO内容页关键词布局在SEO中的具体落地方法
网站SEOContent Page关键词Layout 是 SEO 的核心概念之一。 SEO实践中的很多工作都是围绕关键词进行的。本文尝试结合搜索技术原理和网站优化实践,总结SEO中内容页关键词布局的具体落地方法。
一、搜索引擎技术原理简介
搜索引擎的核心技术基础是将用户的查询词用自然语言分割成有意义的词组,然后从索引库中找到这些词组中收录全部或部分关键词的内容,并返回结果。
正常人的搜索思路是带关键词来查出关键词是否收录在内容中。假设你想从10个序列号为1-10的网页中找出收录“关键词Layout”的网页,去这10个网页的全文搜索中找出是否收录“关键词Layout”这个词,然后返回收录“序列号”一词的网页。但是如果是从几百万或者几千万个网页中搜索,速度很慢,所以发明了倒排索引的概念。 (下图数据非实际数据,仅供参考)
如上图,是最简单的倒排索引模型(DocID是搜索引擎分配给抓取的网页的唯一编号)。搜索引擎爬虫每次爬取一个网页时,会将网页分成若干个词组,并将这些词与倒排索引表一一比较:如果倒排索引表的“关键词”列中有这个词,只需在对应的倒排列表中添加当前网页的DocID编号即可;如果没有,加一行(涉及生词识别,这里不展开),给这个关键词分配一个ID,然后写入当前网页的Number。这样,当我们查询“关键词1”时,我们很快就会知道相关网页有(1,2,3,5)。更复杂的查询词假设被拆分为“关键词 1”,“关键词3”和“关键词6”这3个词也可以快速搜索相关网页(1,2,3,5,6,7,9).
仅此不足以对搜索结果进行排序。在不作弊的情况下,某个关键词在一个网页上出现的次数越多,这个关键词就越能代表这个网页的特征,只要过滤掉停用词(几乎有很多停用词)每个网页,但不能表达任何特定含义的词,如:“的”、“是”、“了”等)。如果我们可以在倒排索引表中添加关键词出现在网页上的频率信息(缩写:词频--TF),就可以对网页进行排序。如下图:当我们的查询词被分割为“关键词1”和“关键词2”时,相关网页可以排序为(3,5,1,2).
假设有两个网页1、页2,倒排索引信息如下:
我们搜索“关键词how layout”,搜索词被细分为“关键词”、“how”、“layout”,以及“关键词”、“how”和“layout”第1页分别2、2、2次,共6次;第 2 页中的“how”和“layout”出现了 7 次。按照之前的逻辑,最终的搜索结果排序为(2,1),这显然不是一个理想的排名结果,第2页的话题显然是在讲“如何布局Go”。此时IDF需要引入(逆文档频率索引)来解决这个问题。
如果网页集合中收录某个关键词的网页较少,则关键词具有更好的网页区分能力,因此IDF越大,权重越高。假设上图中“关键词”、“How”、“Layout”和“Go”的IDF分别为2.5、0.3、0.8、3。 TF乘以IDF求和后,网页1、2的相关性为:7.2、4.6,所以搜索“关键词 how layout”的排序结果为(1,2) ,比较现实。
关键词的位置信息也是很重要的一点。一般认为标题中的关键词比正文中的关键词更能体现网页的主题。这就是H标签的重要性。搜索引擎还可以根据代码布局和噪声比(例如停用词的频率)确定导航在哪里、文本在哪里、侧边栏在哪里等。位置信息会标注在倒排索引列表中,参与排序决策。
另外还有一些其他常用的技术方法,比如:二字索引/词组索引,“关键词怎么布局”不一定分为三个短词,也可以分为“关键词layout", "how to", "how to layout"等;相关词合并搜索、“关键词”相关词“关键字”、“how”相关词“how”等
当然,在实践中,现代大型搜索引擎的倒排索引模型会复杂得多,排序算法涉及到很多其他因素(一个重点是超链接分析)。由于篇幅和作者水平有限,我们不再继续展开。
二、关键词如何布局
1、标题中必须有关键词,但不一定是完整的问句
由于搜索引擎在查询时会将查询分为N个以上的词、双词、词组,并添加相关词合并查询,所以标题中的关键词不一定是完整的问句,一个典型的是“哪家公司做XXXX比较好”。标题中不一定需要这个完整的词。即使标题收录这个完整的短句,也无法匹配其他完整的短句。一个高质量的网页往往能匹配到几十万个长尾关键词,显然一个标题不可能全部收录。标题的另一个主要功能是吸引点击。点击率也是影响排名的因素,但核心词“XXXX”、“好”、“公司”一定要出现。
2、文中部分核心词和切词自然均匀分布
在搜索引擎发展初期,很多技术人员利用TF*IDF算法的高权重漏洞,堆了很多关键词,快速获得更好的搜索排名。后来,搜索引擎修复漏洞,从算法层面打击作弊,“理想关键词密度3%~8%”的流行观点在网上出现。首先,这个密度不是针对完整的查询词计算的,而是针对切分后的所有词计算的。在实践中,你会发现关键词密度略低于3%,而关键词密度远高于8%。 'S页面可以获得很好的排名。
如果你是一名搜索引擎工程师,你会做什么?我想我会结合全网的历史访问数据(比如百度统计,移动百度等可以获得更全面的访问数据)和关键词密度信息计划设置一个合理的范围和预警范围。如果超出警告范围,将进行静音处理。在预警范围内,结合网站历史数据和小流量排名第一阶段访问数据反馈,决定是否压制、维持或给予更高的排名。 .
与关键词密度相比,我们更应该关注语言的流畅度(盲目插入关键词显得冗长笨拙)和内容的质量和深度。毕竟,搜索引擎有成百上千的排名因素,他们不能忽视彼此。
3、相关内容和正文下方侧边栏推荐合适的布局关键词
虽然搜索引擎可以通过代码和噪声比来判断这些不是文本部分,从而减少了关键词这里的部分权重,但是从百度快照缓存的角度来看,还是有一点作用的。
正文下方和侧边栏中的相关内容和推荐内容多从横向和纵向两个角度选取。比如这篇文章,主题是关于“关键词Layout”,然后横向推送一些“网站structural layout”、“关键词Explorer技巧”等站内优化内容,大概率许多游客会感兴趣; “教你如何搭建优质外链”、“如何提高落地页转化率”等垂直推送内容,也是访问者可能暂时压制的隐藏需求。添加关键词布局的同时,还可以增加PV,减少跳出,提升用户体验。为什么不这样做。
本文链接: