搜索引擎主题模型优化(LDA算法-主题建模(amp)())
优采云 发布时间: 2022-01-29 18:24搜索引擎主题模型优化(LDA算法-主题建模(amp)())
SEOr每天面临的挑战来自于搜索引擎的排名算法,因为这个算法是搜索词在结果页中排名的重要依据,而搜索引擎通过建立一个可学习的模型来识别页面上的文本内容。
LDA 算法 - 主题建模与分析
LDA算法公式:
为了便于理解,这里是一个简化的形式:
我们试着解释一下,主语出现的几率=主语所在文档的出现频率X主语改变使用频率;
谷歌会分析用户的查询词与哪些主题相关,这些相关性会通过描述符周围的属性来检查,例如:“橙子”作为水果与其相关,橙色属性等。这些内容是所有与它相关的东西。
LDA 方法是一种非常强大的自动学习算法,它扩展了 关键词 组合文档和复合文档之间的关联。他在许多领域都做出了杰出贡献。
贝叶斯定律 - 贝叶斯过滤方法应用于反垃圾邮件。有效减少索引库的杂质和词的不准确。
相关算法还包括:
- TF*IDF权重公式比粗略的关键词密度等指标更能准确影响关键词排名因素。
- Followed IPs 这是我们最关心的链接权重的考虑,关注文本链接的价值。
- LDA 余弦主题和页面依赖项。
看一些简单的例子:
1、单人关键词
内容 A 收录 关键词蝙蝠侠,但内容 B 没有;显然搜索引擎可以很容易地使用 Content A 参与排名。
2、关键词短语
关键词组合排名更高,取决于两者中哪个更相关,Wiggum 比 Chief 更常见 关键词Chief 更常见(广泛相关),因此内容 A 更容易捕获。
注意:这个例子还说明了另一个流行的焦点指示器 - 关键词density,你知道怎么理解它:)
3、组合关键词(复合)
搜索引擎的相关性(relevancy),大家看完内容,从内容B《每日星球》《*敏*感*词*肯特》中的描述,很容易想到超人的主要特征,戴黑框眼镜的每日记者——*敏*感*词*: ) 很明显,内容 B 比内容 A 更相关。
4、主题模型
通过内容作为人类的理解可以看出明显相关,内容B所描述的乐器——一个女人正在演奏这种乐器,但是搜索引擎没有这个经验和经验,没有相关的关键词这样的因为内容 A 更难识别。但幸运的是,从 LDA 的算法来看,内容 B 已被评估为优于内容 A。这是一个强大的算法:)
-----
总结:
1、算法是基于用户体验的,我们用用户的思维去考虑问题。
2、搜索引擎也在努力解决这些问题,这可能只是时间问题。