HITS算法原理和工作原理是什么?(一)(图)
优采云 发布时间: 2021-07-03 07:14HITS算法原理和工作原理是什么?(一)(图)
HITS 是一种用于分析网页重要性的算法。其目的是让用户快速找到与查询主题相关的优质页面。他的算法原理和工作原理是什么?
HITS算法的工作原理
如图所示,在实践中不难发现,PageRank算法返回的网页的相关性是无法保证的。这将导致搜索结果不佳。 HITS算法的本质是兼顾了领域的高质量。链接(Hub)还考虑了链接页面的相关性(Autbority)的导入。
枢纽和自治概念
Hub:收录许多Autbority页面指向的页面;
Autbority:与某个领域和主题相关的高质量页面;
公式
集线器:H(1)=A(5)+A(6)+A(7)
)
权限:A(1)=A(1)+A(2)+A(3)
)
增进彼此的关系
假设1:一个好的Autbority页面会被很多好的Hub页面指向;
假设2:一个好的Hub页面会被很多好的Autbority页面指向;
Hub & Autbority 是 HITS 算法的核心部分,它进行扩展和迭代计算并筛选出相关性更高、质量更高的搜索结果。
HITS 算法的问题
从上图不难看出,SEO基本可以从简单的作弊中优化,但风险也存在。如果资源站存在触发惩罚,导致出现k站现象,结构就会不稳定。问题是大量缺失的链接会给网站带来很大的危害。一天一个SEO知识点,让我们从零重新认识搜索引擎。