南昌网页搜索引擎优化(个性化网页权重的常见形式个性化PageRank方法有哪些?)

优采云 发布时间: 2021-11-29 19:24

  南昌网页搜索引擎优化(个性化网页权重的常见形式个性化PageRank方法有哪些?)

  个性化页面权重的一种常见形式是个性化 PageRank。除了传统的文本匹配技术外,现代搜索引擎还根据广泛使用网页权重对自然搜索引擎排名进行排名。一个著名的例子是 Google 的 PageRank 技术。利用网页结构的链接关系,PageRank 可以计算每个网页的权重值,并相应地对生成的网页进行排名。因此,如果利用用户的偏好信息来修改PageRank权重值的计算,就会相应地生成表达特定用户个性化信息需求的搜索引擎排名结果。从效果上看,这种方法比PageRank更实用,因为毕竟用户不可能遍历得到的所有查询网页结果。因此,将与用户需求密切相关的网页放在搜索结果的前面,必然会更容易让用户访问。事实上,Page 等人已经提出了个性化 PageRank 的想法,但是他们在本次研究中并没有开发基于个性化网页权重的个性化搜索引擎模型。

  目前人们提出的个性化PageRank方法很多,主要分为两类:一类是直接修改根据超链接关系得到的网页权重值;另一种是在传统的PageRank公式中加入修正参数,以反映用户的个性化需求。

  在原有的PageRank计算公式中,模型给每个网页链接分配了相同的概率值,所以这种方法给不同的链接和网页分配了相同的权重,当前网页的权重值也会均匀地影响链接出来. 它还假设用户随机跳转到任何其他网页的概率是相同的。因此,这种计算方法主要依靠网页*敏*感*词*中的链接进行分析。但是,这些链接是由网站的网页设计者生成的,所以只能反映设计者对网络上其他网页的理解。此外,该方法忽略了另一个重要方面,即Web 用户对Web 页面的理解。换句话说,仅仅使用网页之间的超链接结构来表达网页的权重是不够的。一种相对简单易行的修改网页权重的方法是利用网络日志挖掘信息来获取用户对网页的理解,从而改进传统的PageRank计算方法。其实凭直觉可以判断,访问频率高的超链接应该比访问频率低的超链接更重要。然而,大多数传统的超链接分析技术并不区分这两者。凭直觉可以判断,访问频率较高的超链接应该比访问频率较低的超链接更重要。然而,大多数传统的超链接分析技术并不区分这两者。凭直觉可以判断,访问频率较高的超链接应该比访问频率较低的超链接更重要。然而,大多数传统的超链接分析技术并不区分这两者。

  结合信息的超链接分析技术是Zhu等人提出的。他们称相关公式为 PageRate。虽然他们也声称他们的算法是 PageRank 的扩展,但实际上,这个算法没有任何 PageRank 属性。该算法没有区分所有链路,也没有考虑高频访问和低频访问的区别。同时,他们没有给出实验结论,也没有讨论可能存在的问题,设计公式仍然存在问题。

  其他一些研究也涉及对使用信息的分析。例如,使用增强的学习方法对搜索结果进行重新排序和过滤。对于查询结果中的每个网址,系统都会记录不同用户的点击次数。在后续的查询中,上述信息可以有效提高高频访问的URL权重,类似的降低低频访问的URL权重等方法也被一些商业搜索引擎采用。例如,有的学者在进行多方检索。引擎通过上述方法实现了一种隐式的相关性反馈机制,利用用户点击产生的使用状态,主要使用产生的网页合并和网页重新排序操作。用户使用信息也用于基于模式的应用程序中。

  更好的方法是利用挖掘的Web日志中的信息结合传统的PageRank公式,得到新的网页权重计算公式,即结合挖掘PageRank,如特征敏感的PageRank(usage-aware PageRank,普遍定期审议)。它结合了静态链接结构分析和用户使用分析。一方面,它仍然强调传统网页之间的超链接关系;另一方面,它会分析日志以确定这些实际网页超链接中的哪些是经常使用的。用户访问的内容,用户不常访问的内容,用于提高传统方法中超链接关系生成的网页的权重值。在 UPR 方法中,您甚至可以通过调整参数设置来控制静态链接结构分析技术和Web 使用挖掘技术的效果。如果参数设置为O,则公式等价于传统的PageRank公式。如果参数设置为1,重点转向使用挖掘分析算法,两者之间会平衡,所以这种方法比传统方法更通用。在效率方面,该算法也有优势。它只需要通过一个额外的预处理步骤,其他迭代处理与传统方法没有区别。两者之间会平衡,所以这种方法比传统方法更通用。在效率方面,该算法也有优势。它只需要通过一个额外的预处理步骤,其他迭代处理与传统方法没有区别。两者之间会平衡,所以这种方法比传统方法更通用。在效率方面,该算法也有优势。它只需要通过一个额外的预处理步骤,其他迭代处理与传统方法没有区别。

  但是,这种新方法也有不足之处。尽管网站管理员可以在自己的网站上获取用户的访问信息并将其应用于UPR分析,但这些信息显然不收录所有必要的信息。例如,管理员不可能获得不属于其站点访问的链接。网页的使用情况。虽然可以通过爬虫遍历那些网页的超链接结构,但是除了用户访问本地网页是通过哪些网页的使用信息之*敏*感*词*的,但是这里涉及的用户范围比较小,必须先安装Client应用,相关设置必须同意披露这些个人和私人 Web 访问信息。需要说明的是,谷歌搜索工具栏等软件默认尊重用户的个人隐私权。除非用户允许,否则不会主动采集用户访问的任何信息。当然,还有其他客户端应用程序。该程序似乎不符合上述原则。谷歌搜索工具栏等客户端应用,虽然可以采集用户使用信息,而且这个信息确实是基于整个web范围的,但是这里涉及的用户范围比较小,必须先安装Client应用,相关设置必须同意披露这些个人和私人 Web 访问信息。需要说明的是,谷歌搜索工具栏等软件默认尊重用户的个人隐私权。除非用户允许,否则不会主动采集用户访问的任何信息。当然,还有其他客户端应用程序。该程序似乎不符合上述原则。谷歌搜索工具栏等客户端应用,虽然可以采集用户使用信息,而且这个信息确实是基于整个web范围的,但是这里涉及的用户范围比较小,必须先安装Client应用,相关设置必须同意披露这些个人和私人 Web 访问信息。需要说明的是,谷歌搜索工具栏等软件默认尊重用户的个人隐私权。除非用户允许,否则不会主动采集用户访问的任何信息。当然,还有其他客户端应用程序。该程序似乎不符合上述原则。但是这里涉及的用户范围很小,他们必须先安装Client应用程序,并进行相关设置,同意公开这些个人和私人Web访问信息。需要说明的是,谷歌搜索工具栏等软件默认尊重用户的个人隐私权。除非用户允许,否则不会主动采集用户访问的任何信息。当然,还有其他客户端应用程序。该程序似乎不符合上述原则。但是这里涉及的用户范围很小,他们必须先安装Client应用程序,并进行相关设置,同意公开这些个人和私人Web访问信息。需要说明的是,谷歌搜索工具栏等软件默认尊重用户的个人隐私权。除非用户允许,否则不会主动采集用户访问的任何信息。当然,还有其他客户端应用程序。该程序似乎不符合上述原则。除非用户允许,否则不会主动采集用户访问的任何信息。当然,还有其他客户端应用程序。该程序似乎不符合上述原则。除非用户允许,否则不会主动采集用户访问的任何信息。当然,还有其他客户端应用程序。该程序似乎不符合上述原则。

  因此,这种PageRank挖掘的结合使用适合网站内部网络搜索。搜索引擎的工作原理是首先获取这个网站的结构信息,结合用户的使用信息,可以得到传统PageRank方法的扩展。模型。实验结果也可以证明该算法可以更有效地增加高频网页的权重,相应地降低低频网页的权重。

  随着搜索引擎技术的逐渐成熟,越来越多的搜索引擎优化工作者也很难从搜索引擎的外观来研究SEO。过去一年,谷歌、百度等搜索引擎不断调整链接分析技术,深化SEO门槛。SEOER也必须随着搜索引擎的发展而发展。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线