搜索引擎返回给用户的是一个和用户查询相关的结果列表
优采云 发布时间: 2021-06-22 06:20搜索引擎返回给用户的是一个和用户查询相关的结果列表
搜索引擎返回给用户的是与用户查询相关的结果列表。列表中项目的顺序是一个重要问题。由于用户的多样性和查询的自然语言风格,将同一个列表返回到同一个“关键词”肯定不会让所有提交“关键词”的用户都满意(或者他们都达到了最高的满意度) )。因此,搜索引擎真正追求的是统计意义上的满意度。人们认为谷歌目前比天网更好,因为在大多数情况下前者返回的内容更符合用户的需求,但并非在所有情况下。如何对查询结果进行排序,需要考虑的因素很多,后面会深入讨论。这只是对预处理阶段可能形成的所谓“重要性”因素的简要说明。顾名思义,因为它是在预处理阶段形成的,所以它与用户查询无关。如何说一个网页比另一个网页更重要?人们参考科学文献重要性的评价方法。核心思想是“引用最多的就是最重要的”。 “引用”的概念恰好通过 HTML 超链接在网页之间得到很好的体现。 PageRank 作为 Google 创造的核心技术,是这一思想的成功体现 [Page, et al., 1998]。此外,人们还注意到网页和文档的不同特点,即有的网页主要是大量的外部链接,本身基本没有明确的主题内容,而有的网页则是通过大量的其他链接。网页。从某种意义上说,这形成了一种双重关系,允许人们在网络上建立另一个重要性指数 [Kleinberg, 1998]。这些指标有的可以在预处理阶段计算,有的必须在查询阶段计算,但都作为查询服务阶段最终结果排序的一部分参数。 】