搜索引擎主题模型优化(个性化信息服务中有关用户建模技术的研究(图))

优采云 发布时间: 2022-02-10 22:25

  搜索引擎主题模型优化(个性化信息服务中有关用户建模技术的研究(图))

  引言 在当今的网络世界中,搜索引擎已经成为互联网上信息检索不可或缺的工具。然而,网络信息的极度膨胀,使得寻找信息就像大海捞针一样。虽然 %&'(, )*'&& 等优秀的搜索引擎提供了大量的信息资源,但用户很难快速准确地获取有价值的在线信息资源,人们越来越难以找到真正满足自己的自己的意图。信息。如何让搜索引擎主动了解用户意图,掌握用户个性化信息,提供个性化服务,已成为信息检索领域众多学者的研究热点。在个性化信息服务中,用户建模技术的研究已成为个性化服务研究的关键技术。用户模型不是对单个用户的一般描述,而是一种面向算法的、具有特定数据结构的形式化用户描述。在个性化信息服务中,表示用户模型的方式主要有三种: 主题表示,用用户感兴趣的主题表示用户模型;关键词表示,表示用户对User模型感兴趣的关键词,如./0.*12'/3;基于空间向量模型的表示,在关键词向量空间中用向量表示用户模型的方法,如./0+*1/等。目前主要有三种用户建模个性化信息服务技术:手动定制建模,即用户输入或选择的建模方式,如文档#-$、文档#5$,这种方式完全依赖于用户,无法准确反映用户兴趣;二是样例建模,即用户提供与兴趣相关或无关的样例来构建模型,如文献#!$等。这种方式需要用户在浏览时标记页面获取样例,干扰了用户的正常使用浏览;三是自动建模,即根据用户的浏览行为自动建立模型,在不对用户造成干扰的情况下改进示例建模技术,如文献#4$#5$等。这种方式完全依赖于用户,不能准确反映用户兴趣;二是样例建模,即用户提供与兴趣相关或无关的样例来构建模型,如文献#!$等。这种方式需要用户在浏览时标记页面获取样例,干扰了用户的正常使用浏览;三是自动建模,即根据用户的浏览行为自动建立模型,在不对用户造成干扰的情况下改进示例建模技术,如文献#4$#5$等。这种方式完全依赖于用户,不能准确反映用户兴趣;二是样例建模,即用户提供与兴趣相关或无关的样例来构建模型,如文献#!$等。这种方式需要用户在浏览时标记页面获取样例,干扰了用户的正常使用浏览;三是自动建模,即根据用户的浏览行为自动建立模型,在不对用户造成干扰的情况下改进示例建模技术,如文献#4$#5$等。这种方式需要用户在浏览过程中对页面进行标记获取示例,干扰了用户的正常浏览;三是自动建模,即根据用户的浏览行为自动建立模型,在不对用户造成干扰的情况下改进示例建模技术,如文献#4$#5$等。这种方式需要用户在浏览过程中对页面进行标记获取示例,干扰了用户的正常浏览;三是自动建模,即根据用户的浏览行为自动建立模型,在不对用户造成干扰的情况下改进示例建模技术,如文献#4$#5$等。

  但总的来说,在个性化搜索引擎中,用户建模技术还处于起步阶段,尚未形成完整的技术体系。文章结合个性化信息服务中的人工定制建模技术和自动建模技术,采用基于空间向量模型的表示方法,提出了一种用户模型智能调整算法。获取用户的兴趣,从而建立更详细、更准确的用户模型。仿真实验表明,该结构和算法能够有效提高检索结果的准确性,具有良好的适应性。用户模型调整的主要思想本文提出了一种新型的个性化搜索引擎系统概念,它利用通用搜索引擎的检索结果在客户端进行个性化智能过滤。客户端除了与普通搜索引擎类似的查询界面外,还包括查询优化器、字典、用户模型和机器自学习等几个重要模块,构成个性化搜索引擎系统的关键部分。用户注册时完成用户模型的初始化,系统根据用户信息(包括用户67、关键词67、关键词、权重、创建时间、last等信息)以关键词的形式表达用户的兴趣使用日期)。在用户使用过程中,系统通过用户的浏览行为自动学习知识,动态调整用户模型,并为用户下次检索提供更高的查询质量。其中,用户模型调整主要分为以下三种情况: (") 如果机器在用户模型之外学习到一个新的关键词,则计算相应的权重来扩展用户模型。

  (-) 如果机器学习到了用户模型中已经收录的关键词,则调整模型中对应的关键词项的权重。(4)因为用户模型空间有限,所以用户模型有一个最大词汇量,当词汇量超过这个最大容量时,删除模型中一些低权重的词条,从而固定词汇量为实现面向用户的个性化搜索引擎中用户模型智能调整算法的研究(西安交通大学电信学院计算机科学系,西安8“99!: ) ;?:@=@'*&A=*>?BCD1 (E/F(E2G个性化信息服务日益成为信息检索领域的研究热点。针对用户模型构建问题,文章结合手动定制建模和自动分析建模技术,利用空间向量模型来表示用户模型智能调整算法。仿真实验表明,该结构和算法能够有效提高检索结果的准确性,具有良好的适应性。关键词信息检索个性化搜索引擎用户模型文章图中编号分类号*I4:"7"%#()8,-9"0:"8%&'L&=J(1 /3%2>/G2/ ;GN>G //3>GN, O>P*GQ>*&1&GN RG>S/3T>1, O>P*G 8"99!:) >GK&3=*1 >>/3S>2/ >GK&3=* 1>&G3/13>/S*?T,T1/=BU22&3F>GN J3&K>?/, 1'/2(T1&=V0(>?1 J3&K>?/ *GF 1/2'G&?&N,

  袁薇(“:8X+”),女,硕士*敏*感*词*,主要研究方向为信息检索。兴趣的动态跟踪。由于每个用户的兴趣领域不同,基于空间向量的个性化搜索引擎对不同用户有用相同的检索请求下有不同的检索结果,对用户的自适应能力体现在两个方面: (") 查询优化:系统在提交检索请求前通过用户模型调整用户查询表达式。(#) 结果过滤:初始查询结果经过用户模型处理后返回给用户。算法的几个假设假设“每个用户检索到的用户模型可以用向量的形式表示,用户模型中设置的关键字是!”,以及用户模型中的关键字权重向量,其中!“代表用户自定义的关键字!” 和机器学习到的新关键词!”分别表示机器学习到的新关键词和对应的权重。假设*用户从本次查询的页面列表中点击了1个页面,构成了页面集合-点击user this time. Assume $ 通常,当用户打开一个页面,发现它不是想要的页面,然后立即关闭该页面,时间不超过),-.假设!每个条目的权重在用户模型反映了用户爱好的相关性程度和能力应该是固定的,本文设置为)页面中关键词的权重计算首先,0123的不同标签可以分为4种表示;

  用户模型智能调整算法根据用户模型调整的主要思想,我们将调整算法分为以下三个部分。用于机器学习的新 关键词 处理未收录在用户模型中的机器学习的 关键词。,计算相应的权重,扩展用户模型。新的关键词处理算法如下: (") 对用户点击的每一个页面,按照公式(")的方法计算。(*) 形成用户点击的页面集合 - 新关键字集合 "+, where /?@)=*%ABBBC;,D@,E?F6D 6D ,DIJ2K/;D/?FE@,"&&4 ;34(3):L"$%L"!集合间相似度分析与研究)=*%北方交通大学学报,3$$!;3M("):&'%&& 设置相似度度量及其在模式识别中的应用)= *%复旦大学学报(自然科学版), 3$$!;!4('): ML&%M#4 !%林志贵等%一种变换方法+,-./ 设置为模糊信息处理中的模糊集)=*% Computer Engineering and Applications, 3$$!; !$(&): 3!% 3' '% 张成义, 党平安% 关于+,-./ 集之间的相似性度量)=*% 计算机工程与应用, 3$$4;4&("#) : &3%&!L% Li Fan et al. % Fuzzy entropy based on 0. 112 sets)=*% 华中科技大学学报(自然科学版), 3$$4; 4"(" ):"%4 与文献)#* 与本系统与文献结果的比较) M*. ML&%M#4 !%林志贵等人%一种在模糊信息处理中将+,-./集转化为模糊集的方法)=*%计算机工程与应用,3$$!; !$(&): 3!% 3' '% 张成义, 党平安% 关于+,-./ 集之间的相似性度量)=*% 计算机工程与应用, 3$$4;4&("#) : &3%&!L% Li Fan et al. % Fuzzy entropy based on 0. 112 sets)=*% 华中科技大学学报(自然科学版), 3$$4; 4"(" ):"%4 与文献)#* 与本系统与文献结果的比较) M*. ML&%M#4 !%林志贵等人%一种在模糊信息处理中将+,-./集转化为模糊集的方法)=*%计算机工程与应用,3$$!; !$(&): 3!% 3' '% 张成义, 党平安% 关于+,-./ 集之间的相似性度量)=*% 计算机工程与应用, 3$$4;4&("#) : &3%&!L% Li Fan et al. % Fuzzy entropy based on 0. 112 sets)=*% 华中科技大学学报(自然科学版), 3$$4; 4"(" ):"%4 与文献)#* 与本系统与文献结果的比较) M*.

  从实验结果可以看出,该算法的效果明显优于一般搜索引擎566-N/,并且随着用户多次使用个性化系统,优势已经体现出来。可以看出,在用户偏好的情况下,采用该算法的搜索引擎系统,检索效果要高于不采用该算法的搜索引擎系统;而且随着用户偏好的增加,差距也越来越大。也就是说,用户的偏好越强,使用用户模型智能调整算法的搜索引擎系统的优越性越明显。该算法的效果略好于文献)#*和文献)M*。一方面,表明基于机器自学习用户浏览行为调整用户模型的算法在基于用户提供的搜索词调整用户模型方面优于文献)#*。算法; 另一方面,也说明人工定制用户建模与自动用户建模技术相结合,使用OCH8标签识别关键词权重的方法优于文献)M*基于COPA/,;E: FD -) AD: W;6E//IFD-@6V DIFD?/;D,?F6D,N E6DV/;/DE/ 6D ,.?6D6G6.@ ,DIG.N?F 9;6 ^ @FD-)J*%AD: [;6PE//IFD-@ 6V AD?/;D,?F6D,N=6FD? J6DV/;/DE/ 6D \;?FVFEF,NAD?/NNF-/ DE/, H6D?;/,N, "&&': &3!%&3& L% 庄跃亭, 潘云和, 吴飞 (网络编辑多媒体信息分析与检索)H*% 清华大学出版社,

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线