搜索引擎进行信息检索的优化策略方法(基于主题和分众分类的检索优化*敏*感*词*2用户检索主题获取与表达)
优采云 发布时间: 2022-01-14 17:10搜索引擎进行信息检索的优化策略方法(基于主题和分众分类的检索优化*敏*感*词*2用户检索主题获取与表达)
【摘要】 针对当前搜索引擎检索结果缺乏组织性导致的检索结果不组织导致的准确率低的问题,提出一种基于主题和人群分类的信息检索优化方法。首先获取用户检索主题并进行表达,然后将社交标签作为聚类项,利用向量空间模型实现基于人群分类的文档主题聚类。达到提高检索准确率和优化检索的效果。
【图文】:
通过对人群分类形成的标签(Tags)进行聚类,将主题标签添加到网络文档中并自动聚类。检索优化方案如error,reference source not found,如图1。具体实现技术和方法在下两节中详细介绍。图 1 基于主题和受众分类的检索优化*敏*感*词* 2 用户检索主题获取与表达 为了弥补关键词检索的不足,需要在检索中引入检索主题因素,过滤无关主题内容。为了与通常意义上的主题区分开来,本文将用户检索主题定义如下: 定义 1. 用户检索主题:用户检索主题T是表达用户信息需求倾向的语义标签序列,设V1为用户使用的关键词@。>记录集,V2为网络文档的语义标签集,则:T={t|t∈V1∩V2,P(ti)>P(tj)}(0
得到社交书签集后,经过兴趣校正步骤,去掉重复的标签和无意义的词(如时间标签等),加入V1后得到T序列。整个主题获取和表达的处理流程如图2所示。 3.基于人群分类的文档主题聚类 最常用的文档聚类是向量空间模型(SVM)。SVM使用词频统计等方法提取每个文档的关键词,将文档表示为由这些关键词(n是关键词 数量)。通过TF/IDF加权计算每个关键词的权重,—109—·智能理论与实践·
【作者】 张艳 *敏*感*词*南京政治学院上海分院军事信息管理系
【类别号】:G354
【参考】
相关期刊文章的前4篇
1 李超;王兰成;;应用领域本体的Web信息知识集成研究[J];信息科学;2007年03期
2张娜;张玉华;李保民;;基于本体的有效语义智能检索系统实现研究[J];情报学报;2008年03期
3 朱婷;;信息科学中的序数结构初探——以Web2.0下的重点分类为例[J];图书馆信息知识;2008年03期
4 周荣亭;郑斌;按焦点分类:网络时代的新型信息分类[J];现代图书馆与信息技术;2006年03期
相关硕士论文前2篇
1 滕焱。基于领域知识的智能信息检索研究[D]; 山东大学;2006年
2贾宝贤。基于本体的智能信息检索关键技术研究[D]; 中国海洋大学, 2007
【合引文献】
前 10 篇相关期刊文章
1 李顺龙;;国内图书馆个性化服务研究现状与趋势[J];重庆影像研究;2007年04期
2涂瑞;吴S,
货号:2523003