搜索引擎优化毕业论文(基于领域本体的搜索查询扩展的方法,设计)
优采云 发布时间: 2022-03-01 02:07搜索引擎优化毕业论文(基于领域本体的搜索查询扩展的方法,设计)
摘要:近年来,互联网的革命性发展产生了海量的数据。不断增长的互联网数据给搜索引擎带来机遇和挑战。作为互联网数据检索的重要工具,搜索引擎,尤其是垂直搜索引擎,越来越受到关注。本文基于领域本体,构建了一个基于领域本体的垂直搜索引擎。在本文垂直搜索系统设计过程中,提出了一种基于领域本体的搜索查询扩展方法,挖掘查询关键词的语义信息,提供更专业的相关扩展词集;结合领域本体知识对搜索结果进行排序,改进相关性排序算法,优化搜索结果。以中医推拿领域为实际研究领域,构建中医推拿领域垂直搜索引擎。本文的主要工作和研究内容包括:首先,本文提出了一种基于领域本体的搜索关键词扩展方法。该方法首先采集了该领域的大量相关数据,包括电子文档和开放的互联网数据。通过数据处理,训练出Word2vec词向量模型,结合Word2vec和同义词词森林设计相似度计算方法。根据关键词与本体节点的关系,扩展得到初始词集;根据候选词关键词的相似度,得到扩展词集;其次,结合领域本体计算网页文本的领域隶属度,改进相关度排序算法。通过提取领域本体的概念节点,构建领域本体的词汇表。计算领域本体中概念节点的词项权重,然后统计词条在网络文档中出现的频率,计算网络文档的领域隶属度,将网页的隶属度作为重要因素排序,从而改进相关排序算法;三、设计 开发了基于中医推拿领域本体的垂直搜索引擎。通过构建中医推拿领域本体,