传统搜索引擎不能对用户输入的关健字进行词意分析和扩展

优采云 发布时间: 2021-05-30 06:36

  传统搜索引擎不能对用户输入的关健字进行词意分析和扩展

  [摘要]:随着通信技术的发展和互联网的普及,网络与人们的工作和生活的联系越来越紧密。使用搜索引擎从互联网上获取所需信息已成为人们的习惯。但是,随着信息量的增加和行为的增多,传统的搜索模式逐渐暴露出很多问题,例如:忠实表达问题和机械匹配问题。造成这些问题的根本原因在于,传统搜索引擎无法对用户输入的关键词词义进行分析和扩展,缺乏知识处理和理解能力。基于本体的智能搜索模型ISMBDI利用语义Web和本体相关的理论技术,将信息检索从关键词级提升到知识(或概念)级,有效解决上述问题,但ISMBDI模型存在用户查询接口不够友好,查询结果的处理方式不够人性化,查询效率低。本文针对ISMBDI模型存在的问题,旨在提高系统的性能和实用性,使其成为适合语义Web信息共享的公共应用系统模型。它使用语义Web、本体和缓存等理论技术进行相关方面的优化研究。研究内容包括基于概念的用户查询界面的优化,查询结果处理方法的优化,查询处理过程和算法的优化等方面。基于统一语义和用户界面友好性的考虑,针对ISMBDI模型中用户查询界面的不足,设计了一种新的基于概念的用户查询界面。

  该接口结合了传统查询接口模式的优点和ISMBDI模型中用户查询接口的优点,既缩短了用户建立查询请求的时间,减轻了用户的负担,又保证了语义的统一。在深入分析ISMBDI模型查询处理过程的基础上,提出了查询结果处理优化策略。该策略有效解决了ISMBDI系统中没有100%匹配结果时的零结果问题,提高了系统的可用性。同时,为了实现优化策略,提出了一种基于本体的查询请求与查询结果的相似度计算方法。该方法通过计算成功匹配的模式路径数与查询请求中收录的模式路径总数,为用户提供查询结果与查询请求相似度的参考值。为了降低网络负载和系统响应时间,建立了ISMBDI模型的缓存机制,并提出了一种新的缓存替换策略LRAFU。该策略结合了经典缓存替换算法LRU(最近最少使用)和LFU(最低使用频率)的优点,既避免了缓存污染问题,又契合了ISMBDI模型的特点,保证了高缓存命中率和使用率。根据查询结果处理方法的优化策略和利用缓存中的历史查询来回答当前查询的思路,ISMBDI模型中的关键算法——查询计划生成算法Qplan及其优化算法Qplan_opt有改进后的算法Qplan_imp具有更丰富的功能和更快的计算速度。

  基于缓存机制,提出了一种快速检索机制。这种机制充分利用了缓存中的历史查询记录,以牺牲召回率为代价,大大缩短了查询时间,提高了查询效率,为召回率低的查询请求提供了快速通道。最后对关键查询处理算法Qplan、原优化算法Qplan opt、改进算法Qplan_imp、快速检索算法Qplan_quick、缓存替换算法LRAFU进行了实验分析,验证了本文对优化算法的优化效果。 ISMBDI 系统性能。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线