搜索引擎优化论文(,对元搜索引擎技术和数据挖掘技术研究的基础)
优采云 发布时间: 2021-09-02 05:05搜索引擎优化论文(,对元搜索引擎技术和数据挖掘技术研究的基础)
[摘要]:在网络应用服务发展的今天,信息获取已经成为网民使用互联网的主要目的之一。由于传统搜索引擎的不足和自身的局限性,人们对资源的获取受到了限制。为了提高用户查询信息的覆盖率和检索结果的准确性,基于搜索引擎的元搜索引擎成为当前研发的热点。然而,现有的元搜索引擎大多以线性列表的形式将搜索结果返回给用户,其规模仍然相当大,这使得用户可能要花费大量时间才能找到他们需要的结果。出现上述问题的主要原因是没有根据人们的查询习惯和搜索经验对搜索结果进行分类和重组。因此,对检索结果进行聚类成为提高用户搜索速度、快速定位所需信息的有效解决方案。本文在元搜索引擎技术和数据挖掘技术研究的基础上,结合关联规则和聚类分析,设计并实现了一个具有聚类处理功能的元搜索引擎系统CMES(The Clustering Meta Search Engine)。系统的具体实现。通过建立搜索引擎参数库,实现搜索请求到目标搜索引擎查询指令的转换,自动提取目标搜索引擎返回的结果页面的相关内容;分词处理后提取结果记录中的title和abstract 主要的关键词集合用于建立相关词矩阵并基于布尔函数和TFIDF函数表达结果特征向量,并对两者进行比较分析不同聚类算法下的表示方法;分别使用k-means和FCM算法 根据相关词矩阵,提出k-means(k-means_AWM)和FCM(FCM_AWM)结果聚类优化方案,并进行比较、测试和分析,选择较好的用于检索结果聚类;给出了系统的应用实例和系统的性能分析;最后,对本文所做的工作进行了总结,并提出了需要进一步改进的地方和下一步研究工作的方向。