seo搜索引擎优化名词解释(元搜索引擎的运作原理及创新性分析(图))
优采云 发布时间: 2021-09-24 10:49seo搜索引擎优化名词解释(元搜索引擎的运作原理及创新性分析(图))
摘要:元搜索引擎通过调用多个独立的搜索引擎来提高搜索结果的覆盖率。本文简要介绍了元搜索引擎的工作原理,研究了元搜索引擎的核心技术,阐述了其局限性和未来发展趋势,并针对其局限性提出了切实可行的优化方案。
关键词:元搜索引擎;会员搜索引擎;网页重复数据删除;结果排序
中国图书馆分类号:TP393.09 文献识别码:A 文章 编号:1007-9599 (2012) 10-0000-02
一、简介
随着网络技术的飞速发展,网络渗透到人们的生活中。如何在网络中找到需求配额信息就显得尤为重要。
根据 Cyceillance 在 2000 年 7 月 10 日发表的一项研究,目前互联网上有 21 亿个具有唯一 URL 地址的公共 URL,并且还在以每天超过 700 万的惊人速度增长。过去十年,信息的膨胀和爆炸让用户不知所措。正如沃尔曼所说,信息爆炸带来了人们的信息焦虑。用户对信息的需求各不相同,搜索引擎逐渐成为网络用户不可或缺的工具。
元搜索引擎(MSE)作为搜索技术的一个新的研发领域,在实践中已经初步显示出其便利性和重要性。虽然目前对元搜索的研究不断发展,但由于其对独立搜索引擎的依赖,元搜索引擎在处理查询输入和输出显示方面可能存在问题。例如,搜索的准确性不容易控制。支持有待提高,搜索结果不能很好的体现等。因此,元搜索的优化研究具有一定的时代意义和创新意义。
二、元搜索引擎原理
传统搜索引擎分为全文搜索引擎、目录索引和元搜索引擎。元搜索引擎也称为多搜索引擎。它通过统一的用户界面帮助用户在多个搜索引擎中选择和使用合适的(甚至几个)搜索引擎,实现检索操作。搜索工具的全局控制机制。目前,国内搜索引擎发展迅速,市场也十分广阔。但是元搜索引擎的发展非常缓慢,相关的网站也比较少。元搜索引擎由请求提交、检索接口代理、检索结果展示三部分组成。
(一)提交请求:
负责满足用户的搜索需求。搜索内容可以是单个关键词、短语或句子。用户可以选择搜索引擎的组合,或者默认搜索引擎,或者用户可以选择单个搜索引擎进行搜索。
(二)检索接口代理
由于独立搜索引擎使用的搜索算法和数据库差异很大,需要将用户的搜索请求转换成各个成员搜索引擎需要的格式,包括是否支持布尔搜索,是否提供自然语言等高级搜索服务query , 一一适应各个来源搜索引擎的转换,以提高准确率。
(三)显示搜索结果
对来自源搜索引擎的所有搜索结果进行二次处理,包括对结果进行去重和排序,并将处理后的结果以统一格式输出给用户。难点在于数据的去重和排序。目前的搜索处理方式主要有“先返回响应最快的搜索结果”、“位置排序法”、“汇总排序法”等,各有优缺点。搜索处理算法的好坏直接影响到搜索时间、搜索覆盖率等排序质量等。
以上就是元搜索引擎的组成部分以及设计元搜索引擎的三个步骤。
三、现有元搜索引擎的缺陷
至于国内现有的元搜索网站,比如someta,虽然可以实现基本功能,但存在一定的缺陷。他们中的大多数有两个问题。
第一,虽然搜索范围很广,但是搜索时间很长。比如搜索“元搜索”这个词,我们使用了国内4家按照元搜索原理搭建的搜索引擎进行了搜索测试。其中两人的搜索时间超过30秒,甚至不显示任何结果;
二是搜索时间较短,但覆盖面较窄。我们也对上面提到的网站进行了测试,部分返回的搜索结果只是单个搜索引擎的结果,并没有充分发挥元搜索的真正优势。从这一点来看,目前的元搜索引擎还没有真正发挥出自己的优势,为广大用户提供便利。
随着互联网的发展,越来越多的人通过互联网获取信息。据估计,互联网上可索引的网页超过8亿个,信息量约15TB。但是,单个搜索引擎只能覆盖所有可用页面。16%的搜索页面,所以元搜索引擎的发展势必成为未来的发展趋势。
四、优化元搜索引擎主要功能
元搜索引擎的优化目标是在可接受的搜索时间内返回更多信息。研究的重点是如何设计元搜索引擎以及如何对多个独立搜索引擎的结果进行二次处理,如搜索结果去重、权重排序等。
核心思想是:
1.请求提交:负责满足用户的搜索需求;
2.检索接口代理:将用户检索请求转换成各成员搜索引擎需要的格式;
3.搜索结果展示:所有来自源搜索引擎的搜索结果都经过两次处理,包括结果的去重和排序,处理后的结果以统一的格式输出给用户;
4.个性化设计:元搜索引擎采集信息和数据,从用户的个性化信息库中获取个性化特征,对比分析,计算结果,返回给用户。
五、 优势分析及可行性
元搜索引擎作为搜索技术研究开发的一个新领域,在实践中已经初步显示出其便利性和重要性。
由于网络数据量大、增长快,单个搜索引擎的容量和处理能力难以扩展到更大的规模,每个搜索引擎只能收录部分网络文档。元搜索可以分散处理负载并增加检索范围。
元搜素具有良好的扩展性,可以添加到多个成员搜索引擎中,使得每个成员搜索引擎的体积更小,性能更好。检索时间短,检索内容可以保持最新。
部分网站内容无法用数据采集器抓取,检索更有效。为了找到满意的检索结果,用户可能会访问多个搜索引擎,直到找到合适的结果。元搜索引擎可以帮助用户自动完成这项任务。.
六、 结论
在本文中,通过对固有元搜索引擎的研究,我们提出了优化元搜索引擎的方法。分析现有元搜索引擎的不足,提出切实可行的可靠解决方案。
就元搜索引擎技术本身而言,如何实现和提高元搜索引擎的智能化、个性化、专业化,将是信息检索研究的重点。中文元搜索引擎还处于起步阶段,还有很大的发展空间。相信未来在互联网信息检索领域,元搜索引擎将具有广泛的应用前景。
参考:
[1] Steve Lawrence, Lee Giles C. 网络信息的可访问性 J J. Nature science joumals,1999,400,(8):107
[2]张建功,陈定权,郝振新.搜索引擎与元搜索引擎探讨[J]. 现代图书馆与信息技术, 2OO2, 92, (2):338
[3] 黄玉兰, 王宏, 徐端, 等. 搜索引擎技术的新发展——多搜索引擎系统[J]. 计算机工程, 2002, 28, (1):4-6
[4] 陈俊杰,薛云,宋涵涛,等.基于代理的元搜索引擎的研究与设计[J]. 计算机工程与应用, 2003, 10: 33-35
[5] Weiyi Meng,Clement Yu,King-Lup Liu 构建高效的元搜索引擎
[6] Christos Faloutsos 和 Douglas Oard,信息检索和过滤方法调查
相关热词搜索:搜索引擎优化研究