搜索引擎的工作原理是什么?第一代诞生

优采云 发布时间: 2021-05-01 23:39

  搜索引擎的工作原理是什么?第一代诞生

  搜索引擎如何工作?

  搜索引擎的基本工作原理包括以下三个过程:第一,在Internet上发现并采集网页信息;第二,在互联网上采集信息。同时提取并整理信息以建立索引库;快速检查库中的文档,评估文档和查询的相关性,对要输出的结果进行排序,然后将查询结果返回给用户。

  1、爬网。每个独立的搜索引擎都有自己的网络采集器蜘蛛。 Spider Spider跟随网页中的超链接,从此网站爬网到另一个网站,并通过超链接分析不断访问和获取更多网页。爬行的网页称为网页快照。由于超链接在Internet中的应用非常普遍,因此从理论上讲,从一定范围的网页开始,可以采集绝大多数网页。

  2、处理网页。搜索引擎捕获网页后,它仍需要做大量预处理工作才能提供检索服务。其中,最重要的是提取关键词,建立索引库和索引。其他包括删除重复的网页,分词(中文),判断网页类型,分析超链接以及计算网页的重要性/丰富度。

  3、提供搜索服务。用户输入关键词进行搜索,搜索引擎从索引数据库中找到与关键词匹配的网页;为了用户的方便,除页面标题和URL外,还将提供该网页的摘要和其他信息。

  搜索引擎开发的历史

  搜索引擎是随着Internet的发展而产生和开发的。互联网已经成为人们学习,工作和生活的必不可少的平台。几乎每个人都在上网时使用搜索引擎。搜索引擎大致经历了四*敏*感*词*发。

  1.第一代搜索引擎

  1994年,第一代基于互联网的真正搜索引擎Lycos诞生了。它基于手动分类目录。代表性的制造商是Yahoo。它的特点是手动分类和存储网站的各种目录。用户可以通过各种方式进行搜索网站,这种方式现在也存在。

  2.第二代搜索引擎

  随着网络应用技术的发展,用户开始想要搜索内容,并且出现了第二代搜索引擎,即使用关键字进行查询。最有代表性和最成功的是Google。它基于网页链接分析技术。它使用关键字搜索网页,并且可以覆盖Internet上的大量网页。该技术可以分析网页的重要性。结果显示给用户。

  3.第三代搜索引擎

  随着网络信息的迅速扩展,用户希望快速,准确地找到他们想要的信息,因此出现了第三代搜索引擎。与前两代相比,第三代搜索引擎更加关注个性化,专业化和智能化。它使用自动聚类和分类等人工智能技术,使用区域智能识别和内容分析技术,并通过人工干预实现技术和人工的完美结合,增强了搜索引擎的查询能力。第三代搜索引擎的代表是谷歌,它为搜索引擎技术的发展开创了新局面,信息覆盖面广,搜索性能优异。

  4.第四代搜索引擎

  随着信息多样化的飞速发展,在当前的硬件条件下,通用搜索引擎无法在Internet上获得更全面的信息。此时,用户需要全面的数据,及时的更新和详细的分类。面向主题的搜索引擎,这种搜索引擎采用特征提取和文本智能的策略,比前三代搜索引擎更准确,更有效,被称为第四代搜索引擎。

  搜索引擎的工作原理图

  

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线