搜索引擎优化名词解释(搜索引擎的历史:1990年初当时万维网还未出现,它并不是搜索引擎)
优采云 发布时间: 2022-02-08 08:16搜索引擎优化名词解释(搜索引擎的历史:1990年初当时万维网还未出现,它并不是搜索引擎)
搜索引擎:
搜索引擎是指按照一定的策略采集互联网上的信息,使用特定的计算机程序,对信息进行组织处理后,为用户提供检索服务的系统。互联网上的信息是庞大而混乱的。所有的信息就像海洋中的小岛。网络链接是这些岛屿之间的纵横交错的桥梁,搜索引擎为用户描绘了一幅清晰的画面。信息图供用户随时查阅。
从用户的角度来看,搜索引擎提供了一个收录搜索框的页面。在搜索框中输入一个单词并通过浏览器提交给搜索引擎后,搜索引擎会返回一个与用户输入的内容相关的信息列表。
在互联网发展初期,以雅虎为代表的网站分类查询非常流行。网站分类是手动组织维护的,精选网上优秀的网站,简单介绍一下,放到不同的分类中。用户查询时,逐层点击即可找到想要查找的网站。也有人将这种基于目录的检索服务网站称为搜索引擎,但严格意义上来说,它并不是搜索引擎。
搜索引擎的历史:
在 1990 年代初期,万维网尚未出现时,为了查询分散在各种分布式主机中的文件,就有了 Archie 和 Gopher 等搜索工具。随着互联网的飞速发展和基于HTTP访问的Web技术的迅速普及,它们并不能适应用户的需求。1994 年 1 月,推出了第一个可搜索和可浏览的目录 EINetGalaxy (TradewaveGalaxy),它还支持 Gopher 和 Telnet 搜索。同年 4 月,Yahoo Directory 诞生,随着访问量和 收录 链接的增长,它开始支持简单的数据库查询。这就是我们所说的早期目录导航系统。他们的缺点是网站收录/更新都依赖人工维护,因此,当信息量急剧增加时,它们并不是很有用。1994年7月,Lycos推出基于机器人的数据挖掘技术,支持搜索结果的相关性排序,率先在搜索结果中使用网页自动摘要。Infoseek也是同时期的重要代表,是搜索引擎历史上的一个重要进步。
1995年,出现了一种新的搜索引擎工具——元搜索引擎,第一个元搜索引擎是华盛顿大学学生开发的Metacrawler。用户只需提交一次搜索请求,由元搜索引擎负责转换处理,然后提交给多个预先选定的独立搜索引擎。
1995年12月首次亮相的AltaVista推出了大量创新功能,迅速达到了当时搜索引擎的巅峰。它是第一个支持自然语言搜索的搜索引擎,具有基于第一个分析和智能处理网络内容的能力。一个实现高级搜索语法(如AND、OR、NOT等)的搜索引擎,AltaVista还支持搜索新闻组、搜索图片等划时代的功能。同时,还有inktomi、HotBot等搜索引擎。
1997年8月,搜索引擎正式上线。它是第一个支持对搜索结果进行简单自动分类的搜索引擎,也是当时拥有最大数据库的搜索引擎之一。
1998年10月,谷歌(中文名谷歌)诞生。它是世界上最受欢迎的搜索引擎之一,具有许多独特而卓越的功能,并在界面上实现了革命性的创新。
1999年5月,Fast(Alltheweb)公司发布了自己的搜索引擎AllTheWeb,它的网页搜索可以使用ODP自动分类,支持Flash和pdf搜索,支持多语言搜索,还提供新闻搜索、图片搜索、视频、MP3、和FTP搜索,具有极其强大的高级搜索功能。在 2003 年 2 月被 Overture 收购之前,它曾经是最受欢迎的搜索引擎之一。
在中文搜索引擎领域,成立于1996年8月的搜狐公司是第一家参与网络信息分类导航的网站。由于人工分类提交的局限性,随着网络信息的爆炸式增长,逐渐被基于机器人自动爬行和智能分类的新一代信息技术所取代。
1998年1月,台湾中正大学吴胜教授带领的GAIS实验室创立了Openfind中文搜索引擎,这是最早开发的中文智能搜索引擎。GAIS实验室引进了PolyRankTM的核心技术,截至2002年6月,宣布已经爬取了35亿个网页,并开始进入英文搜索领域。
北大天网是教育网最受欢迎的搜索引擎。由北京大学计算机系网络与分布式系统研究室开发。1997年10月29日正式在CERNET上提供服务。2000年初,新成立了天网搜索引擎研究组。,由国家973重点基础研究发展规划项目基金资助开发,收录网页约6000万,利用教育网的优势,有强大的ftp搜索功能。
百度中文搜索成立于2000年1月,由超链接分析专利发明人、前Infoseek高级工程师李彦宏和好友徐勇共同创立。目前支持网页信息、图片、Flash、音乐等多媒体信息的检索。而百度在中文领域率先使用了ppc商业模式。
2002年以来,许多公司被搜索市场的前景和谷歌的神话所吸引,积极进入搜索引擎市场寻求一席之地。但不幸的是,他们中的许多人,尤其是许多中国公司,使用流氓手段推广自己的搜索引擎。常用的手段有浏览器劫持、恶意捆绑广告软件/*敏*感*词*软件等。中搜是慧聪国际主持开发的,号称是搜索领域的后起之秀。它目前处于起步阶段,但在流氓软件的推广之后,已经占据了很多用户的搜索引擎选择。2003年底,慧聪搜索更名为中国搜索,并推出第三代智能搜索引擎。近期,中国搜索引擎主推桌面搜索——互联网猪,
2003年11月,雅虎全资收购了它。2005年8月,阿里巴巴与雅虎达成战略合作,全资收购雅虎中国,更名为阿里巴巴雅虎,业务重心转向搜索领域。
2004年8月3日,搜狐推出中文搜索引擎搜狗。
2006年9月,微软正式推出拥有自主研发技术的LiveSearch,并宣布进军搜索引擎市场,挑战谷歌在线搜索领域的霸主地位。
2006年12月,网易推出中文搜索引擎有道。
2008年5月,综合搜索引擎Search Island诞生,集百家之长,号称中国最好(山寨)搜索引擎。从用户的角度来看,搜索岛的体验非常好,因此受到了很多网友的喜爱。它的出现也是互联网开放性的体现,也激发了各大搜索引擎厂商为用户着想,了解和满足用户的真实需求。
搜索引擎的组成
一个搜索引擎一般由四部分组成:搜索器、索引器、爬虫和用户界面:
1、Searcher:它的功能是漫游互联网,发现和采集信息。
2、Indexer:它的作用是了解搜索者搜索到的信息,从中提取索引项,用它来表示文档,生成文档库的索引表。
3、Retriever:它的作用是根据用户的查询快速检索索引数据库中的文档,评估相关性,对输出的结果进行排序,并根据用户的查询需求提供合理的反馈。
4、用户界面:其功能是接受用户查询,显示查询结果,提供个性化查询项。
搜索引擎如何工作
搜索引擎的工作原理大致可以分为:
1、采集信息:搜索引擎的信息采集基本上是自动的。搜索引擎使用称为网络蜘蛛的自动搜索机器人链接到每个网页上的超链接。机器人程序是基于网页链接到其他人的超链接,就像日常生活中的“一传十,十传百……”,从几个网页开始,连接所有的链接到数据库中的其他网页。理论上,如果页面上有适当的超链接,机器人可以遍历大部分页面。
2、组织信息:搜索引擎组织信息的过程称为“索引”。搜索引擎不仅保存采集到的信息,而且按照一定的规则排列它们。通过这种方式,搜索引擎可以快速找到所需的信息,而无需重新查看所有已保存的信息。试想一下,如果信息在搜索引擎的数据库中随意堆放,没有任何规则,那么每次查找信息时,都得彻底翻遍整个数据库,这样快速的计算机系统就没用了。
3、接受查询:用户向搜索引擎发送查询,搜索引擎接受查询并将数据返回给用户。搜索引擎始终接收来自大量用户的几乎同时的查询。它根据每个用户的要求检查自己的索引,在很短的时间内找到用户需要的信息,并返回给用户。目前,搜索引擎返回主要以网页链接的形式提供,通过这些链接,用户可以到达收录他们需要的信息的网页。通常搜索引擎会在这些链接下从这些网页中提供一小段摘要信息,以帮助用户确定该网页是否收录他们需要的内容。
在整理信息和接受查询的过程中,大量使用了文本信息检索技术,并根据网络超文本的特点引入了更多的信息。
搜索引擎的分类
1、全文索引
全文搜索引擎是名副其实的搜索引擎。国外代表是谷歌,国内是大名鼎鼎的百度搜索。他们从互联网(主要是网页文本)中提取每个网站的信息,建立数据库,检索符合用户查询条件的记录,并按照一定的顺序返回结果。
根据搜索结果来源的不同,全文搜索引擎可以分为两类。有自己的检索程序(Indexer),俗称“蜘蛛”程序或“机器人”程序,可以建立自己的网络数据库。搜索结果直接从自己的数据库中调用,比如上面提到的谷歌和百度;另一种是租用其他搜索引擎的数据库,按照自定义格式排列搜索结果,比如Lycos搜索引擎。
2、目录索引
目录索引虽然有搜索功能,但不能称得上是真正意义上的搜索引擎,它只是一个按目录分类的网站链接列表。用户可以完全按照分类找到自己需要的信息,无需依赖关键词(Keywords)进行查询。最具代表性的目录索引是著名的雅虎和新浪类搜索。
3、元搜索引擎
元搜索引擎(META Search Engine)接受用户的查询请求后,同时在多个搜索引擎上进行搜索,并将结果返回给用户。著名的元搜索引擎有InfoSpace、Dogpile、Vivisimo等。在中文元搜索引擎中,代表作是搜星搜索引擎。在排列搜索结果方面,有的直接按来源排列搜索结果,如Dogpile;有些根据自定义规则重新排列结果,例如 Vivisimo。
4、其他非主流搜索引擎形式
1)集合搜索引擎:这个搜索引擎类似于元搜索引擎,不同的是它不会同时调用多个搜索引擎进行搜索,而是用户从提供的几个搜索引擎中进行选择,比如HotBot于2002年底推出搜索引擎。
2)门户搜索引擎:虽然AOL Search、MSNSearch等提供搜索服务,但它们既没有目录也没有网络数据库,搜索结果来自其他搜索引擎。
3)Free For AllLinks (FFA):一般只有滚动链接条目,少数类别简单,但规模比 Yahoo! 目录索引要小得多。
搜索引擎商业模式
在搜索引擎发展的早期,他们大多是为其他网站提供搜索服务的技术提供商,以及网站付费搜索引擎。后来随着2001年互联网泡沫的破灭,大部分转向了竞价方式。
目前搜索引擎(百度的PPC、谷歌的AdWords)的主流商业模式是在搜索结果页投放广告,通过用户点击向广告主收费。这个模型首先由 Bill Gross 提出。他于1998年6月创立(后于2001年9月更名为Overture),并成功实施了这一模式,并申请了专利。这种模式有两个特点,一个是PayPerClick,用户不点击,广告主不需要付费。二是竞价排名,根据广告主出价多少对结果进行排名。2001 年 10 月,Google 推出了 AdWords,同样使用按点击付费和出价。2002 年,Overture 起诉谷歌侵犯其专利。2004年8月,与雅虎达成和解!(雅虎于 2003 年 7 月收购 Overture),支付 2。
AdSense 是 Google 于 2003 年推出的一种新的广告方式。AdSense 让各种规模的第三方网络发布商能够访问 Google 庞大的广告商网络。Google 在这些第三方网页上放置与网页内容相关的广告。当浏览器点击这些广告时,网页的发布者可以赚取收入。AdSense 在博主中很受欢迎。同时,谷歌随意删除了一些账号,引起了一些人的不满。其他搜索引擎也推出了类似的广告方式。雅虎的广告方式是YPN(Yahoo Publisher Network)。除了在网页上显示与内容相关的广告外,YPN 还可以在 RSS 提要中显示广告。微软的广告计划称为 AdCenter。