搜索引擎优化定义( 1.搜索引擎的概念与搜索引擎搜索引擎的应用)

优采云 发布时间: 2021-11-30 07:02

  搜索引擎优化定义(

1.搜索引擎的概念与搜索引擎搜索引擎的应用)

  

  1.搜索引擎的概念

  我们这样定义搜索引擎:搜索引擎是一个可以通过互联网接受用户的查询命令,并为用户提供满足其查询需求的信息资源的系统。据统计,搜索引擎对应用的搜索仅次于电子邮件。目前互联网上影响最大的中文搜索工具有:谷歌、百度、北大天网、爱文(iask)、雅虎(yahoo!)、搜狗(sogou)、搜搜(soso)等搜索引擎。英语:Yahoo!、AltaVista、Excite、Infoseek、Lycos、Aol 等。

  真正意义上的搜索引擎,通常是指采集互联网上千万到数十亿的网页,并将我的账户(即关键词)中的每一个词都编入索引。

  搜索引擎的原理可以分为四个步骤:从互联网上抓取网页,建立索引库,在索引库中搜索和排序,对搜索结果进行处理和排序。

  (1)。从互联网上抓取网页:使用蜘蛛系统程序,可以自动从互联网上抓取网页,自动上网,并沿着任何网页中的所有网址抓取到其他网页,重复这个过程,并采集所有被爬回的网页。

  (2),索引数据库:分析索引系统程序对采集到的网页进行分析,提取相关网页信息(包括网页网址、编码类型、页面内容关键词、关键词位置、生成时间、大小、与其他网页的链接关系等),并按照一定的关联算法进行大量复杂的计算,得到每个网页的每个页面内容和超链接关键词相关程度(或重要程度),然后使用此相关信息来构建网络索引数据库。

  (3),索引库中的搜索顺序:当用户输入关键词时,搜索系统程序会从Web索引库中查找所有与关键词匹配的相关网页。由于使用的相关网页 这个关键词的相关度已经计算好了,所以只需要根据已有的相关度值进行排序即可,相关度越高,排名越高。最后,页面生成系统会搜索搜索结果的链接地址、页面内容摘要等,内容整理后返回给用户。

  (4),对搜索结果进行排序:关键词的相关信息的所有相关网页都记录在索引库中,只需要将相关信息和页面级别合成一个相关的数值度,然后进行排序,相关性越高,排名就越高,最后页面生成系统将搜索结果的链接地址和页面内容摘要等内容组织起来返回给用户。

  搜索引擎分类

  搜索引擎的技术基础是全文搜索技术。全文搜索通常是指全文搜索,包括信息存储、组织、性能、查询、访问等方面。其核心是文本信息的索引和搜索,一般用于企事业单位。随着互联网信息的发展,搜索引擎在全文搜索技术上逐渐发展并得到广泛应用,但搜索引擎与全文搜索仍有区别。搜索引擎与传统意义上的全文检索的主要区别如下。

  (1),数据量。

  传统的全文检索系统面向的是企业自身的数据或与企业相关的数据。一般索引数据库的规模多在GB级别,数据量只有几百万;但是 Internet 网络搜索需要处理数十亿个网页。,搜索引擎的策略是使用服务器集群和分布式数据计算技术。

  (2),内容相关性。

  信息太多,准确度和排名尤为重要。谷歌等搜索引擎使用网页链接分析技术,根据网页在互联网上被链接的次数来判断重要性;但是全文搜索数据源中的相互联系程度不高,不能作为判断重要性的依据,只能根据内容的相关性进行排序。

  (3),安全。

  互联网信息是公开的。除了文字内容,其他信息都不是很重要。企业全文检索的数据源均为企业内部信息,有级别和权限限制,对查询方式要求更严格。数据通常会安全地集中存储在数据库仓库中,以确保数据安全和管理要求。

  (4),个性化和智能化。

  搜索引擎针对互联网访问者。由于数据量和客户数量的限制,自然语言处理技术、知识检索、知识挖掘等计算密集型智能计算技术难以应用。这也是当前搜索引擎技术努力的方向。. 全文搜索数据量小,搜索需求明确,客户量少。它在智力和个性上更有优势。

  除了上述与全文搜索系统的区别外,搜索引擎按其工作方式可分为三种,即全文搜索引擎、搜索索引/目录和元搜索引擎(Meta Search Engine)。

  一、全文搜索引擎。

  全文搜索引擎是名副其实的搜索引擎(google、AllTheWeb、AltaVista、Inktomi、Teoma、WiseNut、百度、中文搜索、北大天网等),它们都从互联网上提取各种网站信息(在主要基于网页文本建立的数据库,检索符合用户查询条件的相关记录,并将结果按照一定的顺序返回给用户,因此是真正的搜索引擎。搜索结果,全文搜索引擎可以细分为两种:一种是有自己的搜索程序,俗称机器人程序或蜘蛛程序,并建立自己的网络数据库,搜索结果直接从自己的数据库中调用. 比如上面提到的搜索引擎;另一种是租用其他引擎的数据库,按照自定义格式排列搜索结果,比如Lycos引擎。

  全文搜索引擎具有全文搜索、检索功能强、信息更新速度快等优点。但同时,它也有它的不足。虽然提供的信息多而全,但可供选择的信息过多会降低相应的命中率,而且提供的查询结果重复链接较多,层次结构不清晰,给人一种各种凌乱的感觉。

  二、 目录索引搜索引擎。

  目录索引虽然有搜索功能,但严格意义上它并不是真正的搜索引擎,它只是一个按目录分类的网站链接列表。用户无需搜索关键词(关键词),仅依靠分类目录即可找到自己需要的信息。最具代表性的目录索引是著名的雅虎!,其他包括开放目录计划(DMOZ)、LookSmart、About等,国内搜狐、新浪、网易搜索也属于这一类。

  目录索引与全文搜索引擎的区别在于,它是人工建立的,站点是通过“人工方法”进行分类的。与全文搜索引擎不同,网站上的所有文字和信息都是收录进去的,但是先把网站归入某个类别,然后记录一些摘要信息,并给出网站 的简要介绍。当用户请求搜索时,搜索引擎只在网站的*敏*感*词*中搜索。其主要优点是:层次分明、结构清晰、易于查找;多级分类,便于查找具体明确的主题;内容摘要和分类目录下的内容简明扼要,方便用户一目了然。缺点是搜索范围小,

  三、元搜索引擎。

  当元搜索引擎接受用户的查询请求时,它会同时在多个其他搜索引擎上进行搜索,并将结果返回给用户。知名的元搜索引擎有InfoSpace、Dogpile、Vivisimo等,代表性的中文元搜索引擎是北斗搜索。在搜索结果的排列方面,有的直接通过源搜索引擎对搜索结果进行排序,比如Dogpile,也有的按照自己的规则对结果进行重新排列组合,比如Vivisimo。

  除了以上三类搜索引擎,还有以下集中的非主流形式。

  (1),集成搜索引擎:如HotBot于2002年底推出的搜索引擎。搜索引擎与元搜索引擎类似,但不同之处在于不是同时调用多个搜索引擎,用户提供了4个搜索引擎,在引擎中进行选择,所以他更准确地称之为集体搜索引擎。

  (2),门户搜索引擎:如Aol Search、Msn Search等,虽然提供搜索服务,但既没有目录也没有网络数据库,搜索结果完全来源于其他引擎。

  (3), Free For ALL links (FFA): 这种网站一般只是简单的滚动排列链接条目,少数有简单的分类,但规模比雅虎大!目录指数小很多。

  除了以上几类,搜索引擎还应该具备以下功能:

  A. 网页搜索功能

  B、网站搜索功能

  C. 图片搜索功能

  D. 新闻搜索功能

  E. 字典搜索功能

  F. 功能搜索功能

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线