关于谷歌的搜索特色,你了解多少?(上)

优采云 发布时间: 2021-07-09 20:20

  关于谷歌的搜索特色,你了解多少?(上)

  这个文章,小编在这里和大家分享的内容是关于谷歌的搜索功能~

  Google 的一些特性包括:支持多种搜索语言,有数百种类型;搜索速度快。据说谷歌有8000多台服务器和200多条T3级宽带;谷歌还拥有专利的网页级技术PageRank,可以提供高命中率的搜索结果;谷歌智能的“手气不错”功能可以提供最合适的网页。谷歌涂鸦是谷歌图标的定制版本,在节日和其他纪念日显示在谷歌主页上。例如,搜索日语:

  

  我不会在此一一列举。

  为了更深入的了解,我们先来学习一下谷歌的搜索语法。 Google的搜索语法分为两类,一类是基础语法,一类是高级语法。这次先介绍一下Google的基本语法。

  基本语法

  1)Google 的默认搜索是和逻辑,也就是说我们在输入关键字后搜索的时候,比如输入:“computer google”,就会搜索收录“computer”和“google”的文件内容,如图:

  

  说到这里,给大家插个小知识点:基本的布尔逻辑。

  对于一个搜索引擎,它应该搜索并匹配所有关键词页面还是在关键词中收录任何关键词? ,取决于搜索引擎的一些特殊算法,称为搜索引擎的布尔逻辑默认值。而google使用and作为默认逻辑(搜索所有关键词),当然前提是我们没有输入一些特殊的命令。

  2) 如果您不确定要搜索什么,或者您想搜索两者之一,请使用关键词“OR”。注意:OR 是大写,小写不起作用,每个关键词 和“OR”之间有一个空格。当然,除了“OR”,“|”也意味着或。我们来看看搜索结果。

  

  搜索结果是收录计算机或 Google 字样的页面。

  3)如果我们不想在字母之间插入任何东西,即我想搜索“computerGoogle”,那么我们可以输入“computerGoogle”[注意:字符用双引号括起来]:

  

  如上图所示,结果中的computerGoogle都是一起的,没有除法。当然,这样的结果比较少,只有2940个,但是看图2,结果却是18亿多。而且,大多数搜索引擎都具有智能分词功能。如果没有特殊命令,搜索引擎会根据人们的语言习惯来决定你要搜索的内容。这种做法不仅没有让搜索引擎显得不听话,而且对于普通大众来说,搜索引擎已经变得非常聪明和高效!

  4)如果我们只想显示计算机,不想看到谷歌,那么我们可以这样输入:在计算机后加一个空格,然后加减号“-”谷歌,即:计算机 - 谷歌:

  

  5) 一般来说,输入关键词后,谷歌会向我们展示相关网页的结果和信息。但是,有些词会被搜索引擎的智能忽略,导致我们得不到想要的结果。例如,非常常用的“www”和“the”,基本上任何网页上可以找到的任何内容,都会被Google自动忽略(不要认为这是不好的,这是同样的原因,效率更高)在实际报价中这样做)并且很聪明)。如果我们不想在查询时忽略这些单词,则必须在这些关键词 前面添加符号“+”。如下图:

  

  很明显,如果把www过滤掉,就相当于只在谷歌上搜索“谷歌”这个词,所以找到的信息比加“www”要丰富得多。

  高级语法

  1)intitle

  首先要介绍的是“intitle:”的用法。这个字符串的作用是将搜索范围限制到标题。在关键词前面加上这个,只会搜索和匹配网页的标题,并将结果返回给用户。例如输入“intitle YouTube computer”进行搜索,返回如下图:

  

  但是可以看到,搜索结果中似乎只出现了关于YouTube的内容,与计算机相关的内容很少。这其实和搜索引擎的基本布尔逻辑有关。在 intitle:grammar 中,Google 会搜索所有网页,只要出现 YouTube 或计算机中的一个就会匹配。出乎意料的是,YouTube 的内容肯定比电脑的内容要多得多,所以 YouTube 的内容在搜索结果中占据主导地位。但是,如果我们想在页面标题中找到同时收录 YouTube 和计算机的页面,我们必须使用“allintitle:”,这是“intitle:”的变体。使用这个前缀后,就可以得到我们想要的结果了。如下图所示:

  

  2)intext

  当你看到这个词时,你大概能猜到它的意思。 “intext:”用于搜索网页的内容,这样就可以忽略网页中的超文本链接、网址和主题。我们输入“intext:2018 tjut”进行搜索,结果如下图所示,结果中显示的网页大部分几乎都是不规则的,但是网页索引中收录“2020 tjut”,但是因为2020和tjut同时出现在两个关键词上的网页真的很少。两个关键词的相关性真的不高,因为才2018年,如果换成“2018 tjut”,相信应该会有更多的结果。但是我们要明白,此时搜索引擎关注的内容就是网页的body。与之对应的还有一个变种:“allintext:”,用法和上面的“allintitle”类似,这里就不过多介绍了。

  

  3)inanchor(锚毛点)

  此语法表示搜索页面的链接锚点。

  链接锚是指链接的描述文字,比如这段HTML代码:

  百度,链接的锚点是“百度”。

  如果我们搜索“inanchor:YouTubeFacebook”,我们可以找到那些带有锚点的网页,如下图所示。当然,这个语法还有一个变体“allinachor:”,意思和上一个差不多。

  

  4)site

  此语法将搜索限制为站点的域名。比如我们搜索“site:”,结果如下图所示。这里我们通常不需要加上前面的www,所以搜索结果会收录所有收录域名的相关内容,包括顶级域名、二级域名,甚至三级域名。域名的内容。换句话说,我们甚至可以通过搜索来确定大约有多少个子域!

  

  5)inurl

  inurl:将搜索范围限制为 URL 或 网站 页面。此语法对于搜索和帮助非常有用。它不仅适用于我们普通的搜索,而且在黑客搜索中也非常有用。比如我们输入“inurl:password”,结果如下图,结果显示了URL中所有有password的网页。另外,这个语法还有一个变体:"allinurl:",用法和上一个类似。

  

  注:“site:-inurl:”的意思【查询谷歌有多少个子域】

  6)link

  它的功能是查询链接到特定 URL 的所有列表。需要注意的是,它是一个特定的URL页面,比如输入:“link:”进行搜索,如下图,会返回所有链接到百度主页的页面。因此,我们也可以指定特定的 URL 页面进行搜索。

  

  7)cache

  缓存可以帮助我们找到被 Google 索引的页面副本。它最大的优点是源文件接口不及时存在,或者变成其他内容,我们还是可以搜索到的。比如输入:"cache:",结果如下。可以看到,虽然格式比较乱,但还是可以隐约地从中得到一些有用的信息。国内搜索引擎上可能有类似的功能。比如百度的网页快照就有类似的功能。

  

  8)filetype

  filetype 是指搜索具有指定后缀的文件。这个不是很常用,但是在黑客领域有一定的效果。但是我们的重点是讲解语法,如下图,输入“filetype:mdb”,结果会显示一些网站数据库文件。

  

  9)related

  该语法用于搜索与某些页面相关的网站,可以帮助我们搜索类似的页面。比如我们输入“related:”,显示的结果都是其他搜索引擎。

  

  此语法允许您搜索收录有关 URL 的更多信息的页面列表。这里的信息包括本网页的缓存,以及与本网页类似的网页等,注意下面的英文信息即可。输入“info:”,结果如下图所示。

  

  特别声明:以上内容(包括图片或视频,如有)由自媒体platform“网易”用户上传发布。本平台仅提供信息存储服务。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线