SEO监测报告之搜索引擎的工作原理知识(一)
优采云 发布时间: 2021-07-09 22:00
SEO监测报告之搜索引擎的工作原理知识(一)
您需要知道的 SEO 搜索技巧
2020-05-08 |阅读:时代
背景
长期以来,尤其是做IT的人都强调一个问题:提问的智慧。无非是强调:把你的问题背景描述清楚,简要说明你的理解过程和遇到的问题,问清楚你想理解什么。但事实上,在当今发达的网络环境中,你遇到的80%的问题,应该都是遇到过相同或相似问题并在网上发布答案的人。所以在很大程度上,你困惑的问题应该可以通过搜索找到相应的答案。因此,比起提问的智慧,我认为通过网络搜索找到答案的能力可能更重要。
机缘巧合,9月19日中旬开始接手SEO相关工作,一直持续到1月20日结束,打了一场硬仗,惨不忍睹……但也顺利纳入了公司的SEO监控报告。淘汰原有5K多次错误和每日累计增加200+不定期举报,网站收录从2K+升级到9.8w+。
从感觉SEO只是在做关键词和内容展示,到了解搜索引擎的原理知识(分词索引),到整理SEO规范,到搭建SEO所需的数据中心,到搭建大型不同页面的数量和站点地图...等
尤其对于一个SEO新手来说,这个过程真的很漫长很痛苦,学到的东西无疑是丰富的。这段时间,《SEO实用代码》这本书吃了大半。尤其是搜索技巧,我觉得非常实用,用途广泛,值得使用。本文内容基本上是对阅读本书搜索技巧的总结记录。
搜索引擎的工作原理
一个搜索引擎的工作过程大致可以分为以下三个阶段,对于经常使用搜索的人来说:理解阶段二、在第三阶段协助应用相关的搜索指令,让搜索引擎可以帮助我们提供尽可能多的内容。
三个阶段大致如下:
采集:继续跟踪站长提供的站点地图中的链接,互联网上的各种内外部链接,以广度/深度抓取页面的HTML代码并存储
这里SEO要注意如何吸引和暴露自己的链接
Cleaning:对抓取到的内容进行预处理,如:文本提取、分词、去重、前向&倒排索引、权重计算和质量判断...等,此时搜索引擎具备搜索准备能力随时根据用户数据
在这里SEO可以关注:内容的清晰性、丰富性和差异性;用户友好的体验等.... 尽最大努力使您的内容被搜索引擎系统“索引”。因为:页面“被索引”是页面“被收录”的先决条件
Rank:处理用户输入的搜索词,根据**words**获得**关键词采集**,匹配索引库中所有收录关键词的文件,通过热度、相关度和获取前N条记录的其他计算
通常搜索引擎不会处理所有内容并返回。因此,SEO内容的清晰性和差异性尤为重要,只有做好了才能展现给用户。 ==只有用户看到的流量才是有价值的流量,只有最终能带来收益的流量才是目标流量==
在第2阶段和第3阶段,关键词都故意加粗:因为无论是网站内容还是用户输入的搜索信息,搜索引擎都会进行操作:提取信息关键词,然后进行分词,最后给大家展示高匹配度。
适当的搜索技巧和搜索说明可以让搜索引擎更加了解我们的搜索目的。
搜索技巧提示1:使用“搜索词”代替“搜索句子”以获得更丰富的答案
搜索引擎的背后是机器,而不是人,机器的理解能力天生就比人差。所以在搜索的时候:直接告诉机器你想要什么关键词。在大多数情况下,这比让机器理解你想要什么然后返回要快。速度更快,答案会更丰富。 .
比如你输入:“什么梗是流行的黑人抬棺材?”,实际上可能提取为:黑人抬棺材梗
因为像“最近”、“流行”、“是”、“什么”这样的词可能完全没有意义,所以这些词统称为“停用词”。
那么与其让搜索引擎猜测去哪里再进行关键词提取,不如直接告诉它。
技巧二:巧妙使用停用词过滤语言
此前有相关权威对搜索和浏览习惯进行了对比调查。调查显示,英文用户在谷歌上平均可以在 8-10 秒内找到答案,而中国用户在谷歌上可以在 30 秒内找到答案,而在百度上则是 50 秒。
从这个差异可以推断:
中文搜索不如英文搜索准确。英文单词用空格分隔,比中文拼接更有利于搜索引擎关键词的提取和理解
所以从我进入IT行业开始,就有人告诉我:如果你能用谷歌搜索,就不要用B学位;如果你能用英文搜索,尽量用英语……但是,如果你用英文搜索,很多答案都是从我这里出来的。我不明白。
比如搜索IT行业的Sphinx(中文:Sphinx)
显然用英文关键词搜索答案会更准确。通过添加停用词,先对中文搜索进行过滤排序
提示 3:明智地使用搜索引擎提供的过滤器
很多时候安装了正版软件或系统,但为了去除广告或无限期尝试,我们会在网上搜索可用的解密码或激活码,但如果你能想到这样做,其他人必须这样做一样...而且一个激活码/解码只能使用有限的次数,如果旧答案基本无效...我该怎么办?
使用搜索引擎提供的“设置”过滤答案的收录time。比如你搜索一个可用的Windows激活码,当然你收录越晚暴露出来的信息越有价值!
百度提供的工具栏功能会比较丰富(但可以通过其他搜索引擎的高级搜索命令过滤)
高级搜索命令关键词filter:双引号-精确匹配
如前所述,搜索结果是根据相关性显示的。如果用户输入2个关键词Windows神键。然后你可以用英文用双引号把它包起来,结果肯定会收录所有的关键词。如果您正确配合其他搜索技术,进行准确的搜索同样有帮助。
关键词filter:减号屏蔽搜索
比如我要搜索关键词“father”,而且我明明想要屏蔽歌曲“father”的信息,那么就可以用这个技巧!
! ! !注意:减号前面必须有空格,减号后面和屏蔽字后面没有空格
关键词Specify: intitle:-title 过滤
一般来说,搜索结果会根据关键词从文章的全部内容中提取出来进行匹配。 Title应该是文章的核心体现,所以在SEO中Title也是页面优化的一个重要因素。
我们可以使用intitle:命令来指定必须收录在结果标题中的字段
如果你想在标题中有多个关键词,也可以使用allintitle:命令,后面跟着多组关键词,关键词之间用空格隔开
文件类型说明:filetype:-搜索特定文件格式
您可以按文件类型过滤搜索结果的文件格式:。这个命令对于搜索文档/书籍非常有用!
可以看到filetype:pdf中的所有文件都是PDF数据。百度只支持:pdf, doc, xls, ppt, rtf, all(即:所有百度支持的文件类型,也是默认值)这几种主流文档类型,而谷歌基本上支持所有可以索引的文件格式,比如Always : mobi, AZW3, EPUB, TXT...等
站点名称:site:-搜索指定网站下的内容
使用站点:您可以为搜索结果指定域名。
比如你想看“搜索引擎”相关的博文,已经知道博园-cnblog是一个比较知名的优秀博客平台,可以通过这个命令过滤。
但是这个命令只能过滤一个站点,而没有intitle:-allintitle:这样的东西可以过滤多个站点,很遗憾吧?