干货分享:看“曹鹏SEO-搜索引擎优化”视频教程笔记

优采云 发布时间: 2022-09-24 16:08

  干货分享:看“曹鹏SEO-搜索引擎优化”视频教程笔记

  首先,最值得学习的不是视频中的知识,而是演讲者的这几句话

  1.本视频涉及 SEO 的方方面面。只听一遍会增加知识,但需要花更多的时间去挖掘更多的知识,把知识系统化。这当然对学习所有知识非常有用

  2.SEO 是一门前卫且非常活跃的学科。具有新颖性、经验积累和信息及时性的价值。很多计算机软件知识都是这样的。一方面需要扎实的基础,另一方面也不要忘记关注知识的更新。

  下面的笔记很不完整,所以如果你想系统地学习SEO的知识,就需要主动通过各种渠道学习搜索引擎的原理和爬虫的工作原理... 更多扩展知识

  SEO:搜索引擎优化

  SEO最大的好处:流量。在 Internet 上查找信息时,越来越多的人使用搜索引擎。80% 的人只看搜索结果的第一页,40% 的人只看第一页的前四项,只有大约 20% 的人会后翻几页。如果你的网站搜索结果比较低,那么你的网站流量会受到很大影响

  SEO目的:让网民更容易找到你的网站或网页

  总体介绍:开业;搜索引擎简介(专注于谷歌);搜索引擎优化(解释搜索引擎爬虫如何抓取互联网;搜索引擎如何对搜索结果进行排序;什么是可取的 SEO,什么是不可取的 SEO;有机和 PPC 的比较)

  优化策略:关键词;关键字工具;网页分析;搜索引擎提交

  备注:域名、链接、Flash的使用、CSS;结尾

  使用谷歌搜索时的搜索规则和提示:+、-、“”的使用

  !谷歌创始人撰写的《大型超文本网络搜索引擎剖析》一文解释了搜索引擎的秘密,一定会让你受益匪浅

  !谷歌的排名方法,PageRank

  黄页和搜索引擎:黄页是人工编译的,更新速度慢,搜索引擎自动爬取;搜索引擎检索网页,黄页检索网站;与搜索引擎收录相比,黄页收录的门槛较高;黄页为搜索引擎提供数据,做黄页收录很好,还有很多人在用黄页。那么做SEO不能忽视黄页问题

  内容和搜索广告:

  搜索引擎爬虫:

  网页截图:

  搜索引擎如何对网页进行排名。它基本上看三件事:1.页面内容;2.关键词的频率和集中度;3.网站人气

  白帽 SEO:仔细查看不断更新的 Google 网站Admin Support Center。做了一些不该做的事,会影响网站的搜索排名

  黑帽SEO:利用作弊手段实现搜索引擎排名优化,千万别做

  什么是关键字:搜索时,在输入框中输入的内容就是关键字;对于网站,能够最相关、最简洁地描述你的网站内容的词就是关键词

  关键词选择建议:先列出一些你认为的关键词;检查您的 网站 统计信息或服务器日志;参考其他人的意见(潜在客户、同事……);使用优化工具

  停用词:过于常用,没有明确含义,会被搜索引擎忽略的词,如the, that...

  长尾理论

  关键字工具:wordtracker 工具、关键字发现工具、

  HTML 和 SEO 与以下内容有很大关系:

  1.网页的标题,也就是标签,对于SEO来说是最重要的。尝试收录此页面的关键字,以告诉其他人此网页的功能。它不能太长或太短。标题:操作员

  2.META标签是关键字和描述,因为很多人滥用这两个标签,在里面写了太多东西,所以搜索引擎越来越不认识这两个东西

  3.网页的重要性比……更重要,这些对SEO来说非常重要,很容易被搜索引擎爬虫捕获

  

  4.网页正文中收录的关键词越多越好,在不影响人们阅读的情况下尽可能多

  5.来自网页的图片

  向搜索引擎提交 网站 网址;提交 网站 到黄页的 URL

  如何选择域名

  1.如果域名收录关键词,会大大提升排名

  反向链接搜索:谷歌的链接:关键字;链接测量软件

  !对于动态网站网页,应尽量避免网页地址中出现?、=、&符号,动态网站的默认URL形式应写成格式这对搜索引擎有好处。

  将robot.txt文件放在网站的根目录下,告诉搜索引擎爬虫在这个网站中不愿意爬取的目录和内容

  转载“”

  一个合格的seo工程师一定会明白搜索引擎的工作原理。百度和谷歌的原理差不多,但是有些细节是不一样的,比如分词技术,因为国内搜索一般都是百度,所以我们以后的课程都是针对百度的,当然基础课也是一样的谷歌!

  搜索引擎的工作原理其实很简单。首先,搜索引擎大致分为四个部分。第一部分是爬虫,第二部分是数据分析系统,第三部分是索引系统,第四部分是查询系统。好吧,当然这只是基本的 4 个部分!

  让我们谈谈搜索引擎的工作流程:

  什么是搜索引擎蜘蛛,什么是爬虫?

  搜索引擎蜘蛛程序实际上是搜索引擎的自动应用程序。它的作用是什么?事实上,这很简单。就是在网上浏览信息,然后将信息抓取到搜索引擎的服务器,然后建立索引库等等。我们可以把搜索引擎蜘蛛当成一个用户,然后这个用户就可以访问我们的<< @网站,然后将我们的 网站 内容保存到您自己的计算机上!更好理解。

  搜索引擎蜘蛛如何抓取网页?

  找到链接→下载这个网页→添加到临时库→提取网页中的链接→下载网页→循环

  首先,搜索引擎的蜘蛛需要找到链接。至于怎么找到,很简单,就是通过link链接。搜索引擎蜘蛛找到该链接后,会下载该网页并将其存储在一个临时库中。当然,同时它会提取页面上的所有链接,然后循环。

  搜索引擎蜘蛛几乎一天 24 小时(悲催这里,没有假期。哈哈。)那么蜘蛛下载的网页呢?这就需要第二个系统,即搜索引擎的分析系统。

  搜索引擎蜘蛛会定期抓取网页吗?

  这是一个很好的问题,那么搜索引擎蜘蛛会定期抓取网页吗?答案是肯定的!

  如果蜘蛛随机抓取网页,那将是浪费时间。互联网上的网页数量每天都在增加。蜘蛛是如何爬行它们的?因此,蜘蛛会定期抓取网页!

  蜘蛛爬行策略一:深度优先

  什么是深度优先?简单来说,搜索引擎蜘蛛在一个页面上找到一个链接,然后顺着这个链接往下爬,然后在下一页找到一个链接,再往下爬,把所有的都爬下来。这是深度优先的爬取策略。大家看下图

  上图中,是深度优先的*敏*感*词*。让我们假设网页A在搜索引擎中的权限最高,如果网页D的权限最低,如果搜索引擎蜘蛛按照深度优先的策略抓取网页,那么就会反过来,也就是D页的权限变成最高的,就是深度优先!

  蜘蛛爬取策略二:广度优先

  宽度优先比较容易理解,即搜索引擎蜘蛛先爬取整个页面的所有链接,然后再爬取下一页的所有链接。

  上图是宽度优先的*敏*感*词*!这其实就是大家通常所说的扁平化结构。你可能会在一个神秘的角落看到一篇文章文章,警告你网页的层数不能太多,如果太多会导致收录很难,这就是广度优先策略对付搜索引擎蜘蛛,这就是为什么。

  蜘蛛爬网策略3:权重优先

  如果说宽度优先优于深度优先,那也不是绝对的。只能说各有千秋。现在搜索引擎蜘蛛一般会同时使用两种抓取策略,即深度优先+宽度优先,而在用这两种策略抓取的时候,应该参考这个连接的权重。如果这个连接的权重不错,那么使用深度优先,如果这个连接的权重很低,那么使用宽度优先!

  那么搜索引擎蜘蛛是如何知道这个链接的权重的呢?

  

  这里有两个因素:1、更多和更少的级别;2、此连接的外部链接的数量和质量;

  那么如果链接的层级太多,会不会爬不上去呢?这不是绝对的。这里有很多因素需要考虑。我们将在后续推进中将其简化为合乎逻辑的策略。到时候我会详细告诉你的!

  蜘蛛网策略四:重温爬虫

  我认为这很容易理解。比如搜索引擎的蜘蛛昨天抓取了我们的网页,今天我们在这个网页上添加了新的内容,那么搜索引擎的蜘蛛就会抓取今天的新内容。只需重温爬行!revisit crawl也分为两种,如下:

  1、重温所有

  所谓全重访,是指蜘蛛最后一次爬取的链接,然后在本月的某一天,所有的链接都被重访爬取一次!

  2、单次重访

  单次重访一般是针对更新频率比较快且稳定的页面。如果我们有一个页面,我们不会每月更新一次。

  那么搜索引擎蜘蛛第一天来你是这个样子,第二天你还是这个样子,那么第三天搜索引擎蜘蛛就不会来了,它们每隔一段时间就会来,比如每一个月。一次,或在重新访问所有内容时更新一次。

  以上就是搜索引擎蜘蛛抓取网页的一些策略!好了,我们上面说了,当搜索引擎蜘蛛爬回网页的时候,第二部分就开始了,也就是这部分数据分析。

  数据分析系统

  数据分析系统是对搜索引擎蜘蛛检索到的网页进行处理,所以数据分析分为以下几部分:

  1、网页结构

  简单来说就是把那些html代码全部删除,然后提取内容。

  2、降噪

  降噪是什么意思?在网页的结构化中,已经删除了html代码,留下了文字,所以去噪是指留下网页的主题内容,删除无用的内容,比如版权!

  3、检查重复

  重复检查更容易理解,即搜索引擎发现重复的网页和内容,如果发现重复的页面,则将其删除。

  4、分词

  分词有什么神奇的吗?也就是搜索引擎蜘蛛执行前面的步骤,然后提取文本的内容,然后将我们的内容分成N个词,排列,存储到索引数据库中!它还计算单词在页面上出现的次数。

  5、链接分析

  这一步就是我们平时做烦躁的工作。搜索引擎会查询,这个页面有多少反向链接,有多少外链和内链,给这个页面多少权重等等。

  数据索引系统

  执行上述步骤后,搜索引擎会将处理后的信息放入搜索引擎的索引数据库中。那么这个索引库大致分为以下两个系统:

  正向索引系统

  什么是远期指数?简单的说就是搜索引擎给所有的URL加了一个数字,这个数字对应了URL的内容,包括URL的外部链接、关键词密度等数据。

  搜索引擎工作原理的简单概述

  搜索引擎蜘蛛发现连接→根据蜘蛛的爬取策略对网页进行爬取→交给分析系统→分析网页→建立索引库

  好了,这节课结束了。对我来说不容易,今天只是简单的讲一下搜索引擎的工作,因为搜索引擎是一个非常复杂的系统,不可能在几十分钟内全方位讲完,我们在进阶或进阶教程会慢慢说!

  入门到精通:SEO基础指南_搜索引擎优化入门教程下载

  

  SEO基础指南_搜索引擎优化教程下载

  资源名称:SEO基础指南_搜索引擎优化介绍教程内容介绍:第1章SEO入门.3第2章关键词优化.14第3章网站导航和链接204章URL重写优化。 24 第 5 章 SEO 技巧.27 第 6 章 SEO 工具.30 第 7 章 SEO 案例研究.37 第 8 章 SEO 作弊.41 第 9 章 SEO 服务.44 第 10 章故障排除.47 附录:一句话入门 SEO.53 资源截图:The资源太大,已经上传到百度网盘了。链接在附件中,有需要的同学可以自行领取。相关下载链接:///download/weixi

  

  复制链接

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线