SEO基础知识:搜索引擎蜘蛛工作原理及分类方法解析

优采云 发布时间: 2021-07-15 22:02

  SEO基础知识:搜索引擎蜘蛛工作原理及分类方法解析

  一、SEO 的定义:

  搜索引擎优化。在掌握搜索引擎规则的前提下,优化站内和站外网站,在搜索引擎网页收录增加网站,在搜索引擎排名上提高网站关键词,从而提高网站的流量

  二、搜索引擎蜘蛛工作原理:

  搜索引擎蜘蛛通过链接访问网页,并获取网页的HTML代码存储在数据库中。索引程序通过对抓取的页面进行文本提取、中文分词、去停词等预处理,建立索引数据库,为排名程序的调用做准备。用户输入关键词后,排名程序调用索引库,经过相关性计算等处理,生成一定格式的搜索结果页面

  三、关键词的分类方法:

  按一般分类,按营销需要

  一般分类方法: ①按品牌词分类; ② 按产品或服务分类; ③ 按行业的一般分类; ④ 按人群词分类; ⑤ 按活动词分类; ⑥ 按竞品词分类,按营销需要分类:①Core关键词; ②长尾关键词core关键词的基本三度:相关性(高或高)、人气(并不少见,搜索量大)、竞争(较高,符合企业实力)尾关键词的特点: ①单长尾关键词搜索量小; ②长尾词搜索频率不稳定; ③长尾关键词有大量候选词; ④ 长尾关键词需要更清晰的需求; ⑤长尾关键词转化率比较高; ⑥ 长尾词更容易推广; ⑦长尾关键词长度较长,一般由几个词组成。 关键词的合集:①根据业务找基本词; ② 向公司收取; ③ 从公司外采集。公司代收:①按公司产品代收; ② 按公司品牌采集; ③根据公司行业采集; ④ 要求公司同事在公司外采集: ① 根据百度下拉采集; ② 基于百度相关搜索的采集; ③ 使用站长工具采集; ④ 使用爱站网关键词探工具采集; ⑤百度指数; ⑥关键词工具——百度关键词规划师; ⑦ Nagao Word 工具

  四、关键词select

  它可以基于相关性、受欢迎程度和竞争。

  五、如何添加页面收录?

  ①合理增加内外链接;

  ②定期添加内容;

  ③ 做原创content

  六、什么是页面权重?影响页面权重的因素有哪些?

  PR:它是搜索引擎对网页重要性的排名。页面权重越高,排名越好。

  影响因素:

  ①页面质量:文章内容为原创/伪原创/或抄袭;

  ②网站是否定期更新;

  ③链接的数量和质量;

  ④ 服务器的质量

  ⑤ 用户体验

  七、影响关键词排名的因素有哪些?

  ①目标关键词与页面内容的相关性

  ②原创页面内容的性别

  ③站内链接设置和权重转移

  ④页面布局关键词

  ⑤外部链接增加权重和排名

  ⑥ 友情链接与自己网页的相关性

  八、页面代码优化有哪些方面?三大标签优化html标签优化js、css代码优化

  九、网站url 从哪些方面优化? URL 级别和命名站点链接优化

  十、什么是url标准化? url标准化的作用是什么?

  多个域名对应同一个内容,搜索引擎选择其中一个代表,其他的忽略

  效果:标准化网页是我们开发的网页。首页权重不分散,杜绝内容重复风险

  10一、网站内容优化有哪些方面?

  网站原创和伪原创、网站内容定期更新

  网站内容原创Tips:流程化建设原创文章

  ① 参考target关键词原创title

  ②根据文章title列出字幕

  ③ 在副标题周围写文章content

  网站内容伪原创提示:

  伪原创初级技能:

  多篇文章整合成一篇文章:

  ① 引用目标关键词,找到多个引用文章并写上标题;

  ②根据文章title列出字幕;

  ③ 内容组织围绕字幕编写(标题为主线);

  ④ 最后按照6种方式修改文章内容伪原创

  十二、robots.txt文件是什么? robots.txt 有什么作用? robots.txt有哪些注意事项?

  定义:robots.txt是一个纯文本文件,用于声明网站中不想被robots访问的部分,或者指定搜索引擎蜘蛛只抓取指定内容

  作用:①防止隐私内容被搜索引擎抓取; ② 节省服务器资源,从而提高服务质量; ③ 减少重复爬取,提高网站质量; ④ 指定站点地图位置

  robots.txt的基本语法怎么写?按照以下要求写出网站的robots.txt

  ①只允许百度蜘蛛和谷歌蜘蛛访问你的网站

  用户代理:百度蜘蛛

  允许:/

  用户代理:Googlebot

  允许:/

  用户代理:*

  禁止:/

  ② 禁止访问网站中的所有动态页面

  用户代理:*

  禁止:/*?*

  ③ 禁止访问网站的模板文件和plus文件夹下的.php文件

  用户代理:*

  禁止:/templets

  禁止:/plus/*.php#

  十个三、网站需要做网站map吗?为什么?

  必填

  原因:①对于搜索引擎:网站为整个网站提供可抓取的页面

  ②对于访问者:找不到页面时的补救措施

  ③ 对于站长:可以增加搜索流量的潜在着陆页

  Ten四、 我需要制作 404 页面吗?为什么?

  必填,

  功能:①提升用户体验,减少流量损失

  ②让蜘蛛爬行更顺畅,无死链

  ten五、404 页面的制作原理是什么?制作404页面有哪些注意事项?

  原理:①导航链接; ② 搜索功能; ③ 风格一致; ④ 错误反馈

  注意事项:

  ①不要将404页面直接跳转到首页,可能会导致首页在搜索引擎中消失

  ②不要设置404页面自动重定向,让用户自己决定去哪里

  ③ 明确告诉访问者无法找到该页面,内容和布局不能与正常页面过于相似

  ④ 不要使用专业术语提醒访问者是否有拼写错误。

  十六、外链规范写作的三种形式

  锚文本:这是百度!

  超链接:这是百度!

  纯文本:这是百度!

  十七、友情链接

  友情链接的作用?

  功能:①快速增加网站权重; ②提升关键词排名; ③ 提升品牌知名度

  友情链接的交流渠道有哪些?这些渠道有什么特点?

  交流渠道:①站长友情链接平台(可以发布自己的网站信息,让站长积极交流;可以找到好友链目标网站全信息); ②通过QQ*敏*感*词*流(高活跃、高效率); ③通过百度核心关键词搜索(朋友链质量更高,效率比QQ低); ④ 通过联系人(软文或广告资源交换)交换友情链接; ⑤ 购买链接(专门卖友情链接)网站)

  添加友情链接有哪些注意事项?

  慢慢的,一次不要加很多,每天加起来2个,总数不要超过50个。(注意:购买的朋友链,以后可以逐渐放弃付费链接网站的权重增加)自己找关系网站内容相关的朋友链关注朋友链的质量,选择相对高的权重

  通过友情链接作弊的方法有哪些?如何判断友情链接作弊?并说明作弊原理

  ①js代码作弊:搜索引擎识别js能力差,无法传递权重

  判断:查看对方网站的源码,看是否是js调用

  ② iframe 框架作弊:搜索引擎不会收录iframe 框架中的内容

  判断:在对方网站源码中找到“iframe”代码,确认好友链码在嵌套的iframe页面中是作弊

  ③Nofollow属性作弊:添加nofollow属性,权重不随链接推导

  判断:网站站长工具

  写法:好友链关键词

  ④pr劫持作弊:做301或302域名跳转到高PR域名,谷歌更新PR时,会将该域名等同于高PR域名,从而提升PR值得作弊。

  判断:通过站长工具等查看对方网站的PR值,可辨别真假PR

  10八、外链有哪些发布平台?这些平台的特点是什么?并列出推荐平台

  ①分类目录提交

  特点:网站只审核过,很快就会收录

  推荐:hao123、第一类列表等

  ② 分类信息网

  特点:热门网站可以带来流量;只能发送纯文本,权重影响小

  推荐:58、赶集、百行网等

  ③ 博客

  特点:可发锚文本,发布方便,无需审核,可带来流量; 收录速度慢,有被封的风险

  推荐:新浪、网易

  ④ 论坛、社区

  特点:收录Quick,比较快出结果;需要审核,有被屏蔽的风险

  推荐:天涯、和讯、豆瓣等

  ⑤ 新闻来源

  特点:影响力强; 收录快;公信力和权威性的信件;突出自己的品牌

  十九、发布外链的原则是什么?

  ①网站Related:内容相关性,锚文本构建多样化,不链接多个页面;

  ②平台相关:*敏*感*词*广,外链平台权重;

  ③ 通用:外部链接持续稳定增长,关键词禁止上架,避免频繁删除外部链接;

  ④ 继续平稳增长,严禁大幅增减

  ⑤ 避免频繁删除外部链接

  两个十、什么是链轮?为什么要制作链轮?

  定义:SEO链轮是指通过单向、战略性、有计划的链接在互联网上建立大量站点或博客,指向要优化的目标网站以达到预期效果

  功能:提高链轮收录的整体速度;增加链轮的整体重量;占据一个关键词的首页位置

  第二十届一、链轮的模式是什么?各有什么特点?

  第三方博客链轮:成本低,维护简单,搜索引擎容易分配高权重;不容易收录,低质量不容易留在链外

  独立站点链轮:内容可控性高,容易留在链外;维护难度大,建设成本高

  第三方博客链轮+独立站点链轮:有效降低成本,提升博客质量,留外链;维护难度增加

  20二、链轮维修有哪些注意事项?

  ①保证定期更新; ②关注文章品质; ③ 不要关闭链轮,不要交叉链接

  Twenty三、什么是站群? 站群链轮是什么结构?

  站群是很多主题相似的独立站点,遵循sprocket策略指向链接。

  金字塔结构

  20四、站群 有哪些注意事项?隐蔽站群站群不要交叉连接。避免内容重复。二十:五、老域名的优势和风险是什么?

  优点:有外链,收录更快,权重继承,检验期结束,有备案号

  风险:网站可能被K过,网站主题无关,记录号可能被取消,或者有大量404页面

  二十六、写网站到达率低的原因和优化方法

  网站到达率低的原因:

  ①访问量低,点击量高:查看网站访问速度

  ②访问量低,点击量低:检查网站关键词排名是否正常

  优化计划:

  网站访问速度:

  ①服务器质量问题,选择知名idc,稳定安全的空间

  ②网站js太多:优化网站js:接电话或者减少js数量

  ③网站图片太多太大:优化网站图片

  ④ css代码精简

  关键词ranking 问题:

  ①查看品牌词的排名,判断网站是否为K,判断网页收录problem

  ②关键词是否与描述内容一致

  ①目标关键词与页面内容的相关性

  ②原创页面内容的性别

  ③站内链接设置和权重转移

  ④页面布局关键词

  ⑤外部链接增加权重和排名

  ⑥ 友情链接与自己网页的相关性

  二十七、写出网站跳出率高的原因和优化方法

  跳出率高的原因(无深度访谈):

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线