SEO基础知识:搜索引擎蜘蛛工作原理及分类方法解析
优采云 发布时间: 2021-07-15 22:02SEO基础知识:搜索引擎蜘蛛工作原理及分类方法解析
一、SEO 的定义:
搜索引擎优化。在掌握搜索引擎规则的前提下,优化站内和站外网站,在搜索引擎网页收录增加网站,在搜索引擎排名上提高网站关键词,从而提高网站的流量
二、搜索引擎蜘蛛工作原理:
搜索引擎蜘蛛通过链接访问网页,并获取网页的HTML代码存储在数据库中。索引程序通过对抓取的页面进行文本提取、中文分词、去停词等预处理,建立索引数据库,为排名程序的调用做准备。用户输入关键词后,排名程序调用索引库,经过相关性计算等处理,生成一定格式的搜索结果页面
三、关键词的分类方法:
按一般分类,按营销需要
一般分类方法: ①按品牌词分类; ② 按产品或服务分类; ③ 按行业的一般分类; ④ 按人群词分类; ⑤ 按活动词分类; ⑥ 按竞品词分类,按营销需要分类:①Core关键词; ②长尾关键词core关键词的基本三度:相关性(高或高)、人气(并不少见,搜索量大)、竞争(较高,符合企业实力)尾关键词的特点: ①单长尾关键词搜索量小; ②长尾词搜索频率不稳定; ③长尾关键词有大量候选词; ④ 长尾关键词需要更清晰的需求; ⑤长尾关键词转化率比较高; ⑥ 长尾词更容易推广; ⑦长尾关键词长度较长,一般由几个词组成。 关键词的合集:①根据业务找基本词; ② 向公司收取; ③ 从公司外采集。公司代收:①按公司产品代收; ② 按公司品牌采集; ③根据公司行业采集; ④ 要求公司同事在公司外采集: ① 根据百度下拉采集; ② 基于百度相关搜索的采集; ③ 使用站长工具采集; ④ 使用爱站网关键词探工具采集; ⑤百度指数; ⑥关键词工具——百度关键词规划师; ⑦ Nagao Word 工具
四、关键词select
它可以基于相关性、受欢迎程度和竞争。
五、如何添加页面收录?
①合理增加内外链接;
②定期添加内容;
③ 做原创content
六、什么是页面权重?影响页面权重的因素有哪些?
PR:它是搜索引擎对网页重要性的排名。页面权重越高,排名越好。
影响因素:
①页面质量:文章内容为原创/伪原创/或抄袭;
②网站是否定期更新;
③链接的数量和质量;
④ 服务器的质量
⑤ 用户体验
七、影响关键词排名的因素有哪些?
①目标关键词与页面内容的相关性
②原创页面内容的性别
③站内链接设置和权重转移
④页面布局关键词
⑤外部链接增加权重和排名
⑥ 友情链接与自己网页的相关性
八、页面代码优化有哪些方面?三大标签优化html标签优化js、css代码优化
九、网站url 从哪些方面优化? URL 级别和命名站点链接优化
十、什么是url标准化? url标准化的作用是什么?
多个域名对应同一个内容,搜索引擎选择其中一个代表,其他的忽略
效果:标准化网页是我们开发的网页。首页权重不分散,杜绝内容重复风险
10一、网站内容优化有哪些方面?
网站原创和伪原创、网站内容定期更新
网站内容原创Tips:流程化建设原创文章
① 参考target关键词原创title
②根据文章title列出字幕
③ 在副标题周围写文章content
网站内容伪原创提示:
伪原创初级技能:
多篇文章整合成一篇文章:
① 引用目标关键词,找到多个引用文章并写上标题;
②根据文章title列出字幕;
③ 内容组织围绕字幕编写(标题为主线);
④ 最后按照6种方式修改文章内容伪原创
十二、robots.txt文件是什么? robots.txt 有什么作用? robots.txt有哪些注意事项?
定义:robots.txt是一个纯文本文件,用于声明网站中不想被robots访问的部分,或者指定搜索引擎蜘蛛只抓取指定内容
作用:①防止隐私内容被搜索引擎抓取; ② 节省服务器资源,从而提高服务质量; ③ 减少重复爬取,提高网站质量; ④ 指定站点地图位置
robots.txt的基本语法怎么写?按照以下要求写出网站的robots.txt
①只允许百度蜘蛛和谷歌蜘蛛访问你的网站
用户代理:百度蜘蛛
允许:/
用户代理:Googlebot
允许:/
用户代理:*
禁止:/
② 禁止访问网站中的所有动态页面
用户代理:*
禁止:/*?*
③ 禁止访问网站的模板文件和plus文件夹下的.php文件
用户代理:*
禁止:/templets
禁止:/plus/*.php#
十个三、网站需要做网站map吗?为什么?
必填
原因:①对于搜索引擎:网站为整个网站提供可抓取的页面
②对于访问者:找不到页面时的补救措施
③ 对于站长:可以增加搜索流量的潜在着陆页
Ten四、 我需要制作 404 页面吗?为什么?
必填,
功能:①提升用户体验,减少流量损失
②让蜘蛛爬行更顺畅,无死链
ten五、404 页面的制作原理是什么?制作404页面有哪些注意事项?
原理:①导航链接; ② 搜索功能; ③ 风格一致; ④ 错误反馈
注意事项:
①不要将404页面直接跳转到首页,可能会导致首页在搜索引擎中消失
②不要设置404页面自动重定向,让用户自己决定去哪里
③ 明确告诉访问者无法找到该页面,内容和布局不能与正常页面过于相似
④ 不要使用专业术语提醒访问者是否有拼写错误。
十六、外链规范写作的三种形式
锚文本:这是百度!
超链接:这是百度!
纯文本:这是百度!
十七、友情链接
友情链接的作用?
功能:①快速增加网站权重; ②提升关键词排名; ③ 提升品牌知名度
友情链接的交流渠道有哪些?这些渠道有什么特点?
交流渠道:①站长友情链接平台(可以发布自己的网站信息,让站长积极交流;可以找到好友链目标网站全信息); ②通过QQ*敏*感*词*流(高活跃、高效率); ③通过百度核心关键词搜索(朋友链质量更高,效率比QQ低); ④ 通过联系人(软文或广告资源交换)交换友情链接; ⑤ 购买链接(专门卖友情链接)网站)
添加友情链接有哪些注意事项?
慢慢的,一次不要加很多,每天加起来2个,总数不要超过50个。(注意:购买的朋友链,以后可以逐渐放弃付费链接网站的权重增加)自己找关系网站内容相关的朋友链关注朋友链的质量,选择相对高的权重
通过友情链接作弊的方法有哪些?如何判断友情链接作弊?并说明作弊原理
①js代码作弊:搜索引擎识别js能力差,无法传递权重
判断:查看对方网站的源码,看是否是js调用
② iframe 框架作弊:搜索引擎不会收录iframe 框架中的内容
判断:在对方网站源码中找到“iframe”代码,确认好友链码在嵌套的iframe页面中是作弊
③Nofollow属性作弊:添加nofollow属性,权重不随链接推导
判断:网站站长工具
写法:好友链关键词
④pr劫持作弊:做301或302域名跳转到高PR域名,谷歌更新PR时,会将该域名等同于高PR域名,从而提升PR值得作弊。
判断:通过站长工具等查看对方网站的PR值,可辨别真假PR
10八、外链有哪些发布平台?这些平台的特点是什么?并列出推荐平台
①分类目录提交
特点:网站只审核过,很快就会收录
推荐:hao123、第一类列表等
② 分类信息网
特点:热门网站可以带来流量;只能发送纯文本,权重影响小
推荐:58、赶集、百行网等
③ 博客
特点:可发锚文本,发布方便,无需审核,可带来流量; 收录速度慢,有被封的风险
推荐:新浪、网易
④ 论坛、社区
特点:收录Quick,比较快出结果;需要审核,有被屏蔽的风险
推荐:天涯、和讯、豆瓣等
⑤ 新闻来源
特点:影响力强; 收录快;公信力和权威性的信件;突出自己的品牌
十九、发布外链的原则是什么?
①网站Related:内容相关性,锚文本构建多样化,不链接多个页面;
②平台相关:*敏*感*词*广,外链平台权重;
③ 通用:外部链接持续稳定增长,关键词禁止上架,避免频繁删除外部链接;
④ 继续平稳增长,严禁大幅增减
⑤ 避免频繁删除外部链接
两个十、什么是链轮?为什么要制作链轮?
定义:SEO链轮是指通过单向、战略性、有计划的链接在互联网上建立大量站点或博客,指向要优化的目标网站以达到预期效果
功能:提高链轮收录的整体速度;增加链轮的整体重量;占据一个关键词的首页位置
第二十届一、链轮的模式是什么?各有什么特点?
第三方博客链轮:成本低,维护简单,搜索引擎容易分配高权重;不容易收录,低质量不容易留在链外
独立站点链轮:内容可控性高,容易留在链外;维护难度大,建设成本高
第三方博客链轮+独立站点链轮:有效降低成本,提升博客质量,留外链;维护难度增加
20二、链轮维修有哪些注意事项?
①保证定期更新; ②关注文章品质; ③ 不要关闭链轮,不要交叉链接
Twenty三、什么是站群? 站群链轮是什么结构?
站群是很多主题相似的独立站点,遵循sprocket策略指向链接。
金字塔结构
20四、站群 有哪些注意事项?隐蔽站群站群不要交叉连接。避免内容重复。二十:五、老域名的优势和风险是什么?
优点:有外链,收录更快,权重继承,检验期结束,有备案号
风险:网站可能被K过,网站主题无关,记录号可能被取消,或者有大量404页面
二十六、写网站到达率低的原因和优化方法
网站到达率低的原因:
①访问量低,点击量高:查看网站访问速度
②访问量低,点击量低:检查网站关键词排名是否正常
优化计划:
网站访问速度:
①服务器质量问题,选择知名idc,稳定安全的空间
②网站js太多:优化网站js:接电话或者减少js数量
③网站图片太多太大:优化网站图片
④ css代码精简
关键词ranking 问题:
①查看品牌词的排名,判断网站是否为K,判断网页收录problem
②关键词是否与描述内容一致
①目标关键词与页面内容的相关性
②原创页面内容的性别
③站内链接设置和权重转移
④页面布局关键词
⑤外部链接增加权重和排名
⑥ 友情链接与自己网页的相关性
二十七、写出网站跳出率高的原因和优化方法
跳出率高的原因(无深度访谈):