*敏*感*词*教学利于蜘蛛抓取的url集权操作

优采云 发布时间: 2022-05-07 13:09

  *敏*感*词*教学利于蜘蛛抓取的url集权操作

  

  什么是URL,URL的认知?

  URL指的就是网站路径,简单的说就是指网站的地址或者网页链接,比如或者都是url。

  虽然URL都是指网站或者网页的地址,其实它也有分类。一般来说,网站的页面路径可以分为两大类别,也就是静态页面路径和动态页面路径。

  一:动态URL(以下统称为地址)

  动态地址就是在网址中带有& ? = $ 等特殊符号的地址,当然后缀为php,asp等结尾的,都是动态地址,此类网址一般层级很多,地址也很长,不推荐使用。确实需要,可以做伪静态处理,便于蜘蛛的抓取。

  二:静态地址

  静态地址就是以htm html shtml为后缀的地址,推荐使用。

  知道了什么叫做URL,下边我们就着重来和大家聊聊如何做好URL的优化和集权操作。

  一:优化

  1:减少目录层级

  2:去掉后缀。例如或者index.html一定要把/之后的尾巴去掉,减少蜘蛛的请求次数

  3:去掉多余的路径层。例如我们可以修改为简单好看,层级清晰,且蜘蛛利于抓取

  强调的是,路径中不能有中文,蜘蛛再抓取中文时候需要解码,一解码地址就会变的很长,也容易出错。这里有的朋友优惠说,是不是用拼音就可以呢,这个是需要根据实际情况来定。比如说目录为SEO技术文章,如果要拼seojishuwenzhang,感觉好长,不好看不易记不说也不美观,可以写成wenzhang

  4:不一定是越短越好,有些朋友会说,你说地址断了就好,那我可不可以写成呢,答案是不可以,虽然这样地址很短,但最起码的网站的层级得不到显示这样写也是不对的

  5:确保你的地址唯一,有的朋友的地址,比如或者同样都可以浏览访问到同一个页面,这时候请注意,一定要把后者的尽量的不要展现在网站中,尽量的不要有给点击来源的链接入口,不要让用户可以点击的到。其实做robotx屏蔽也可以,这样做对蜘蛛的友好度会降低,内容少到无所谓,如果多了。大家想想,蜘蛛每次来抓一个页面,你都写着禁止它抓取,那时间一久,蜘蛛会不会觉得你是在故意刁难它?

  6:地址中最好是有包含你的栏目关键词,这样做起来给用户好记忆不说,也利于蜘蛛的识别

  二:集权

  集权其实就是把众多页面的得分集中到某一个点上,通常网站首页,首通过栏目,导航,内容页面。那么内容页,栏目页页都需要有可以链接到首页的权重传递操作;

  首页可以直接到内容,栏目。栏目,内容页也一样要可以直接到首页。其实前边的优化,减少层级,去掉后缀等等也都是在做集权操作

  好了今天就和大家聊到这里,如有不到之处,欢迎朋友们批评指正,大家共同学习共同进步。

  

  

  

  

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线