总结:十年seo经验:如何分析日志来判断网站问题?

优采云 发布时间: 2022-11-28 16:26

  总结:十年seo经验:如何分析日志来判断网站问题?

  注:本站源码仅供学术研究,自娱自乐,不得用于任何非法商业用途

  广告站长推荐,欢聚云优质香港云服务器

  广告采集宝个人免签支付微信登录界面便宜稳定

  云服务器2核2G低至49.68元/年2核4G低至100元/年

  双11,2芯2G4M购后一年低至50,100%抽奖

  

" />

  十年站长seo经验分享如何通过网站日志监控发现网站问题。网站日志是记录网站服务器运行状态信息的文件。以登录网站结束,也可以称为网站服务器日志。服务器将发送...

  网站日志是记录网站服务器运行状态信息的文件。以登录网站结束,也可以称为网站服务器日志。

  服务器会将接收到的用户访问具体信息、服务器返回状态等内容记录在一个单独的日志文件中,以天为单位保存在服务器中。我们可以通过设置服务器自动将日志保存在网站上,或者在服务器提供商的控制面板中将日志下载到网站上。

  网站日志收录

的信息包括网站访问的网页、访问终端1、访问时间、服务器IP服务器返回状态、用户信息等,还包括各种搜索引擎蜘蛛的爬行信息. 一个网站日志的几个搜索引擎抓取记录包括百度蜘蛛、搜狗蜘蛛、谷歌机器人、搜搜蜘蛛、必应机器人、雅皮士蜘蛛。

  由于网站优化中心已经介绍了日志分析方法和软件,这里我们只分析网站日志的监控周期和一些问题。

  网站日志以天为单位记录,每天上班前可以查看前一天的日志。检查时应注意以下三个方面。

  1、观察网站被目标搜索引擎蜘蛛抓取的次数是否有下降。

  

  通常使用网站日志分析软件查看目标搜索引擎的数据。如果抓取减少,可能会导致网站收录量减少。原因可能是网站服务器不稳定,外链减少,网站内容价值过低,网站被处罚。然后结合网站的实际情况来判断蜘蛛抓取减少的具体原因。如果想看是否所有搜索引擎的抓取都减少了,不需要用软件,只需要看当天日志文件的大小就可以了。例如,文件通常是3MB左右,但今天只有IMB,这意味着蜘蛛的爬行减少了。

  2、查看日志中服务器状态是否正常。网站日志中每行末尾的字符是状态代码。正常的服务器状态码应该是200或者301,但是如果出现其他代码,说明服务器没有正常返回请求给用户。根据错误码,可以找到对应的错误页面进行问题排查。

  3、检查是否有搜索引擎惩罚监控蜘蛛爬行。在网站被处罚之前,通常会有某些IP的蜘蛛会爬取网站内容,然后判断是否存在作弊等行为,然后进行下一步操作。比如百度的123.125.68.* IP段被蜘蛛爬取可能会被惩罚。IP以220开头的蜘蛛多半是爬取网页的意思。

  分析网站日志可以提前预知网站是否会出现问题。当然,当网站出现问题时,也可以通过分析网站日志来判断问题的原因。简单来说,网站监控就是预防和解决问题的工作,而分析网站日志是预防问题最重要的方法。

  微信客服下方公众号

  PHP源码|八叶源码|休闲源码|PHP85|源码之家|码农网|站长导航|Archie源码|开源首页|144源码|天源码|免费源码|源码下载|商用源代码|免费织梦模板| 免费 WordPress 主题

  本文/资源来源于网络,由奇偶猫源码整理发布。如需转载,请注明文章出处。

  技术贴:网站LOG日志分析:SEO必备的分析技能

  真正的网站分析是从服务器日志开始的,时至今日,分析服务器(也叫服务器日志文件,简称日志文件)日志仍然是网站分析的重要方法。

  很多站长可能都知道网站日志很重要。可能是因为密密麻麻的弦很让人头疼,所以很多人只是知道,并没有深究。他们不知道网站日志可以为我们做SEO提供很大的帮助。!接下来再说说网站LOG日志。

  网站LOG日志是以(·log)结尾的文件,记录了网站服务器接收和处理请求、运行时错误等各种原创

信息。所以这是我们查看网站SEO数据的一个重要指标。

  什么时候需要分析服务器日志?

  既然分析服务器日志这么复杂,那么我们有必要每天分析服务器日志吗,那么什么情况下我们需要分析服务器日志呢?对此,马海翔建议,如果大家有以下数据监控分析需求,应该使用日志分析的方式。

  (1) 需要了解搜索引擎机器人或其他非人类访问流量,希望对网站进行相应的优化,例如通过分析搜索引擎访问行为进行SEO。

  

" />

  (2) 需要了解普通PC客户端以外的互联网设备访问本网站的情况。

  (3) 需要了解网站的文件资源是否已被用户完整下载和请求。

  (4) 网站流量信息的保密性要求极高,不允许第三方干涉或帮助。

  (5) 对网站服务器的安全性和可维护性有要求,对抵御黑客攻击等非授权访问有非常重大的要求。

  1.查看目录爬取概述

  目录爬取,可以清楚的看到哪些目录被访问网站的蜘蛛爬取了。你应该知道:有些目录是没有价值的,比如一些图标目录、下载目录、消息目录等,还有后台目录和数据库。如果允许蜘蛛爬行,也是一种安全隐患。另一方面,搜索引擎对不同站点都有爬取配额,无用的目录,更不要说占用这样的配额,以免降低有效配额的爬取量。

  二、查看页面抓取概览

  

" />

  页面爬取可以准确的查看蜘蛛爬取的每一个页面,这也是日志分析非常重要的一个环节。例如:爬取多个URL链接?抓取垃圾页面?都可以显示在里面。甚至:某个页面的抓取频率越高,通常意味着这个页面越有价值。

  如果你要优化的页面抓取频率较低,那么你需要增加适当的曝光量才能达到你想要的效果。

  3.查看状态码信息

  状态码有两种,一种是蜘蛛状态码,一种是用户状态码。通过蜘蛛状态码,可以准确判断网站是否存在爬行问题。比如:404代表错误页面,301、302代表重定向,还有一些:504、500等状态码。值得一提的是,除了200状态码外,其他状态码需要注意。当然,如果只是一些个别的项目,就不必费心了。但是如果数量太多,100%的网站都会有问题。

  用户状态码代表了用户的访问状态,在其中可以清楚的看到用户最关注哪些页面。不要以为是小事,懂营销的站长知道自己喜欢什么!

  通过分析服务器日志数据,我们可以看到蜘蛛的活跃程度、亲和度、爬行深度等。被搜索引擎喜欢,我们可以通过对重要目录进行内外调整,增加权重抓取,屏蔽robots文件中的无效页面,有效运营网站。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线