seo网站日志分析工具( 蜘蛛有没有来过你的网站日志分析工具(组图))
优采云 发布时间: 2021-11-13 17:23seo网站日志分析工具(
蜘蛛有没有来过你的网站日志分析工具(组图))
分析网站的日志,看看蜘蛛是否偏爱你的网站?
一、查看网站的爬取状态
1、新站刚上线,看看搜索引擎有没有来找你网站
2、网站收录异常,或者是k,你可以从日志中知道搜索引擎是否还会来光顾你网站
3、解决网站的问题,必须阅读日志
二、如何查找网站日志?
通常,FTP 中有一个名为logs 的文件夹。我的呼叫中心系统 网站 中有不同的服务器。日志文件的名称可能不同,但它们肯定会收录日志文件 关键词。
三、如何打开日志?
下载解压后,用文本编辑器打开即可。如果出现乱码,可以用Editplus或Dreamweaver等网页编辑器打开。一般我喜欢用光年日志分析工具。
四、主要搜索引擎蜘蛛的名称:
打开日志后,我们可以看到如下搜索引擎蜘蛛名,分别代表哪个搜索引擎访问了你的网站。
百度:baiduspider
谷歌=谷歌机器人
msn: msnbot
雅虎:啜饮
yodao:有道机器人
搜狗:搜狗+get+蜘蛛
360:360蜘蛛
五:日志反汇编
在日志中搜索上述蜘蛛的名字,可以清楚的了解蜘蛛是否来到了你的网站,并知道蜘蛛在爬你的网站页面。从网站下载的网站日志中,可以看到txt文本中有如下数据:
117.26.203.167--[02/May/2011:01:57:44 -0700] "GET/index.php HTTP/1.1 "500 19967"-""Mozilla/4.0(兼容;MSIE 8.0;Windows NT 5.1;Trident/4.0;AskTbCS-ST/5.11.3.15590;.NET CLR 2.0.50727;Alexa 工具栏)”
分析:
117.26.203.167访问ip
02/May/2011:01:57:44 -0700 访问日期-时区
GET/index.php HTTP/1.1 根据HTTP/1.1协议爬取(域名下)/index.php这个页面(GET表示服务器动作)
500 服务器响应状态码
服务器响应状态码通常有以下状态码:200、301、302、304、404、500等。200表示用户已经成功获取到请求的文件。如果是搜索引擎,就证明蜘蛛在这次爬行过程中成功发现了一些新的内容。而301表示用户访问的某个页面的URL被301重定向(永久),302是临时重定向。404 表示访问的页面不再存在,或者访问的 URL 是错误的。500 是服务器错误。
19967 表示捕获了 19967 个字节
Mozilla/4.0(兼容;MSIE 8.0;Windows NT 5.1;Trident/4.0;AskTbCS-ST/5.11.3.15590; .NET CLR 2.0.50727; Alexa Toolbar是指访问者使用火狐浏览器和Alexa Toolbar等访问终端信息
如果你的日志格式不一样,说明日志格式设置不一样。
六、网站 日志有seo的信息
不同的服务器或虚拟主机有不同的日志记录。
一些如:200 0 33834 237 953 我们可以通过多看几条记录,观察规律来判断第三个数字代表的字节数。
一些如:200 0 0 或 200 0 64 这是未记录时捕获的字节数。注意:200 0 0 和 200 0 64 不代表任何问题。所谓200 0 64就是说要为K的备注是没有依据的,一般网站有64个代码。
在日志中发现更多的HTTP状态码有200(正常)、304(无变化)、404(错误链接)。
304 表示内容自上次爬取后未更新。一般情况下,网站的图片往往会返回这个值。
404表示呼叫中心系统中网站访问的链接是错误链接。这个错误的链接,一方面来自原来存在然后删除的网页。另一方面,它可能来自一个不存在的死链接,但其他人链接到它。