网站内容分析报告(网站分析的数据分成两个大类,什么时间点通过什么途径用什么浏览器 )

优采云 发布时间: 2022-02-14 05:31

  网站内容分析报告(网站分析的数据分成两个大类,什么时间点通过什么途径用什么浏览器

)

  这里,网站分析的数据分为两类,一类是内部数据,一类是第三方数据,如图1-3所示。

  

  图1-3 网站分析的数据源结构

  1.内部数据:收录数据库和服务器日志

  (1)数据库上的数据包括但不限于用户数据、网站内容、订单数据和用户行为,主要是以post或get的形式抛出的数据,后台程序接收后在数据库记录中,通常是记录一些与网站内容相关或重要程度较高的数据,比如交易金额,这些数据必须存储在自己的数据库中。

  (2)服务器日志是一些原创访问者访问服务器产品的记录。日志是一个以.log结尾的文件,记录了Web服务器接收和处理请求以及运行时错误等各种原创信息。要成为准确的说应该是Server日志。网站日志最大的意义就是记录网站的空间操作、访问请求等操作,通过网站日志可以清楚的知道什么IP,你的网站的哪个页面是在什么时间被访问的,在什么操作系统下,什么浏览器,什么分辨率的显示器,访问是否成功。

  如图1-4所示,为站点的日志信息。您可以从框中得知访问者的 IP、时间戳、相对路径、Referral 信息、浏览器类型、内核等信息。

  

  图 1-4 服务器日志记录

  从上面我们可以知道,这是来自百度爬虫,什么浏览器在什么时间,通过什么路由访问了什么页面。

  基于时间戳可以做访问者的行为分析,少量的日志可以用excel处理,大量的日志可以用程序处理。

  除了以上信息,服务器日志还可以添加自定义信息,例如域名和cookies,以便更好的数据采集和用户识别。

  对于企业来说,日志信息一般通过ETL(Extraction-Transformation-Loading,数据提取、转换和加载)存储在数据库中。一般来说,数据库数据和日志数据主要用于BI建设。如果开发和数据团队足够强大,会做一些机器学习和深度学习的工作。

  2.第三方数据:网站分析工具和第三方评估数据

  (1)网站分析工具,如GA、Adobe Analytics、百度统计等。通常此类工具只需要在页面中添加跟踪代码即可提供详细的分析报告,也会用到受到众多中小企业的计划。

  以 GA 为例,其原理是跟踪 JavaScript 在页面加载时会采集相关数据,并以虚拟一像素图片的形式将数据推送到 GA 服务器,如图 1-5 所示,这是GA采集的信息

  图 1-5 发布到 GA 的数据

  然后 GA 将上述数据拆分成报表,传递参数的解释将在后面的章节中详细讲解。

  (2)第三方评价数据:比如Alexa、SimilarWeb等,可以让用户评价自己的网站现状,或者分析竞争对手的数据,通常这些数据是经过算法采样得到的处理,只能作为参考,如果你的站点排名靠后,误差会更大,参考值会更低。

  一般来说,如果是流量数据,主要是基于网站分析工具。如果是订单数据,主要是基于自己的BI。当然,GA 数据和它自己的 BI 数据是通过 User ID 连接起来的。做一些其他的分析工作。

  目前网站分析数据采集主要有两个方向:服务器日志技术和页面标签技术。页面标注技术对应之前的网站分析工具,现在主流是使用页面标注技术,可以看到流行的GA、百度统计、CNZZ、Adobe Analytics等都采用这种模式。受欢迎的主要原因是:技术上,页面分析技术更容易实现;另一方面,随着近几年云计算的蓬勃发展,存储成本大大降低,计算能力得到提升,采集接收到的数据在第三个-方服务器,因此数据的维护成本也大大降低。

  服务器日志技术和页面标注技术这两种方法各有优缺点,在数据准确性方面无法保证完全准确,而对于分析来说,没有那么高的精度要求,我们只需要准确的数据,然后就足以检查趋势,通过数据趋势判断问题,定位原因。上述两种方法的优缺点如表 1-1 所示。

  表1-1 服务器日志技术和页面标签技术优缺点对比

  

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线