网站前瞻性,新流量机会内容建设分析(几种常用的用户识别的方法:识别用户的几种方法)
优采云 发布时间: 2022-03-25 13:01网站前瞻性,新流量机会内容建设分析(几种常用的用户识别的方法:识别用户的几种方法)
用户分析是网站分析的重要组成部分。在分析用户之前,我们首先要能够识别每个用户,区分哪些是“NewCustomer”,哪些是“RepeatCustomer”。这不仅可以更清楚地了解有多少用户访问了您的 网站,以及他们是谁(用户 ID、电子邮件、性别、年龄等);它还将帮助您更好地跟踪您的用户,发现他们的行为特征、爱好和个性化设置等,从而更好地把握用户需求,提升用户体验。
通常当你的网站提供注册服务,并且用户已经注册并登录到你的网站,那么就更容易识别用户了,因为网站一般会保存注册的详细信息user 但是,你的网站不需要注册,用户的行为主要是浏览,这使得用户识别更加困难。下面提供几种常见的用户识别方法:
识别用户的几种方法
当用户没有注册登录时,唯一能识别用户的就是用户浏览行为的点击流数据,通常保存在WEB日志中。
1、基于 Cookie 的用户识别
当您通过自定义 Apache 日志格式或 JavaScript 获取用户 cookie 时,您实际上已经找到了一种更有效的用户识别方式。在cookie没有被清除的前提下,可以认为是绑定了一台客户端电脑(一个客户端可能收录多个cookie),所以使用一个cookie来识别用户实际上是指用户使用的客户端电脑。,而不是用户本身。
当然,用cookies识别用户的方法也有缺陷:最常见的是cookie被清除,导致用户无法对应原创记录;同时,由于客户端电脑会被共享,或者用户会访问你的网站,此时cookie不能直接对应用户。
2、基于用户ID的用户识别
基于用户ID的用户识别是最准确的,因为一般用户不会共享他的用户ID,所以我们可以认为数据中的用户ID唯一指向用户,几乎没有偏差。当然,使用用户ID识别用户需要一定的前提条件:网站必须提供用户注册和登录服务,用户ID可以通过某种方式记录在点击流数据中。
3、基于IP的用户识别
IP地址是最容易获取的信息,任何WEB日志都会收录,但其局限性也很明显:伪IP、代理、动态IP、局域网共享同一个公网IP出口……这些情况都会影响基于IP识别用户的准确率,所以IP识别用户的准确率比较低。目前,IP一般不直接用于识别用户。
4、基于IP+Agent的用户识别
同样基于最简单的WEB日志形式,我们可以增加一项--Agent,提高单IP识别用户的准确率。代理也是WEB日志中一般收录的信息。通过IP+Agent的方式,可以适当提高IP代理、公网IP等情况下用户的解析度。同时,还可以通过Agent识别网络爬虫等特殊“用户”。准确度也很低。
因此,对于一个需要用户ID注册登录的网站,用户唯一标识的选择可以遵循以下顺序:用户注册登录时以用户ID为准,用户未登录浏览,应使用用户的cookie。用户未登录且无法获取cookie时,以IP+Agent为准;这样可以最大程度地识别唯一用户。
这里推荐网站日志中cookie项的自定义设置方法,以便更好的识别用户。cookie是从客户端存储的cookie文件记录中获取的。这个文件一般收录一个cookieid,并且在网站中也记录了用户的userid(如果你的网站需要注册登录)并且用户已经登录到你的网站并且cookie 没有被删除),所以在日志文件中记录 cookie 项时,可以先检查 cookie 是否收录用户 ID 信息,如果存在,将用户 ID 写入日志的 cookie 项,如果有不存在,检查是否有cookieid,如果有,记录,如果没有,记录为“-”,这样日志中的cookie就可以直接作为最有效的用户唯一标识进行统计。当然这里要注意的是,这个方法只能由网站自己实现,因为用户ID,作为用户隐私信息,只有网站才能知道cookie的设置和存放位置,而第三方统计工具一般很难获得。.
获取用户信息的方式
通过以上方法实现用户身份的唯一标识后,我们可以通过一些手段采集用户的基本信息、特征信息和行为信息,进而为每个用户建立一个详细的Profile:
1)用户注册时填写的用户注册信息和基本信息;
2)从网站日志中获取的用户浏览行为数据;
3)用户网站从数据库中获取的业务应用数据;
4)基于用户历史数据的推导和预测;
5)通过直接接触用户或通过用户调研获得的用户数据;
6)有第三方服务机构提供的用户数据。
识别和捕捉用户信息的价值
通过用户标识和用户基本信息的采集,我们可以通过网站的各种分析方法实现网站中一些有价值的应用:
基于用户特征信息的用户细分;
基于用户的个性化页面设置;
基于用户行为数据的关联推荐;
基于用户兴趣的定向营销;
...