正式推出:站点接入:第三方数据采集系统生效的第一步
优采云 发布时间: 2022-10-15 02:44正式推出:站点接入:第三方数据采集系统生效的第一步
“对于第三方数据采集系统,第一个链接是注册和访问网站或应用程序。”
很久以前,我们分享了埋点和数据采集系统采集的一些基本内容。今天给大家分享一下数据采集系统的站点注册访问模块的一些细节。
01
—
什么是网站访问权限
首先需要明确的是,我们这里的主要分析对象是第三方数据采集平台。
为什么需要指定这个?我们先来看看网站的访问权限是什么。下图为友盟网站访问截图:
从这个流程图我们可以清楚的了解到,所谓站点访问就是填写我们要执行数据的网站、APP或者小程序等的基本信息采集等., 生成网站唯一标识符以用于采集数据标识的过程。
因此,如果是您自己的采集自己的网站流量行为或其他行为,则不需要【站点注册和访问】这个链接。第三方数据采集平台,出发点是为各个平台提供服务,所以需要区分不同平台的数据,需要注册和访问网站。
本站访问流程完成后,可以通过数据采集系统查看网站的采集信息。
02
—
站点访问通常包括哪些步骤?
一般来说,一个站点的访问过程主要包括以下几个步骤:
(1) 网站注册
网站注册的核心意义在于区分不同的站点。就像C端用户使用的任何新产品一样,都需要先注册,只不过这里的注册对象变成了网站。
注册通常需要哪些信息?上图中我们看到了友盟的内容,再看百度统计网站注册时的信息:
其实APP端的站点注册和web端的站点注册是有区别的。不同站点注册信息的区别可以有以下区别:
埋藏的域名或站点名称通常需要反复检查,以免重复。
审核通过后,将为访问的站点生成唯一的站点标识符。
(2) 生成JS代码或SDK
注册成功后,会根据不同的终端(PC端或手机端)生成不同的代码内容。PC端生成一段JS代码,手机APP端生成SDK。
实际上,主要是将站点唯一ID嵌入代码中。
比如下面的代码就是百度统计PC生成的JS代码:
var _hmt = _hmt || [];(function() { var hm = document.createElement("script"); hm.src = "https://hm.baidu.com/hm.js?7cf14fcca2e14b8b"; var s = document.getElementsByTagName("script")[0];
(3) 拥有网站埋点
下载完SDK或者复制JS代码后,下一步就是把点埋在自己的网站(也就是要追踪数据的网站)中。
以PC端为例。研发学生需要将此代码复制并粘贴到要跟踪的每个网页中。通常需要在所有页面的网站标签之前添加代码。
另外,在类似于header.htm的header模板页面中安装,可以达到一次安装,全站的效果。
(4) 链接验证
当自有网站侧嵌入代码上线时,采集平台会检查数据流是否有链接问题。
03
—
工业产品设计参考
在这里,我们系统地跟踪几个常用的第三方数据跟踪网站的站点访问过程,以供参考。
(1) 友盟U-APP
注册应用程序:
下载并集成基础 SDK
初始化代码:
代码验证:
(2) 感官数据
选择如何埋点:
JS SDK 自动生成:
Sensors Data 的这个模块非常有趣。它遵循各种内容的自定义选择,最终生成埋点代码。
以上就是今天分享的主要内容。后续我们会和大家一起讨论data采集系统的相关细节。
最新发布:2020最新聚合搜索V5
站长评价:上传使用,自动采集更新,不确定是否自动推送,采集应该是百度TOP,具体功能自行摸索,看demo!
源码介绍:
完美的 MIP 效果。正确推动
自带MIP推送、主动推送、熊掌推送php代码,秒杀市面上所有聚合搜索推送代码!一访问就推送给你,mip端站长平台,站长平台,熊掌平台
自设违禁词关键词过滤
独立设置伪静态规则,你可以使用任何你想要的后缀。
不仅支持实时热点新闻词采集,还有实时热点、电影、电视剧、综艺、*敏*感*词*、小说、游戏、人物、汽车、生活、科技、以及全站源码中的旅游栏目,也就是每栏采集关键词的12条行业资讯!还有小列,所以不知道12列的采集信息。
截图演示: