GDPR之后欧洲新闻网站第三方内容的变化

优采云 发布时间: 2022-05-21 01:36

  GDPR之后欧洲新闻网站第三方内容的变化

  

  蒂莫西·利伯特(TimothyLibert)

  卡耐基梅隆大学和前任路透社新闻研究所研究员,牛津大学

  卢卡斯·格雷夫斯( Lucas Graves)

  路透社新闻研究所高级研究员,牛津大学

  拉斯姆斯·克莱斯·尼尔森(RasmusKleis Nielsen)路透社新闻研究所主任政治传播教授,牛津大学

  本文翻译

  对外经济贸易大学数字经济与法律创新研究中心

  引言

  本报道比较了欧盟通用数据保护条例(GDPR)实施前一个月和一个月后,在一系列欧洲新闻网站上第三方网站内容和cookie的普及程度。为了去理解新闻机构如何适应新的隐私框架,我们在2018年4月和7月期间使用专门构建的软件工具webXray对七个国家(芬兰,法国,德国,意大利,波兰,*敏*感*词*和英国)的重要新闻网站进行了分析,该工具可以跟踪在给定网站上加载内容的外部网络以及潜在追踪用户。

  本研究基于一篇早期报告《欧洲新闻网站的第三方网站内容:潜在挑战与隐私完善路径》,该报告比较了2018年的前三个月新闻网站与其他热门网站上的第三方内容。我们之前的检测表明,新闻网站的第三方内容和Cookie数量往往比其他热门网站多得多。在GDPR之前,我们确定了新闻网站可以采取的几个步骤来完善用户隐私,例如迁移第三方服务(如社交媒体共享工具)以在第一方基础上运行。

  目前的调查发现,大多数被研究国家的新闻网站在没有GDPR后的用户同意的情况下设置的cookie要大幅减少。根据对4月和7月安装了webXray软件平台的200多个新闻网站的主页的分析,我们共捕获了10,168个页面加载,近100万个内容请求和270万个cookie。在此基础上,我们发现新闻网站上第三方cookie的总数下降了22%,其中包括广告和营销(14%)和社交媒体(9%)的cookie显著下降,以及放置了第三方社交媒体新闻网站内容(如来自Facebook或Twitter分享按钮)7个百分点的下降。(此处显示的所有结果都反映了获得同意之前的网站活动;一旦用户提供GDPR要求的肯定的“选择加入”,数据可能会发生巨大变化。)这些变化表明一些新闻机构通过获得第三方追踪同意来或通过限制外部cookie的使用以响应GDPR。

  虽然包含某种形式的第三方内容的新闻提供商的网页(99%)或第三方Cookie(98%)的总体比例没有变化,每个新闻网站上发现的平均第三方数量也保持相当的稳定,但是我们发现,4月(GDPR前)和7月(GDPR后)之间有一些个别的变化:

  •每页新闻网站的第三方Cookie数量都下降了22%。4月份cookie数量排名第二小的德国新闻网站,其变化最小,cookie数量减少了6%。4月份每页的Cookie数量最多的英国新闻网站,截至7月份减少了45%。

  •托管第三方社交媒体内容(如Facebook或Twitter分享按钮)的新闻网站的比例大幅下降,从4月的84%降至7月的77%。

  •4月到7月期间,第三方cookie的减少因设置cookie的内容类型而异。在我们的样本中,平均而言,来自设计优化工具的Cookie数量下降了27%,广告和营销Cookie下降了14%,社交媒体cookie下降了9%。

  • 美国的科技公司谷歌(96%),Facebook(70%)和亚马逊(57%)仍然是我们样本中新闻网站数量最多的国家;其中,只有Facebook在GDPR之后的覆盖面显著下降(下降了5个百分点)。但是,大多数在4月份最广泛存在的其他公司的GDPR后期覆盖率大幅下降,有的多达10个百分点甚至更多。

  背景:第三方网站内容

  现代网站很少是独立的,通常包括第一方和第三方内容的混合。 第一方内容被定义为从用户在其浏览器窗口中看到的地址下载的材料,该浏览器窗口通常是用户意图访问的出口或组织。例如,地址为“”的网站可能包含从“”下载的第一方图片。

  相比之下,第三方内容是从不同的地址下载的,并且在许多情况下是与用户访问的网站不同的公司。

  如果''包含一个托管在地址''的视频,则表示''是第三方内容主机,'newsvideo.mp4'是第三方内容。当网站上存在第三方内容时,有关用户浏览习惯的数据可能会转移给第三方,从而对隐私产生潜在影响。

  网站使用第三方内容用于各种目的。 广告和营销是最有名的,并且这样的内容通常依赖于“跟踪”用户的网页浏览以展示针对用户兴趣定制的广告。网站还使用第三方来协助各种其他功能,例如衡量受众的规模和性质,优化网站设计,促进社交媒体分享,推荐相关文章,并托管视频等内容。根据数据的收集和使用方式,此类服务可能纳入GDPR范围之下。

  尽管GDPR是一项新法,但它是一种完善的隐私监管进步,可以让用户对于如何收集和使用个人信息享有控制权。 GDPR对如何处理各类数据设置了实质性限制,并且在许多情况下要求用户给予肯定的“选择加入”,并且对违法者施以巨额*敏*感*词*。因此,在处理在给定网站上收集的数据之前,为了定制广告等目的而收集用户数据的网站和第三方可能需要获得用户同意。

  网站选择和第三方内容衡量

  本研究选择了七个国家来代表欧盟的人口规模和媒体市场。 所研究的国家是芬兰,法国,德国,意大利,波兰,*敏*感*词*和英国。 在每个国家,我们都选取了一系列重要的新闻网站,这些新闻网站是根据以前的衡量其影响范围和重要性的工作来选择的(纽曼等,2017)。有关网站选择的其他详细信息,请参阅方法附录。

  为了衡量所选网站上第三方内容的存在和性质,我们使用了开源软件工具webXray。1此工具通过在Chrome网络浏览器中打开页面并创建一个没有cookie或历史的新用户配置文件来分析页面。然后,该软件会在Chrome中加载该页面,在此期间,所有对第三方内容的请求都会受到监控。 浏览器绝不会以任何方式与之交互,也不会点击任何cookie或跟踪同意按钮。等待30秒后,webXray从内部数据库中提取所有内容,记录它们并关闭浏览器。 由于各种因素,例如阻止自动浏览器的网站,webXray可能会错过一些内容请求。因此,webXray产生的度量是低限度度量,给定页面上第三方的真实数量可能更高。

  本报道中比较了两组数据,这些数据来自2018年4月和7月期间的测量结果。这些被选中的月份代表在欧盟引入GDPR前一个月和一个月后的样本。有关样本和方法的更多详细信息,请参阅附录。

  最高级调查结果

  在我们之前的报道中,根据2018年前三个月收集的数据,我们发现99%的新闻网站包含某种形式的第三方内容,99%的新闻网站至少设置了一个第三方cookie(利伯特和尼尔森,2018年)。这些广泛的措施在4月至7月期间保持不变- 在GDPR之后第三方内容和cookie的使用仍然是有效的。 但是,如果深入研究数据则会发现一些重大变化。

  

  图1.每页中第三方域名和cookie的变化(括号中四月-七月的变化)

  根据图1,从4月到7月,cookie数量下降了22%,尽管在给定页面负载上发现的第三方数量总计从41个减少到40个,这只是一个微不足道的边际变化。

  

  图2. 国家每页第三方域名(括号中四月-七月的变化)

  然而,在每个国家的基础上,如图2,我们发现变化很大,七个国家中有五个国家的新闻网站平均第三方数量下降。 法国的这一数字下降了16%,英国下降了13%,*敏*感*词*下降了12%,芬兰下降了8%,意大利下降了4%;德国4月份的新闻网站已经拥有的第三方域名远远少于大多数国家,但没有任何变化。这表明虽然一些国家正在进行调整,但这种变化是不均衡的,可能反映出对GDPR的不同解释。

  每页的平均第三方cookie数量比图1中的所有数据下降了22%,各国的差异很大,如图3所示。4月份cookie数量排名第二的德国新闻网站,7月份cookie减少6%,变化最小。英国新闻网站4月份cookie数量最多,7月份每页cookie数量减少45%,在7个国家中排名第四。 *敏*感*词*,法国和意大利的cookie减少了30%以上。 再次重要的是要强调这些是在不点击任何cookie通知的情况下设置的cookie;接受cookie的用户可能会有更多设置。

  

  图3. 各国每页第三方cookie(括号中四月-七月的变化)

  虽然几乎所有国家都在保持原状或经历过下降,但波兰的每页第三方增长了29%,第三方cookie增加了20%。这主要是由于所测试的29个网站中有4个网站大幅增加。 我们可能不排除这些网站可能已经改变了影响我们的测量工具的方式,当排除这四个网站时,我们发现其余25个网站的平均Cookie数量是静态的,更接近其他国家的趋势。

  根据图1,从4月到7月,cookie数量下降了22%,尽管在给定页面负载上发现的第三方数量总计从41个减少到40个,这只是一个微不足道的边际变化。

  然而,在每个国家的基础上,如图2,我们发现变化

  目前,不可能肯定地说我们观察到的变化为什么发生,并且一些变化可能与GDPR无关。但是,值得注意的是至少有两个可能的因素。首先,由于GDPR的同意要求,新闻机构可能只是推迟一些跟踪cookie,直到用户点击在弹出同意对话框中接受该网站的条款。这也可能意味着,根据给定用户的偏好,最终设置的cookie数量可能相似 - 但是基于肯定的选择加入,这是GDPR下多种数据收集和处理所需要的。

  其次,我们可能正在观察一种“清理房屋”的效果。 现代网站非常复杂,并且会以与路径相关的方式随着时间的推移而发展,有时会积累过时的功能和代码。 GDPR的引入可能使新闻机构有机会评估各种功能(包括第三方服务)的效用,并删除不再使用或损害用户隐私的代码。 仔细查看要删除的内容类型可以深入了解此因素

  第三方同意的类型

  如上所述,第三方内容用于不同目的,顶级调查结果模糊了新闻行业所依赖的常见类别中更细粒度的变化。 这里再次区分不同种类内容的存在和普遍性是有用的。如图4所示,我们发现至少有一个第三方广告,受众测量,内容推荐,设计优化和托管的页面百分比几乎没有变化。

  

  图4. 内容cookie使用(括号中四月-七月的变化)

  唯一可观的转变是,在有第三方社交媒体内容的网站中,这一比例下降了7个百分点(8%) - 换句话说,许多新闻网站甚至不包括从社交媒体公司加载的内容 - 第三方内容推荐系统的使用率下降了6%。 此种变化与我们之前的报告是一致的,该报告为了减少GDPR合规的潜在问题,建议将删除第三方社交媒体内容作为一个可能的步骤。

  尽管当前的内容类型并未发生显著变化,但现在许多类型的内容都在未经用户同意的情况下以较低的比率设置cookie。 如图5所示,设置cookie的内容比例在六种类型的内容中有四种减少,广告和营销cookie下降了14%,设计优化下降了27%,社交媒体下降了9%。

  

  图5. 内容cookie使用(括号中四月-七月的变化)

  特定公司的普及程度

  用于本研究的软件webXray能够识别与第三方内容相关的近500种不同的公司和服务。 在四月和七月,Google,Facebook和亚马逊在我们的分析欧洲新闻网站中份额位列前三。

  Google在所有的新闻网站中四月份占比97%,七月占比96%,其托管了多种服务,并且如表1所示,在特定服务上,Google的影响范围有轻微下降。

  

  表1.内容来自Google下属公司和服务的网站比例

  除Google之外,许多公司的总体影响力表现出下降,这从比较表2(显示四月份追踪占比最高的公司)和表3(七月份的相同数据)可以看出。

  

  表2.内容来自公司的新闻网站内容比例,2018年四月

  

  表3.内容来自公司的新闻网站内容比例,2018年七月

  在前三名中,只有Facebook的覆盖面显著下降,但许多其他公司的影响力下降幅度更大。 4月份,所有前十大公司都追踪至少50%的页面,而7月份只有5家公司这样做。尽管Oath,AppNexus,RubiconProject和Oracle(以及丹麦广告技术公司AdForm和英国的WPP)的追踪率都从50%以上降至以下,但追踪率最高的10家公司中仍有8家是美国公司。

  如上所述,新闻网站上第三方社交媒体服务的普及程度大幅下降。进一步研究表明,社交媒体服务的下降幅度各不相同。 Facebook在新闻页面中的存在率从75%降至70%,Twitter从31%降至29%,AddThis从20%降至10%。AddThis使用量的下降对其母公司Oracle产生了尤其强烈的影响,Oracle已从总体跟踪网站的53%下降到32%。

  结论

  在我们之前的报道中,我们注意到欧洲的许多网站都包含大量第三方内容和Cookie,这些内容和Cookie可能会导致GDPR合规的潜在问题和以及更广泛地引发隐私问题。同样,我们发现新闻网站在GDPR背景下下可能面临比其他热门网站更大的挑战,因为它们严重依赖第三方。我们建议迁移某些第三方内容以在第一方的基础上运行,例如建议社交媒体内容优先用于迁移。

  在本报道中,我们比较了GDPR前(4月)和GDPR之后(7月)的第三方内容和cookie,发现在此期间发生了很多变化。虽然在几乎所有新闻网站上仍然可以找到外部内容和cookie,但我们看到的第三方内容则少得多,第三方cookie也明显减少,各国差异较大,英国下降幅度最大。一些最大幅度的下降出现在广告和营销cookie以及社交媒体内容中,这表明新闻网站可能已经认识到某些内容所带来的潜在合规风险,并已将其删除或用户肯定的选择加入。总之,我们发现GDPR的引入之后,许多欧洲新闻网站未经许可就设置的第三方cookie的数量大幅减少了。

  参考文献

  Libert, T. 2018.AnAutomated Approach to Auditing Disclosure of Third-Party Data Collection inWebsite Privacy Policies. In Proceedings of WWW 2018: The 2018 Web Conference (International World Wide Web Conference Committee), 207-16.

  Libert, T., andNielsen, R. K. 2018.Third-Party Web ContentonEUNews Sites: Potential ChallengesandPaths to Privacy Improvement. Oxford: ReutersInstitute for the Study of Journalism.

  Newman,N.,Fletcher,R.,Kalogeropoulos,A.,Levy,D.

  A. L., and Nielsen,R. K. 2017. ReutersInstitute Digital News Report 2017. Oxford:Reuters Institute for the Study of Journalism.

  方法附录

  在本研究中,有两个主要的方法论考虑因素:开发研究网站列表,以及衡量隐私影响。这些步骤详述如下:

  网站选择

  对于每个国家,我们都选择了新闻网站和热门网站列表进行分析。对于新闻,路透社新闻研究所的前期工作被用来确定德国的30个新闻网站,*敏*感*词*33个,芬兰20个,法国30个,意大利31个,波兰29个,英国31个。

  测量隐私影响

  一旦组合了页面列表,就会开始测量2018年4月和7月的隐私影响。为此,我们使用了开源软件工具webXray。该工具已被广泛用于学术研究(例如利伯特,2018)。如上所述,对于此研究,webXray配置为使用ChromeWeb浏览器。选择此浏览器是因为它受用户欢迎,并且可以在自动化环境中运行。

  为了确保测量反映的是用户能在欧盟看到的内容,我们使用了位于英国牛津大学的计算机。这在cookie方面尤其重要,因为欧盟用户与其他地区(如美国)的用户有着不同的法律保护。

  

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线