网站内容发布审核流程(文章开始之前,给大家两条建议:1.除非你别无选择 )

优采云 发布时间: 2021-09-07 09:23

  网站内容发布审核流程(文章开始之前,给大家两条建议:1.除非你别无选择

)

  文章在开始之前,给大家两个建议:

  1.除非你别无选择,否则尽量不要从事纯内容审核职位

  2.如果你的工作与运营或产品相关,需要了解内容审核的逻辑

  “儿童收养”这个话题在大多数平台上都极为罕见,但知乎最近爆发了一场危及平台声誉的危机。

  

  内容审核就是这样一个职业。违法信息涉及面广,新的违法信息层出不穷。无论你的经验多么丰富,无论审计系统多么先进,只要出现问题,似乎都是一个非常基础甚至傻瓜式问题。

  知乎这个技术实力和内容审核经验都很强的平台,也会在这个问题上磕磕绊绊,可以预见,知乎以后肯定会重蹈覆辙。一次又一次,不可避免地会出现非法内容的存在带来的危机。有人说,内容审核者从入门到门槛跌跌撞撞,一点也不为过。

  看完这篇文章,你可以进一步了解基于文本的内容审核的逻辑,以及一些图片和短视频的审核技巧,足以补充一个运营或产品的知识储备这个区域。

  不同的公司对审核岗位的分类标准不同,如内容安全审核、内容推荐审核、内容质量审核等类似岗位。虽然在侧重点和具体操作上存在差异,但有很多共同的逻辑。为了避免文章过于复杂,我们这里重点关注最常见的内容安全审计。

  审核模块

  无论审核的内容是什么,都应该包括以下四个基本模块:机器审核、人工审核、用户投诉审核、结果审核。

  

  机器审核是按照既定规则或机器学习算法审核内容。一般成熟的审核系统可以自动审核和处理95%甚至99%以上的内容。如果确定有问题,它将被自动删除。如果难以判断是否有问题,将进行标记并进入人工审核流程。

  人工审核。虽然用户投诉审核和结果审核多为人工审核,但这里所说的人工审核特指的是审核机无法区分的内容。通常,平台内容的占比不超过5%。一些大型内容平台的绝对数量已经很多了。在内容爆炸的时代,我们看到很多平台在全国都有多个审计中心,每个审计中心的员工数都是数千甚至数万。

  用户投诉审查是前两者的补救措施。有很多以前没有出现过的违规,所以不在可以过滤的规则范围内,或者非常隐蔽,规则很难严格过滤。用户投诉是发现新问题的重要渠道。通过知乎的危机事件,我们要更加重视投诉的审核,及时对机器审核进行相应的补充。

  结果审核通常是抽查,比如审核机器删除的内容,看规则或算法是否过于严格;例如,通过查看手动删除和批准的内容,查看员工的工作是否按要求执行;比如通过内容做一个全面的检查,看看是否有没有发现的新问题。

  在文字内容平台,比如知乎、简书、豆瓣,以及各种论坛网站,机器审核主要是基于关键词过滤的逻辑。逻辑比较简单,但并没有想象中的那么简单。

  关键词filter

  一个文章在平台上发布后,至少需要经过以下链接:

  

  在词过滤方面,关键词主要分为三类:

  

  关键词 被禁止。只要匹配到这个词,内容就会被自动删除或禁止提交。通常只有少数几个词会被列入关键词的禁止范围内,比如露骨*敏*感*词*、邪教、广告独家关键词。

  审计关键词,这是最常见的关键词类别,只要匹配,就会自动进入后台进行审计。 文章中的关键词会被高亮列出,方便审核人员快速判断。评论关键词也应该是独家关键词,防止太多内容被拦截到后台

  替换关键词。在很多平台上,我们都会在文中看到莫名其妙的*或者字母缩写。这个可能不是文章的作者写的,但是这个词被系统自动替换了。平台不希望这个关键词出现,但读者通常可以通过替换其他东西来理解它。例如,某些政治、宗教和不文明的术语可能会被自动替换。

  

  当然,管理员在添加关键词时,往往不会直接在后台添加关键词。否则,用户可以通过非常简单的方式避免关键词 过滤。比如在关键词中加一个空格,系统就会很难匹配。

  所以后台一般都支持限定符{x}来限制相邻两个字符之间的可忽略文本,x为要忽略的字节数。 Discuz!网站后台有明确说明,比如“a{1}s{2}s”(不带引号)可以过滤“ass”或者“axsxs”和“axsxxs”等等。对于汉字,如果使用GBK和Big-5版本,每个汉字相当于2个字节;如果使用UTF-8版本,每个汉字相当于3个字节。

  另外,关键词还可以支持正则表达式将关键词与某些模式匹配,例如“/1\d{10}([^\d]+|$)/”(不包括引号)用于匹配手机号码。正则表达式的内容太多了。有兴趣的可以搜索学习。

  技术概述

  以上主要是关于文字内容的审核和规则。逻辑很简单,但它是最广泛使用的。随着近年来短视频产品的兴起,内容审核的逻辑需要更深层次的技术支持。

  技术的东西对大多数人来说就像天书,没必要深入了解。我们挑选了一些易于理解的要点来窥探一些内容审查背后的技术。

  

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线