测评:网站排名优化第二课:如何看待seo排名工具?快排到底香不香!

优采云 发布时间: 2022-11-30 16:17

  测评:网站排名优化第二课:如何看待seo排名工具?快排到底香不香!

  网站排名优化第二课:如何看待seo排名工具?到底香不香,快来梳理一下吧!

  深圳美盛传媒

  2020-03-23 11:55

  

" />

  打开网易新闻查看精彩图片

  做SEO的人100%的时间都用过快速排序。如果他们没有使用过快速排序,那么他们就不是圈内人。今天我们就来说说如何查看seo排名工具,即快速排名。

  快排,说白了,就是一款为百度点击量而生的作弊软件。通过快排工具,可以模拟点击,提高关键词的排名。

  既然是作弊软件,就跟考试一样。作弊可以考到班级第一,但是遇到监考老师或者国考怎么办?可以直接返回到原来的形式。因此,对于这款软件的处理方式,业内也存在不同的声音。

  第一次接触Quick Queue之前,我添加了一些相互的点群。这是模拟点击的原创

版本,就是在群里发消息,让对方点击。至今,这种相互指点的方式依然存在。这个方法有用吗?答案是肯定的。当时我就在想,有没有什么工具可以帮助解决这种笨方法呢?手动点击很累。然后找了一些模拟点击的软件。

  使用这种互分的方式,无论是人力还是机器,他们的最终目的都是以假量带动真量,即让排名先上升,再带来真实流量。这种方式类似于APP推广,利用积分墙带动排名。,刷单驱动显示器是一个道理。这有效吗?在一定程度上是没有问题的,但是这样做的后果是非常严重的。

  

" />

  那是非常昂贵的。如果听说一次点击才几毛钱,没错,一开始就是便宜。如果你要排名,那么你就需要花费这些添加的关键词的成本,后面就不会继续点击了。,那么排名就会下降。

  如果你不点击,排名会下降,那么你应该续订或不续订。到时候是不是觉得骑虎难下?

  反正骗做seo的赚不赚钱我不知道,但是我知道做那些快排软件的肯定赚了。

  客观的说一下快速排序,也算是利用了百度点击的漏洞,但是百度不会允许这种作弊干扰百度的排序结果。不然以百度的本事,你觉得他会放过?大多数做快速排队的人会在站点外出售其他软件,但是您的站点呢?是否需要重新修站?

  我只想说一件事,为什么我之前就知道这个。

  干货内容:万字干货 | 图像标注工具竞品分析

  通常,企业有多种标签需求。作为通用标签产品,产品功能(如支持多种输入格式、多种标签类型、多种标签形式、附加功能等)将是我们关注的重点。重要的一点。

  另一方面,在实际情况下标注是一项非常耗时耗力的工作。比如上图中的大部分行人都需要标注,这样的图片至少要有上百张。由此可见,用户体验是我们需要关注的另一个重点。

  综上所述,本文将主要从产品功能和用户体验两个维度分析行业中具有代表性的产品。

  2.核心业务流程

  要完成图像标注训练的整个工作流程,通常需要经历“数据准备”、“数据标注”、“数据演化”三个步骤。具体业务流程如下图所示:

  图 3:图像标注一般业务流程

  2.1 数据准备

  数据准备包括两个步骤:数据采集和数据预处理。

  1、数据采集:采集数据的方式有很多种,比如:本地上传、调用其他数据集、导入*敏*感*词*数据、从云服务获取数据等。

  2. 数据预处理:数据清洗是获得高质量训练数据的前提,清洗不合格的数据也可以减少无意义的标注工作,提高标注效率。数据清洗的常用操作包括:清洗模糊数据、清洗相似数据、裁剪、旋转、镜像、图像亮度、图像对比度、图像锐化等。

  2.2 数据标注

  数据标注包括:标注集的建立、数据标注、标注审核。

  2.2.1 创建标签集

  标注集是标注工作的基本任务管理单元,这里不再赘述。

  2.2.2 数据标注

  详见表1:

  表一:数据标注的具体方式

  2.2.3 标签审核

  对于“任务标注”,标注审核是对下发的标注任务进行管理,对标注结果进行审核。一般审核维度包括:标注进度、验收情况、标注数量、疑难案例、标注质量等。

  对于“自动标注”,标注审核就是对自动标注的结果进行逐一检查确认,并对标注错误的图片进行修改。

  2.3 数据演变

  数据进化包括:模型训练和模型推理。

  2.3.1 模型训练:

  是对标注数据进行训练,得到模型结果的过程。

  2.3.2 模型推理:

  用于对训练好的模型结果进行验证和预测,并将错误或错误的验证结果记录下来并带入下一次模型训练进行模型优化迭代,从而形成从数据标注到模型训练再到建模的闭环迭代优化。

  三、竞品介绍

  目前,市场上有许多标签工具。首先,您需要确定选择竞品的原则:

  综上所述,选择了以下三款竞品:

  CVAT:Intel出品的一款开源标注工具,2018年6月发布,支持视频、图片等多种数据类型的标注,功能全面。ModelArts:华为出品的机器学习平台,2018年10月发布,收录

数据标注模块。支持从数据导入到模型运维的全流程开发,训练速度快。Supervisely:*敏*感*词*Deep System旗下的一个模型训练平台,2017年8月发布。其数据标注功能强大,尤其是Smart Tool让人印象深刻:可以快速完成语义分割任务的标注。

  表2:3款产品的汇总对比

  四、功能比较

  在本节中,对于这三种产品,我们将在第 2 章中基于核心业务流程来探讨产品功能之间的差异。

  4.1 *敏*感*词*

  虽然CVAT的使用过程非常简单,但是它的功能却非常全面和丰富。

  图 4:CVAT 标签流程

  4.1.1 创建数据集

  在CVAT中,使用标注任务(Task)的概念来代替数据集。一个任务可以收录

多个作业,每个作业可以分配一个贴标机。

  在创建标注任务时,CVAT 还提供了丰富的高级选项,例如:

  支持使用 Git LFS:Git Large File Storage,一个用于大文件的 git 管理插件。调整图片质量:通过降低图片质量(压缩比)来加快高清图片的加载速度。作业数量和重叠:如果任务中的图像量很大,可以将其分成多个作业。结合重叠数,可以实现一张图片分配给多个job的效果,但是暂时没有想到重叠数的使用场景。

  综上所述,CVAT在标注任务模块中的一个优势就是支持直接上传视频类型的文件,上传的视频会按照用户设置的帧率(Frame)转换为图片。

  CVAT在这个模块中也有一个明显的劣势:缺乏一个统一的视角来概览任务中的所有图片(如下图,在任务详情页只能看到第一张图片),而每个图片上的所有图片picture 的注解,大概是因为一张图片可能存在于多个job中。

  图 5:CVAT 标注任务详情页面

  4.1.2 自动贴标

  由于CVAT不具备提供模型服务的能力,其自动标注功能尚处于开发初期,只能满足个人实验。

  添加自动标注模型需要用户上传模型文件,而不是镜像或API。这种非面向服务的方式很容易影响标​​注的成功率和Accuracy。

  4.1.3 人工标注

  4.1.3.1 手动贴标支持3种贴标模式,每种模式可以来回切换:

  标准模式(Standard):用于一般标签。属性标注模式(Attribute Annotation):在“属性模式”下,用户可以专注于修改标注框和标签的属性,提高了查看和修改标注属性的效率。该模式专门用于为同一对象设置一个或多个属性的场景,例如人脸标注中需要标注的年龄、性别等。标签标注:在“标签模式”下,用户可以快速添加和删除标签,选择和修改标签属性。同时可以为图片类型标注自定义模式,还可以为每个标签设置快捷键。大大提高了图像分类的标注效率。

  4.1.3.2 根据我们对CVAT的经验,我们总结出以下优势:

  1)灵活的标签和属性定义

  同一张图片可以标注多个标签,一个标签可以设置多个属性,平台定义属性定义为:多选(Select)、单选(Radio)、是否(Checkbox)、文本(Text) )、数(Number)五种。CVAT标签定制的自由度基本满足大部分标签需求。

  图 6:CVAT 中的 5 个标签属性

  2) 丰富的注释形式

  为了支持多种类型的标注,CVAT提供了6种类型的标注,包括:标签、点、矩形、折线、多边形、长方体等。同时支持AI多边形标注:你只需要指定至少四点借助系统选择目标轮廓。这与 Supervisely 相同。经过我们的体验,我们还是期待AI识别速度的进一步提升。

  3)标注方法快捷键的统一

  选择一种标注方式,快捷键“N”代表该标注方式。重新选择标注方式,“N”代表的方式会相应改变。快捷键的统一进一步降低了用户的操作成本。

  

" />

  4)任务分析

  通过任务*敏*感*词*表板中的分析,您可以看到每个用户在每个任务上花费了多少时间,以及他们在任何时间范围内完成了多少工作。任务分析扩展了 CVAT 的团队标签功能。

  图 7:CVAT 中的*敏*感*词*表板(图片来源 CVAT 用户手册)

  5)赛道模式(Track mode)

  用于标记视频文件。视频会根据帧率分成若干帧(Frame)。用户只需要在关键帧(Key frame,与Flash中的关键帧非常相似)上进行标记,关键帧之间的帧会自动进行标记。CVAT 目前仅支持使用插值模式的边界框和点。Propagate 函数非常实用。场景:如果想将当前图片中的标注传递(Propagate)到后面n张图片。同时,CVAT的跟踪模式结合Merge功能和Split功能共同支持CVAT独有的视频或*敏*感*词*标注能力。

  4.1.3.3 可能是因为其支持的功能过于丰富,导致使用起来有一定的学习成本,用户体验会有些不尽如人意。例如:

  标注时无法预览图片,无法了解图片的整体标注状态。下次进入作业时,无法快速定位未标注的图像。虽然这不会对效率产生很大的影响,但是会影响用户的操作体验。另外,如果是标记用户图片的分类,需要使用属性方式,用户很难感知。(我们原以为只能画一个完全覆盖图片的框来实现) 4.2 ModelArts

  2019年10月17日Modelarts更新后(特别是团队标注功能),业务流程覆盖趋于完善。整体用户流程如下:

  图8:ModelArts标注流程(图片来自ModelArts官网)

  由于本文重点讨论数据标注功能,数据标注后的功能(包括训练、推理、数据校正等)不在本文讨论范围之内。

  4.2.1 创建数据集

  ModelArts在创建图像数据集时,会在数据集级别设置图像标注类型,即创建数据集时需要区分标注类型。

  这与 Supervisely 和 CVAT 完全不同。具体分析见Supervisely的手册标注章节。目前支持图像分类和目标检测两个任务。

  图 9:在 ModelArts 中创建数据集

  4.2.2 数据处理

  华为数据处理功能定位于对象存储服务,提供便捷全面的图像处理能力。

  华为对象存储服务提供了“图形界面模式”和“代码编辑模式”两种图像处理操作模式,适合普通用户和开发者使用。

  同时将最终的处理结果存储在内容分发网络(CDN)中进行加速。后续请求可以通过URL直接从CDN下载,结果可以在任何可以通过URL导入数据的标注平台上使用,大大扩展了平台。功能可扩展性。

  华为图像处理提供的能力主要包括:设置图像效果(亮度、对比度、锐化、模糊)、设置缩略图、旋转图像、剪切图像、设置水印、转换格式、压缩图像。

  图10:华为对象存储中的图像处理模块

  4.2.3 智能标签

  ModelArts智能标注包括:主动学习(*敏*感*词*标注)和预标注(自动标注)。目前只有“图像分类”和“目标检测”类型的数据集支持智能标注功能。下面简单分析一下智能标签模块:

  该系统只标注未标注的图像,可以减少重复标注,减少计算资源的浪费。使用效果并不理想,系统实际体验中标注的准确率只能维持在60%。系统筛选疑难*敏*感*词*的准确性也很低。全自动标注支持选择自训练模型或ModelArts内置模型。模型选择的灵活性高,可以继承每次标注的结果,进一步提高模型在下一步操作中的准确率。智能标注结果展示页面可按条件筛选。可选条件包括:难度级别、标签、样本创建时间、文件名、标注者、样本属性和置信度。精准筛选可以满足大部分场景的需求。

  4.2.4 人工标注

  华为ModelArts手动标注的主要特点如下:

  4.2.4.1 目标检测标注最多支持6种标注形式

  包括正方形、多边形、正圆、点、单线、虚线(见图11)等丰富的标注方式,覆盖更广泛的标注场景,可以提高标注的准确率。

  4.2.4.2 高效的标签选择方法

  在数据标注的交互中,Huawei ModelArts会自动弹出添加标签弹窗,标签下拉框在绘制框后展开(见图11),无需用户点击标签下拉-选框后的下拉框。并且弹出的tab选项卡紧挨着选择框(见图11),缩短了滑动鼠标选择选项卡时鼠标的行程。

  图11:ModelArts图像检测数据标注界面

  4.2.4.3 图像分组

  在标注预览页面,华为ModelArts提供了图片分组功能(见图12),通过聚类算法或将图片按照清晰度、亮度、图像颜色进行分组。自动分组可以理解为数据标注的预处理。用户可以根据分组结果进行分组标记、图像清洗等操作。该功能可以提高图片标注的效率,尤其是在图片分类标注的情况下,结合批量标注功能,标注速度可以得到质的提升。但我们实际体验后感觉这种功能分组的成功率偏低。

  图12:ModelArts图片自动分组

  4.2.5 团队标签

  华为ModelArts的团队标注功能非常完善,亮点也不少。这里我们从创作、标注、审核三个方面来探讨:

  4.2.5.1 创建

  华为开通团队标签后,您可以直接指定一个标签团队,也可以选择指定管理员,由管理员分配标签人力和审核工作。选择类型后,团队成员会收到系统邮件,根据邮件提示即可轻松完成标注和审核。

  您可以选择是否将新文件自动同步到注释团队。同时可以选择是否加载智能标注结果的标注团队文件。这些操作增加了管理员调整任务分配和自动标签之间关系的自由度。

  图 13:ModelArts 团队注解创建页面

  4.2.5.2 标签

  图片标记保存后,图片会自动进入“待审核”状态。我们认为这样的状态切换超出了用户的预期,尤其是用户想要查看标签是否正确,需要切换到“待审核”页面进行查看,会给用户带来不便。

  “待审核”的图片仍然可以修改,修改在管理员发起验收前有效。但是在验收的时候,如果图片被采样了,那么修改就不会保存到数据集中,如果图片没有被采样,那么修改就会保存到数据集中。这样的审核逻辑限制可以减少审核中不必要的混乱,防止审核结果出现错误。

  4.2.5.3 审查

  ModelArts将审核称为“验收”,验收分为单张图片验收和一批图片验收两个级别。过程是用户签收一批图片。审计层级过多,逻辑复杂,可能导致运行结果不符合用户预期。

  标注状态混乱:比如管理员将图片A分配给了标注者a。a被标注后,管理员同时使用智能标注对图片A进行标注。如果两个结果都被管理员确认,那么无论哪个注解先被确认,只有smart的注解结果有效,而注解者a的注解无效。

  ModelArts提供了审计的仪表盘,方便统计审计过程,直观展示任务进度。dashboard的评价指标包括:验收进度统计、难点集数量、标签数量和含标签样本数量、标注者进度统计等,如图14所示:

  图 14:ModelArts 中的注释审查仪表板

  4.3 监督

  图 15:Supervisely 的标注流程

  从图中可以看出,团队标记一块的逻辑要比其他产品复杂。分析其背后的原因:

  很多步骤表面上是为了满足团队标注(尤其是外部标注团队)的需求,包括创建团队、邀请成员、创建标注作业、标注审核等,但本质上是安全控制和质量控制要求 :

  安全控制体现在管理员可以给团队成员分配不同的角色来控制成员的权限。比如标注者(Annotators)只能在自己的任务中查看图片;质量控制体现在标注后管理员会审核标注情况,保证标注质量。

  因此,如此复杂的环节是企业级标签产品的妥善设计,尽管这必然会导致用户认知成本的增加和用户体验的下降。

  4.3.1 创建数据集

  

" />

  在Supervisely中,用户可以在一个数据集中完成四种标注(视频标注除外),即分类、检测、分割和姿态估计。

  与ModelArts不同,Supervisely对数据集的定位更像是图片的集合。一批图像只需要导入一次,无论做什么类型的标注,都可以在同一个数据集上完成。并且在做后续训练的时候,可以直接得到一张图片上的所有标注。

  综上所述,Supervisely 的统一数据集模块提高了图像导入、图像标注和图像后处理的效率。但这种方法也有缺点:所有标注类型的运行方式是固定的,无法针对特定类型进行深度优化(比如Modelarts的图片分类可以同时选择多张图片一起标注)。

  4.3.2 数据处理

  Supervisely的数据处理模块叫做DTL,Data Transformation Language,是一种基于JSON的脚本语言。通过配置DTL脚本,可以完成合并数据集、标签映射、图像增强、格式转换、图像去噪、图像翻转等46项操作。,满足各种数据处理需求。

  图 16:在 Supervisely 中为图像添加高斯模糊

  虽然功能比ModelArts强大,但只提供代码形式的操作,只适合工程师使用。但是,大多数工程师已经掌握了通过python处理图像的方式,多学一门语言无疑会增加学习成本。

  另一方面,对于这种特殊语言的效率提升还有未知数。比如用户想进行一些图片操作,但是研究了很久发现语言不支持。最后还是需要通过python来完成,最终降低了效率。

  4.3.3 自动贴标

  Supervisely 目前提供了 14 个预训练模型。大部分训练数据来自COCO(微软发布的大型图像数据集),小部分来自PASCAL VOC2012、Cityscapes、ADE20K等其他公开数据集。

  在自动标注部分,Supervisely的优势在于支持语义分割的自动标注,并且产品在语义分割的人工标注方面有着优秀的体验,大大提升了该类任务的标注效率。

  Supervisely的自动贴标模块产品化程度不高,主要体现在以下两点:

  由于不提供模型训练和推理服务,用户需要准备自动标注所需的硬件环境,限制较多(仅支持Nvidia GPU,需要Linux和Cuda驱动)。通过JSON格式的配置文件配置模型推理参数(见图17)。相比华为简单的配置界面,这种形式更加灵活,但是用户是真的需要配置还是只想让系统直接给出一个自动标注的结果?

  图17:Supervisely(左)与Huawei ModelArts(右)自动标注配置对比

  4.3.4 人工标注

  Supervisely的标注功能非常强大,主要有以下两个特点:

  丰富的标注形式:为了支持多种类型的标注,Supervisely提供了多达9种类型的标注,包括:标签、点、矩形、折线、多边形、长方体、像素图、智能工具(Smart Tool)、关键点等。复杂标注系统:抽象出对象(Object)、类(Class)、标签(Tag)三个实体,提高复杂场景下实体间的复用性。

  4.3.4.1 丰富的注解形式

  在所有 9 种标注格式中,智能工具令人印象深刻:

  智能工具用于标记分段类型。用户只需点击两次选择一个物体,然后通过算法对目标进行划线,完成初步分割,再通过标记正点和负点完成精准标注,大大降低了成本。分割类任务的标记成本。

  图 18:在 Supervisely 中点击 11 次后完成一次语义分割

  4.3.4.2 复杂的标签系统

  为了满足一个数据集涵盖多种标注类型的需求,Supervisely 有一个复杂的标注系统。下面通过三款产品的ER图来分析一下这套标签系统的优缺点。

  在图 19 的行人识别场景中,我们将绘制一个行人边界框。然后我们需要定义一个标签叫做:行人。

  图19:Supervisely中的行人标注场景

  但是每个行人的属性都不一样。比如行人A戴帽子,行人B不戴帽子。如果我们需要区分戴帽子的行人和不戴帽子的行人,一种方法是创建两个标签:戴帽子的行人,不戴帽子的行人。

  但是这样两个标签会失去相关性——如果模型只需要检测行人,则需要将两个标签进行转换,效率低下。

  比较合理的做法是在行人标签下创建一个属性——是否戴帽子;并抽象出一个概念:对象。

  用户每次绘制边界框,系统都会创建一个对象(例如:行人A),每个对象会对应一个标签(例如:行人),然后每个对象可以设置标签的属性值(例如:是否戴帽子 = 是)。

  CVAT 和 ModelArts 都是这样做的。不同的是CVAT可以直接标注图像进行图像分类。由于ModelArts划分了图像分类和目标检测数据集,标签只能应用于图像分类数据中的图像。

  图 20:CVAT(左)和 ModelArts(右)的图像-对象-标签 ER 图的比较

  Supervisly将标签和属性拆分为两个实体,然后通过对象实体将标签和属性关联起来(如下图所示):

  这种方法可以提高属性的重用。例如,在 Supervisely 中,用户只需要定义一次颜色属性,就可以将相同的“颜色”应用到行人(作为标签)或车辆(作为标签)的颜色上。以下属性提高了准备复杂注释集的效率。

  但同时,这种方式对用户体验设计提出了很大的挑战。从难度上看,Supervisely无疑是三款产品中最难上手的。

  图 21:Image-Object-Label-Object Supervisely 的 ER 图

  五、总结与展望 5.1 总结与比较

  下表总结了三个标签产品的功能:

  表3:三款产品功能总结对比

  CVAT:手动标注功能最强大,自动标注功能相对较弱。独特的跟踪模式省去了视频的预处理,大大提高了标注效率。由于环境原因,CVAT的任务分析功能还没有完全体验。从介绍来看,应该是重点在这方面。ModelArts:作为华为云的一个功能模块,ModelArts的产品策略也更加通用化和平台化。与华为OBS系统的结合,带来了强大的数据处理能力,增强了平台的可扩展性和兼容性。同时,ModelArts自动标注和*敏*感*词*标注的优势,是CVAT和Supervisely所没有的,这也体现了ModelArts依托华为云强大的计算能力和算法优势。总体而言,ModelArts 是一个平衡的玩家,具有出色的业务开发能力。Supervisely:整体功能最齐全,适合企业级应用。对语义分割任务支持较好,但部分功能(如数据处理、自动标注)需要代码完成,效率提升有限。

  当然,我们也发现了一些三款产品没有的功能,比如水印功能,适用于需要保密的场景,比如监狱、银行等。

  5.2 标注工具的未来趋势

  5.2.1 人工标注不会消失

  这实际上是一个悖论:假设我需要训练一个 CV 模型。训练模型需要准备带标签的图片。如果图片标注只需要自动标注,无需人工干预,说明模型已经能够准确预测结果。

  如果能够做出准确的预测,则说明模型已经完全训练完毕,不再需要训练,这与假设相反。

  5.2.2 自动标注的价值主要体现在单个标注耗时较长的标注类型,如分割、姿态估计等

  既然人工标注肯定会存在,那么自动标注的意义在于提高人工标注的效率,而不是取代人工标注。在分类、检测等任务中,单次标注耗时较短的场景,自动标注的价值较小。

  假设从0完成一个标签需要5秒,而在自动标注的情况下,修改一个标签需要2秒,标注效率提升60%(假设自动标注模型在get之后运行下班,不影响人工贴标时间)。

  但是,我们看到模型在某些图片上的标注结果可能过于偏向,所以用户还是需要花1秒的时间删除自动标注结果,但是这次标注的效率降低了20%(即, 1/5), 如此高的负回报使得整体效率并没有太大的提升。

  5.2.3 人工标注的主要内容将从创建标签变为修改标签

  虽然人工贴标环节不会消失,但很显然,自动贴标将在贴标过程中扮演越来越重要的角色。未来,常见的标签流程将从创建新标签转变为修改模型创建的标签。

  因此,优化修改标注时的用户体验将是提升标注效率的突破口。

  作者:薛康杰,AIoT产品经理,AIops、CV、IoT等平台产品;蒋海龙,AI产品实习生,专注于CV产品设计。

  本文首发于@DarrickBM 人人都是产品经理,未经允许,禁止转载

  题图来自Unsplash,基于CC0协议

  给作者打赏,鼓励TA抓紧时间创作!

  欣赏

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线