一是人工采集,二是智能采集(IT行业从业者被划为“新生代农民工”一事,引发网友热议)
优采云 发布时间: 2021-11-30 15:07一是人工采集,二是智能采集(IT行业从业者被划为“新生代农民工”一事,引发网友热议)
近日,#新代农工#一词热搜,引发网友热议。据人力资源和社会保障部网站消息:数据显示,新生代农民工就业集中在劳动密集型行业,新生代农民工从事信息产业的比重传输、软件和信息技术服务显着增加。
对于程序员等IT行业从业者如何被归类为“新生代农民工”,有网友表示,“码农”这个词是官方认证的;有网友表示,自己很荣幸成为“新生代农民工”。的一员。
但是,这也从一方面反映了数字经济下劳动力的变化和产业的转型。“人工智能”这个几年前鲜为人知的概念,如今已经成为很多企业寻求新机遇的突破口,或者是日常运营中不可或缺的角色。
2021年过半,今年人工智能市场呈现出哪些重大发展趋势?一起来一盘吧!或许很快,AI将成为“新生代农民工”的新代言人。
AI发展的瓶颈:高质量数据
O'REILLY研究院近日发布的一份*敏*感*词*显示,人工智能的应用存在两大瓶颈:一是缺乏熟练的员工;另一个是缺乏数据资源(或数据质量问题)。事实上,大部分人工智能项目已经很久没有进入“实战”阶段,这也反映出数据科学家在人工智能研究过程中获取高质量数据所面临的挑战和成本。这时候,寻求外部专业组织的支持就显得尤为重要。
更精准的AI应用场景
越来越多的人工智能公司开始缩小其人工智能模型针对的业务范围,并使其目标更加具体。例如,澳鹏最近参与了多个此类AI项目:
业务术语:一家公司建立了一个人工智能模型,可以对业务术语提出改进建议,这些业务术语之间只有非常细微的区别;
身体动作:某公司在研究私教自动化模型时,发现动作的轮廓会随着年龄的增长而变化。需要添加老人翻筋斗视频,并做相关注释;
小语种:新冠疫情实时信息需要全球发布,但翻译技术并不支持所有语言。澳鹏开展了达里语、丁卡语、豪语等稀有语言的数据采集和标注工作。萨语等。
从以模型为中心到以数据为中心的转变
是为了优化代码,还是为了提高训练数据的质量?这是过去几年人工智能行业最关注的前沿问题之一。以模型为中心的人工智能是指利用现有数据构建模型,以弥补任何不相关的因素和不准确性,而以数据为中心的人工智能则侧重于数据的数量和质量。目前,我们已经看到了人工智能行业从以模型为中心到以数据为中心的趋势。
训练数据管理的新要求
随着市场对训练数据的需求不断增加,制定标准化管理数据训练工作流的管理框架变得尤为重要。一个有效的数据管理框架应包括以下关键点:
可追溯性的版本控制
数据安全协议
访问控制
数据传输监控
合作协议
AI辅助数据标注越来越火
自动化机器学习技术的应用越来越多,人工智能企业也开始利用人工智能来辅助数据标注,以节省时间、降低成本。以下是数据标注自动化的三种主要类型:
预标注:首先,AI模型会对标注进行合理的猜测,然后人工标注者进行检查和修正;
快速贴标:利用AI功能为贴标机节省贴标时间,如澳鹏人工智能辅助数据贴标平台的自动完成和一键拟合;
智能验证器:AI对贴标机输出的数据进行验证,如果标签不在阈值范围内,会给出提醒。
在增强人工智能的实用性时,数据和算法哪个更重要?
《现实世界中的人工智能》一书中有哪些有趣的案例可以帮助日常工作?
成功创建AI项目需要什么样的数据策略?
扫描下方二维码收听大咖研讨会《以数据为中心的人工智能——从算法到训练数据,人工智能的核心是什么?》,演讲嘉宾Wilson Pang(澳鹏首席技术官)、Alyssa Simpson Rochwerger(前任Appen 人工智能和数据副总裁,加州产品管理总监)。