2020年,AI的这项数据创下行业新高

9月6日,在2020中国国际服务贸易交易会(以下简称服贸会)上,云测数据发布“无数据 不AI 云测数据服务成果”,其中提到该公司数据标注项目最高交付精准度可达99.99%。

云测数据是Testin云测旗下AI数据标注服务品牌,通过自建数据场景实验室和数据标注基地,为智能驾驶、智慧城市、智能家居、智慧金融、新零售等众多领域提供高质量的数据采集、数据标注服务,全方位支持文本、语音、图像、视频等各类型数据的处理。

截至目前,云测数据在华东、华北、华南设有数据交付中心和数据场景实验室,已成功为众多企业提供AI数据服务。

99.99%这个标准如何得来?意味着什么?带着这些问题,《中国经济周刊》在现场采访了云测数据总经理贾宇航。

数据质量决定AI算法精度

“目前数据标注领域平均水平在95%左右,这是目前数据标注领域可达到的最高服务标准,成为AI数据服务迈入更高质时代的一大里程碑,”贾宇航表示。

人工智能的三大要素即数据、算力、算法,算力和算法对应的是分析运行能力,而更为基础的数据则发挥着“教材”的作用。在人工智能技术场景落地的过程中,产生了更多对数据的需求。

贾宇航说,“作为人工智能的三要素之一,‘数据’从本质上决定了人工智能的落地水平。通常来说,数据标注得越准确,数量越多,模型效果越好,最后的AI产品效果就越好”。

据了解,训练数据的生产过程被分为三个步骤:数据采集、数据清洗和数据标注。

数据采集指通过各种不同维度的硬件传感器,将现实场景转换为数据,既数字化转换过程;数据清洗指通过人工或机器辅助筛选的方式,基于特定规则,将有价值数据筛选的过程;数据标注指人工将像素、语音、文本等转换为机器能理解,能看懂的AI数据内容,从而成为被机器习得识别处理的方法。

算法的精度与数据质量密不可分。贾宇航指出数据的数量不足、多样性欠缺、标注的精确度低,都直接影响着AI产品质量。

数据质量决定着AI算法的精度,算法精度决定产品质量。

云测数据助力产业智能化

目前,人工智能行业已经从感知智能上升到认知智能,人工智能技术的场景化落地需要更加精准且高质的AI数据做支撑。在此次服贸会上,云测数据也正式对外发布了智慧城市、智能家居、智能驾驶、智慧金融全链条的AI训练数据服务方案。

“云测数据进行99.99%的成果展示,也是向外传递数据标注高质量发展信心”。贾宇航认为,成果的取得来自三方面的积累:实力、能力和方案。

第一点,云测数据对产业赋能,提供了从平台自研、数据场景实验室建立、数据交付中心的建立、自身专业工作人员积累、高效的组织协同方式等的一体化的服务,为需要高质量的AI数据处理内容,做到了有力的保证。

第二点是能力,也就是多维度数据处理的能力。作为头部AI数据服务商,云测数据做到了视觉,语音,文本的全品类支撑,面对这三个维度的AI算法,数据的需求层次和维度也在发生变化,需要做到更高精度的支持。云测数据采用的基于规则的机器筛查方式,在人工校验流程前根据所标注项目要求,引入相关查错规则,为数据精度提升设置保障。

第三点是方案。云测数据所积累的硬实力和软实力,以及在图像、语音、文本中所积累的服务能力,都是为了产业赋能。结合上述的积累及行业深耕,云测数据输出了智慧城市、智能家居、智能驾驶、智慧金融四大行业领域的训练数据服务解决方案。从而帮助更多AI企业能更快更好的完成产业落地。

艾瑞咨询调查显示,2019年中国AI基础数据服务行业市场规模可达30.9亿元,其中图像类数据需求规模最大,占比接近一半;预计2025年市场规模将突破100亿元。

云测数据作为助力产业智能化的重要一环,将立足数据安全,瞄准更高质量,聚焦落地场景,持续加大在AI数据领域的技术研发与落地实践,充分发挥AI数据的基建力量。

相关新闻

    推荐阅读