语义分割交互式智能标注工具 | 澳鹏数据标注平台

随着人工智能应用的大规模落地,数据标注市场在高速增长的同时,也面临着标注成本的挑战。据IDC报告显示:数据标注在AI应用开发过程中所耗费的时间占到了25%,部分医学类应用一条数据的标注成本甚至高达20元。数据精度的高要求、强人工的依赖、复杂的工具使用逻辑等都是造成标注成本高的核心痛点。

例如,计算机视觉领域的一个重要技术——图像语义分割,可以将图片切割成具有不同语义的色块,从而帮助机器理解整个视觉世界。在自动驾驶领域,车载摄像头采集的图像经过图像分割算法处理后,可以帮助汽车实现避障、寻找可行驶区域等功能。图像语义分割技术对训练数据要求较高,分割准确度通常需达到像素级别,在现实世界中不规则物体边缘的标注效率会更低。

MatrixGo全景语义分割示意图

澳鹏Appen中国自主研发的人工智能辅助数据标注平台MatrixGo——交互式智能标注,就是针对相关痛点研发落地的重点方向。澳鹏Appen团队希望通过AI赋能,为用户创造更高质量的数据价值。

澳鹏MatrixGo平台丰富的工具箱

 

标注平台的智能化水平

我们将数据标注平台根据智能化及自动化水平,分为L0到L4的5个阶段。其中,L2(即智能交互)考虑到了“人”在数据标注环节中的交互作用。通过更好的算法介入和交互逻辑引导,使用户能够通过简易操作完成高效标注。

L0到L4的5个智能化阶段

如下方视频所示,标注人员首先找到期望标注的对象,输入中心点后,模型给出首次识别的效果;对于识别不够精准的部分,标注人员只需通过点击响应的形式,来告知模型预测的不正确区域,即可得到更正后的识别结果,而无需依赖手动画线。

 

智能交互过程

通过快速点选需要标注的前景对象,模型会预测出主体轮廓部分;当遇到标注有误需要修改的地方时,通过点选背景位置的反馈,工具会自动进行智能化收边和擦除操作。在模型识别过程中,标注人员通过简单的交互输入,得到更精准的识别效果。依靠简单点选取代稠密的轮廓绘制过程,根据项目实际应用统计,相对纯人工标注可节省约50%的标注时间。

交互流程示意

通过设计用户交互理解模块,输入用户的一系列交互行为,输出对应的高层特征,来建模用户输入的行为模式,可以有效推断出质量更好的标注结果。同时,辅助使用点击行为采样,根据用户的历史标注行为埋点,来提取有效的数据进行学习。输出上,考虑到不同项目和业务要求,支持一般的矩形框、多边形以及像素图等不同格式输出。

实现方法示意

在3D识别场景中,我们为快速识别点云中的目标也提供了交互式智能工具。模型能够在标注员圈定的范围内快速进行车道线识别,并将最终结果返回给标注员。

▲3D点云车道线识别

澳鹏Appen交互式智能标注通过结合算法识别+人工判断,可以极大程度上提升标注效率和准确率。我们始终致力于通过AI赋能数据采标的全生命周期,提升数据生产的效率,充分给予AI应用开发以数据养料,从而为更多场景AI应用的大规模落地提供有力支持。

 

澳鹏数据标注平台MatrixGo

澳鹏自主开发的数据标注平台承载了多种标注工具,包括3D点云,2D图像,文字与语音等多种标注工具,并且包含智能标注、人工智能辅助标注等功能。同时,您可以通过SaaS和私有化部署方式使用MatrixGo,为您的项目进行高效赋能。如有兴趣,可以联系我们,我们的项目经理会为您进行功能演示以及提供报价。

Language