计算机视觉领域的前景与挑战-数据增强

计算机视觉在利用数据增强的技术强化下能够大规模提高模型的准确率。—Google Brain科学家Ekin Dogus Cubuk

数据增强技术的多样性提高准确性

Google Brain科学家Ekin Dogus Cubuk做了一个有趣的演讲,重点介绍了深度学习中一个有待充分利用的工具——数据增强。虽然数据增强技术,如混合、剪切和几何运算,在今天已经得到广泛的应用,但Dogus假设,这些技术的正确组合可能会提高某些计算机视觉项目的准确性。

当他的团队对这个理论进行测试时,他们确定了一些基本的数据增强实践,其中一个重要的实践是“数据增强策略的多样性”。与其对每张图片和每一个小批量图片集应用一种策略,不如使用数百种策略并为每张图片随机选择一个策略,实际上后者能极大地提高准确性。展望未来,Dogus表示,他们希望将数据增强成果应用于除影像分类外的其他领域,包括视频和目标检测。

医学计算机视觉项目的数据增强

来自麻省理工学院研究生Amy Zhao, Zhao的论文《利用学习变换进行一次医学图像分割的数据增强》解决了数据科学家在将深度学习技术应用于医学数据时所面临的一些难题。这项工作探讨了只有一个标注的示例(一种常见场景)情况下的分段策略。Zhao认识到,为达到医疗应用所需的准确性水平,目前需要经常手动标注(或至少微调)数据集。但她乐观地认为,有可能通过训练机器学习模型,模拟大脑磁共振成像等图像的复杂变化。为此,她提出一种方法,即使用未标记的数据集(广泛用于核磁共振成像)作为示例,用来训练分割卷积神经网络(CNN),以利用深度学习的能力。

AdaGraph:利用图统一预测域和连续域自适应

Mancini的工作重点是预测性域适应,这种技术适用于给定多个域的项目,非常有用,其中,一个域有标注,其他域则未标注。每个域都有一个属性。要解决这个问题,Mancini建议,您必须将域的参数与特定属性或元数据关联起来。在初始阶段,您需要训练特定于某个域或某个属性的参数。在此过程中,Mancini初始化了他所称的图形。每个域都有一个节点,他将图形中的节点与边连接起来,边的权值表示两个域之间的关系。因为他没有目标属性的数据,所以他初始化一个虚拟节点。Mancini建议,在假设图形中类似区域需要类似参数的情况下,可以传播附近节点的参数。这使得他可以获得目标域的模型,无论它们是否可见。

关于结果,Mancini说“我们的图形能够估计目标模型参数,在我们的实验中取得了很好的结果。接收目标数据,并使用它们来改进我们的模型,他就能够用上限来填补剩余的空白,上限是一种标准的域自适应算法,事先有目标数据可用。”

  • Zhenpei Yang领导的Facebook团队所撰写的论文题为“通过场景完成进行RGB-D扫描的极端相对姿态估计”。本文旨在解决计算机视觉、机器人学和计算机图形学中的一个基本问题:估计同一基本环境中两次RGB-D扫描之间的相对刚性姿态。
  • 谷歌研究人员正致力于研究应用于机器感知各个领域的机器学习技术。他们的团队还展示了若干近期工作,包括预测行人运动背后的技术、Open Images V5 数据集等等。

澳鹏支持计算机视觉与数据标注

许多机器学习项目没有大量时间尝试各种机器学习算法和策略,它们需要比竞争对手抢先一步将产品或服务推向市场!为了获得更为准确的结果,澳鹏提供一系列图像标注服务。

澳鹏可以处理多阶段标注,方法是将逻辑树和依赖树构建为多轮(不受限制的)标注,更详细地审查图像,并构建针对每个对象的特定元数据。我们还能审查图像中的攻击性内容,在客户端的图像识别软件中对图像进行标注,以改进搜索功能,并按质量对图像进行分类,以随时间改进搜索内容。

澳鹏支持数据增强模式识别

澳鹏提供数据增强服务,以确保您拥有计算机视觉项目(如图像或视频标注)的优质训练数据。澳鹏解决方案具有若干重要流程组件,将有助于确保尽可能提高数据质量:

  • 数据分组/分布分析与可视化
  • 数据异常检测
  • 数据偏差消除策略
  • 数据自动增强策略
  • 数据标注服务建议

通过全面、易于实现的数据标注和项目管理服务,澳鹏提供端到端的解决方案,可以快速提供您所需要的基础条件,使您的计算机视觉解决方案尽可能准确。

Language