某家一级汽车软件提供商构建更智能的车载信息娱乐系统

我们负责提供自然语言数据和文本数据的收集服务,涵盖了系统在现实世界中可能遇到的所有场景和变化。

公司信息

一家领先的汽车电子软件提供商与我们接触,要求我们收集音频和语言数据,以帮助其开发车载信息娱乐系统的自动语音识别 (ASR) 功能。

挑战

若要使车载信息娱乐系统(或任何其他自动语音识别系统)能够识别并正确处理语音命令,就必须对语音数据进行训练,此类语音数据应考虑广泛的输入范围,以及在人们说话方式方面的所有可能变化。 驾驶员可能会使用无数种不同的口头命令来调整汽车的气候控制、收音机、导航、电话和其他设置。如何训练这些系统,使其能够理解多种方言和各种说话者,是一项更大的挑战,而每种目标语言都需要成千上万条语音。

“如何训练这些系统,使其能够理解多种方言和各种说话者,是一个更大的挑战…”

解决方案

我们负责提供自然语言数据和文本数据的收集服务,涵盖了系统在现实世界中可能遇到的所有场景和变化。通过与市场上按需提供服务的母语人士合作,我们能够针对任何给定场景在新的位置和语言中快速扩展 ASR 功能。此外,由于该提供商在音频记录质量方面有着严格的标准,因此,我们在不同的地点和录音室均采用相同的高级记录程序,并监督它们是否符合汽车行业所用的多种语言的质量标准。

服务包括:

  • 自发的、无脚本的语音数据收集,其中会给母语人士提供一组场景(比如:在需要降低温度时,您会怎么说?在想要播放喜欢的音乐时,您会怎么说?在想要更改广播电台时,您会怎么说?),同时还必须生成各种响应
  • 使用与语音类似的场景收集文本数据,但其目的在于获得更大的数据量、更多的说话者
  • 收集脚本化语音数据,用于训练固定的简短语音
  • 测试驾驶模拟情况,以模拟驾驶过程中的认知负担,确保说话者能够提出更自然、更真实的响应
  • 使用专业设备收集国家/地区特定的录音室数据,对各个录音室进行校准,确保精确度并符合严格的音频标准

成果

  • 符合用户自然行为的自发语音数据
  • 能够以新的语言、在新的位置快速部署
  • 确保严格的音频质量合规性,涵盖 40 多种语言

该公司已与我们合作了超过 6 年之久,其系统能够识别自然的自发响应,进而能够为用户提供更智能、更互联、更自然的车内体验

借助我们的数据收集和注释服务,该公司已通过 20 多种新语言迅速扩展了其车载信息娱乐系统。此外,由于我们的语言专家在用于模拟实际驾驶条件的场景创建和本地化方面都拥有深厚的专业知识,因此这家一级汽车软件提供商确信他们能够收到高质量的语音和语言训练数据来训练其 ASR 系统。

izmir escort
istanbul escort