MediaInterface利用成品数据集拓展法国市场

MediaInterface在新市场推出语音识别技术

我们当时正在向新市场扩展。尽管我们拥有完全本地化的软件,但由于缺乏资源,我们无法让客户以最理想的方式使用。澳鹏通过法语词典数据帮助了我们。

——MediaInterface产品经理Ines Wendler

 

公司简介

二十多年来,MediaInterface一直在为德国和欧洲其他地区(包括奥地利和瑞士)的医疗保健相关机构提供语言技术解决方案。他们的核心产品SpeaKING利用语音识别人工智能(AI)支持医疗文档,从而实现速度更快、质量更高的文档工作流程。该产品的用户群遍布600家医院和700家医疗机构,涉及75,000多名用户。

 

挑战

凭借多年来在欧洲多个国家的成功经验,MediaInterface希望将业务扩展到法国。在那里他们注意到,由于需要支持医疗文档中涉及的各种工作流程,对用户友好型解决方案的需求在不断增长。

但是,拓展新市场的问题是,MediaInterface十五年来收集的数据不适用于另一种语言。他们需要的是具有高质量语音转录功能的法语背景词典,这将有助于他们建立全面的词汇基础。

该词典中最大的数据空白是患者健康信息中经常引用的法语姓名和地点。这些数据将是最难获取的:由于《欧洲通用数据保护条例》的规定,MediaInterface可以收集的健康数据必须匿名处理,因此不包括人名和地名。MediaInterface必须寻求外部资源帮助他们填补这些重要数据空白,同时遵守适当的数据法规和要求。

 

解决方案

MediaInterface在2015年的INTERSPEECH语音处理会议上发现了我们,并在2019年由于MediaInterface需求的变化建立了联系。我们成品数据集符合MediaInterface的法国扩展项目的预算和要求,于是双方建立了合作伙伴关系。该公司利用我们的数据集获得了大约21,000个法国人名和14,000个地名,从而填补了最关键的数据空白。MediaInterface一直使用这些数据单位来开发其背景词典。

 

成效

我们必须向澳鹏购买关键数据,这些数据已经纳入了我们的背景词典。这有助于我们为客户建立新的词汇表。

——MediaInterface产品经理Ines Wendler

 

我们的可利用成品数据集支持法语词汇的能力帮助了MediaInterface,帮助他们开发产品的语言特定部分,从而扩展到一个全新的市场,并且凸显了进入未来市场的可能性。现在,MediaInterface全面覆盖了医疗机构对基本口述和语音识别的需求,为法国客户提供了较高的可信度。背景词典还为法国客户提供了定制话的机会。他们可以使用MediaInterface语音识别解决方案Speaking的SmartLearning功能以及背景词典来添加自己的文本,以个性化现有词汇,从而通过向基础AI模型中添加数据来提高语音识别效果。

我们的成品数据集可帮助客户以更高的产品准确性实现快速的部署。就MediaInterface而言,我们的数据集为他们配备了工具,使他们可以自信地扩大客户群,同时改善质量和客户体验。

Language