Doctor holding persons hand

关注3亿抑郁症患者,人工智能也可以有“温度”

最近,李飞飞团队展示了一项最新研究成果,一种基于机器学习的抑郁症症状严重程度测量方法,该方法使用了视频、音频和文本数据集,以及因果卷积神经网络模型,通过口语和3D面部表情评估抑郁症严重程度,准确率超过80%,且该技术可以移植到手机移动端实现,引起了人工智能和医学界的广泛关注。

Person holding a frown face
众所周知,近年来针对医疗领域的AI应用已取得了不少喜人的成果,这说明AI+医疗极具现实可行性,并致使人们想利用AI解决更复杂的医疗难题。而抑郁症作为一种难以被察觉的精神疾病,许多患者甚至不知道自己得了抑郁症,也不愿去就医。“由于社会舆论、高昂成本和治疗缺位,60%的精神性疾病患者没有获得任何精神健康服务”,李飞飞团队的报告中写道。据世界卫生组织统计,全球有逾3亿人罹患抑郁症,近十年来增速约18%,且近半数抑郁症患者都生活在东南亚和西太平洋地区,并预估至2020年,抑郁症将成继冠心病后全球第二大疾病。

Statistics chart
在中国,抑郁症患者出现年轻化趋势,且发病率高于世界平均水平,近年来患者人数持续上升,成为中国医疗健康体系面临的一大难题。其实很多人并不知道,抑郁症的治愈率较高,约80%患者通过积极干预和治疗都能取得明显疗效。而传统的抑郁症诊断方法依赖于临床症状检测,但是李飞飞团队的研究正在突破这一点,实现抑郁症症状的自动检测,可以潜在地提高全世界范围内抑郁症诊断准确性和有效性,从而带来更快速的干预治疗。

在临床实践中,医生首先通过面对面临床问诊来测量抑郁症症状的严重程度。在问诊过程中,医生将同时评估抑郁症症状的语言和非语言指标:包括音高单调、语速降低、音量降低、手势较少和总向下看,如果这些症状持续了两周,可以认为患者重度抑郁症发作。此外,PHQ这一国际通用的患者健康问卷在多个个人维度上测量抑郁症症状的严重程度,对于初步诊疗至关重要。因此,李飞飞团队在实验中采用了多模态数据:(a)3D面部扫描的视频,(b)音频录音,可转化为可视化的log-mel声谱图,以及(c)患者讲话的转录文本。机器学习模型基于这三种模式预测抑郁症症状的严重程度。

Illustration of therapeutic analysis
这些数据主要来自DAIC-WOZ数据库,该数据库用于视听情感识别挑战,其中包含旨在支持心理困扰状况如焦虑,抑郁和创伤后应激的诊断的临床访谈。实验中,对于每一个患者都提供了PHQ-8(8条目患者健康问卷)评分。问诊过程为病人与遥控数字助理对话,临床医生会通过数字助理询问一系列专门针对抑郁症症状的问题,最后团队一共收集了来自142名患者的189次临床问诊的共50小时的数据。不过这些数据不包含受保护的健康信息(PHI),李飞飞表示“虽然数据集是公开可用的,但是在未来,将此方法应用于其他数据集的研究人员可能会遇到PHI,那时他们应该合理地设计实验”。换言之,如果要进行更深度的研究,那就必须考虑隐私数据的复杂性。

而本次使用的模型也与以往不同,为两个技术部分组成:句子级的“概要”嵌入、因果卷积网络(C-CNN)。在这项工作中,李飞飞团队提出了一种新的多模态句子级嵌入,结果是能够捕获更长期的声音、视觉和语言元素。他们把音频、3D面部扫描和文本输入因果卷积网络,多模态句子级嵌入则装进抑郁症分类器和PHQ回归模型里,通过这样的方法和现有测量工作进行比较,并且对模型作了相关的消融研究。最终结果显示,在经过临床验证过的PHQ水平上,模型的平均误差只有3.67分(相对误差为15.3%);对于检测重度抑郁症,模型则显示出了83.3%的敏感性和82.6%的特异性。

Doctor holding a tablet
李飞飞团队称他们的方法可以摆脱对于问诊情景的依赖,不过也指出“虽然额外的上下文通常对模型有帮助,但是它可能引入技术性挑战,比如每个上下文分类的训练样本太少”。其实,报告中多处提到与“数据”相关的重点说明,在总结中写道“虽然预先存在的嵌入方便使用,但最近的研究表明这些向量可能包含由于基础训练数据引起的误差。减小误差超出了我们的工作范围,但对于提供敏感的诊断和治疗至关重要”。可见,准确大量的数据集和数据训练对于医疗AI化的前途起到了决定性的作用。

医疗与基础领域截然不同,其复杂严密的知识体系和实践成果对于人工智能是极大的挑战,而在数据的使用上有更高的要求和难度。通过多年的数据服务经验,Appen 已经为众多行业领域的客户采集了庞大的高质量数据用于机器学习,并且在继续扩充数据库内容。Appen 认为,由于人工智能的研究方法在革新,数据采集也要与时俱进,这意味着数据服务商要主动适应变化,加强与世界范围内的行业专家建立合作。这一点,Appen 已布局多年,不止医学、包括在化学、生物、金融等专业领域都积累了相当多的业内专家群策群力,以获取全球最新的发现成果。

可以预见的是,随着AI向纵深发展,对于特定行业、特定人群的涉及会越来越多,充分的数据赋能将左右人工智能可以企及的高度。

 


联系我们以了解更多信息

发表评论

电子邮件地址不会被公开。 必填项已用*标注