Translational Psychiatry:语音特征揭示自闭症真相,ASDSpeech算法在大规模数据集上的突破性应用
2025-01-21 xiongjy MedSci原创 发表于陕西省
ASDSpeech算法能够准确估算自闭症儿童的社交症状严重性,并且具备临床应用的潜力,特别是通过将该算法与眼动追踪、面部表情和身体运动等数据结合使用,可以进一步提高其准确性和可靠性。
自闭症谱系障碍(ASD)是通过社交沟通困难和限制性重复行为(RRB)的存在来诊断的。尽管许多ASD儿童在早期存在语言延迟,但核心症状的严重程度并不完全由言语的数量表现出来,更多的是通过言语的方式体现。例如,一些ASD儿童表现出较差的流利性、语言重复(回声言语)、代词混用和典型的发音与语调异常等,所有这些都可以通过语音的声学特征来观察。近年来,越来越多的研究使用自动化语音分析技术来量化ASD症状,尤其是社交沟通障碍的严重程度。
本文提出了一种名为ASDSpeech的开源人工智能算法,能够分析ASD儿童的语音录音,并通过多次发展时间点准确量化他们的社交沟通困难。该算法在迄今为止最大规模的ASD语音数据集上进行训练和测试,该数据集包含了197名ASD儿童在258次《自闭症诊断观察量表》(ADOS-2)评估中的99,193个语音片段。通过使用来自136名儿童的录音,ASDSpeech算法训练了基于声学和对话特征的模型,评估了ASD症状的严重性。
测试结果表明,ASDSpeech在两次独立的ADOS-2评估中,能够显著准确地估算社交沟通症状(即ADOS-2社交情感评分),并与实际评估分数高度相关,且表现出较强的横向和纵向一致性。特别是在估算社交沟通症状时,算法的准确性要高于对限制性重复行为症状的估算。研究者通过对来自以色列不同临床中心的197名ASD儿童的语音记录进行分析,提取了包括音高、共鸣频率、抖动、能量、零交叉率等49种特征,这些特征能够反映儿童在社交沟通中的不同表现。
图1:提取的语音特征与ADOS-2评分的皮尔逊相关系数
ASDSpeech算法通过卷积神经网络(CNN)进行训练,预测ADOS-2的社交情感(SA)分数和限制性重复行为(RRB)分数。训练数据来自136名只完成一次评估的儿童,而测试数据来自61名在两次ADOS-2评估中都有录音的儿童。研究还在不同年龄组和性别子群中评估了模型的准确性,结果表明,ASDSpeech在这些子群体中具有一致的表现,尤其是在年轻儿童和男性儿童中的表现尤为突出。
ASDSpeech算法在测试数据集中,能够准确估算每个儿童的ADOS-2社交情感分数和总分,且与实际分数之间存在显著相关性。特别地,在评估社交沟通症状时,ASDSpeech展示了与实际ADOS-2评分的较高相关性(r=0.544, P<0.0001)和较低的归一化均方根误差(NRMSE=0.164, P<0.0001)。此外,ASDSpeech在年龄和性别子群中的准确性没有显著差异,表明其在多种不同背景下的稳健性。模型也在纵向分析中表现出良好的稳定性,特别是在社交情感评分(SA)上,T1和T2评估之间的相关性为0.649(P<0.0001)。
研究结果表明,ASDSpeech能够可靠地量化ASD儿童的社交症状严重性,并且具备临床应用的潜力,特别是通过将该算法与眼动追踪、面部表情和身体运动等数据结合使用,可以进一步提高其准确性和可靠性。
原始出处:
本网站所有内容来源注明为“梅斯医学”或“MedSci原创”的文字、图片和音视频资料,版权均属于梅斯医学所有。非经授权,任何媒体、网站或个人不得转载,授权转载时须注明来源为“梅斯医学”。其它来源的文章系转载文章,或“梅斯号”自媒体发布的文章,仅系出于传递更多信息之目的,本站仅负责审核内容合规,其内容不代表本站立场,本站不负责内容的准确性和版权。如果存在侵权、或不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。
在此留言

#人工智能# #自闭症谱系障碍# #深度学习#
37