无需言语,用意识与外界通信并控制环境,是人类自古以来追求的梦想。当德国精神病学家Hans Berger 1929年首次报告了人类脑电图活动后,科学家们逐渐找到了将这个梦想变为现实的突破口——脑机接口技术。
随着脑机接口技术的发展,尽管距离意识控制环境仍然十分遥远,但是用意识发声却逐渐变为现实。今年6月份,由瑞士非营利组织Wyss生物与神经工程中心开发的,旨在将无法说话的肌萎缩侧索硬化 (ALS) 患者的脑电波转换为语音的脑机接口产品NeuroKey获得了欧盟CE认证。
遗憾的是,与大多数脑机接口产品一样,NeuroKey仅能通过生成元音和音素从而缓慢地拼凑单词和句子。如果能够研制出一款直接解码人类神经信号并转化为语言的产品,对于因病失去行动能力的瘫痪患者而言,将极大地改善其生活质量。
7月15日,来自加州大学的科学家们在国际顶级医学期刊NEJM上发布了一篇研究报告,指出他们已经开发出一种让因病瘫痪无法发声的患者,依靠大脑信号恢复语言活动的系统。该系统能以平均每分钟15.2个单词的中位速率实时解码参与者“所想”,中位单词错误率约为25.6%。
具体而言,2019年2月,研究人员在一个因桥脑梗塞而丧失行动能力及语言能力的患者的感觉运动皮层区域,植入了一个由 PMT 制造高密度皮层电图电极阵列以及由Blackrock Microsystems 制造的经皮连接器组合,这些神经植入物此前均已获得FDA批准上市。
在一年半的时间里,参与者共接受了50个疗程的任务训练,包括从50个单词里“说出”看到的词汇,以及快速报告所看到的英文句子。在每个训练任务中,研究人员收集了大约 27 分钟的神经活动数据,并使用这些数据对建立的自然语言模型进行了调整。
训练示意图
为了测试这套模型对神经活动的解码性能,研究人员使用单词错误率和每分钟解码的单词数两个指标对参与者的神经活动数据进行了分析。最终,这套模型捕捉到了参与者试图生成的98%的词汇,并且基于该模型,参与者在识别句子块的过程中,词汇的错误率由60.5%降至了25.6%,一半以上的句子实现了完美解码。
通过神经信号处理和语言建模实时解码各种句子的准确性
“据我们所知,这是科学界首次成功地从瘫痪、不能说话的患者大脑活动中直接解码完整单词的例子,” 该报告的主要作者、加州大学旧金山分校神经外科博士Edward Chang说,“正如我们所演示的,帮助不能说话的人直接‘发声’意义重大,因为这更接近我们的日常交流方式。”
目前,研究人员正在尝试纳入更多的参与者类型以扩大研究范围,同时也正在扩大词汇量列表从而帮助提高自然语言模型的每分钟识词数。
原始出处:
David A. Moses, et al. Neuroprosthesis for Decoding Speech in a Paralyzed Person with Anarthria. N Engl J Med 2021; 385:217-227. DOI: 10.1056/NEJMoa2027540.
本网站所有内容来源注明为“梅斯医学”或“MedSci原创”的文字、图片和音视频资料,版权均属于梅斯医学所有。非经授权,任何媒体、网站或个人不得转载,授权转载时须注明来源为“梅斯医学”。其它来源的文章系转载文章,或“梅斯号”自媒体发布的文章,仅系出于传递更多信息之目的,本站仅负责审核内容合规,其内容不代表本站立场,本站不负责内容的准确性和版权。如果存在侵权、或不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。
在此留言
#失语#
45
#瘫痪#
49
顶刊就是顶刊,谢谢梅斯带来这么高水平的研究报道,我们科里同事经常看梅斯,分享梅斯上的信息
40