王永雄与医渡云的医疗大数据“新故事”

2017-12-22 高维荣 健康界

大数据蕴含哪些价值?它又将为医疗带来哪些改变?

新的医疗模式正在逐步建立,这缘于大数据时代的来临。

传统与现代不再泾渭分明,大数据被广泛应用到各个场景。在医疗领域,大数据技术可以通过对海量数据的存储、处理和分析,进而帮助医院、医生提高临床服务质量、科研转化率和管理效率。

斯坦福大学统计系教授王永雄说,医院能获取并记录所有相关临床数据,现在的关键是如何聚合与分享这些数据(尤其是全国范围的数据),从而支持医疗服务,加速医学研究和改善临床效果。“如果能谨慎并及时地做到这一点,中国凭借庞大的人口总量会增加其在医学研究和医疗创新上的竞争优势。”

这无比契合了医渡云“数据智能,绿色医疗”的构想。随着王永雄于2017年10月份受邀担任医渡云首席数据科学顾问,国际统计领域大咖与国内医疗大数据领先企业的深度合作,使“大数据+医疗”的发展前景再次成为焦点。

“这种合作模式能激发出创新的科学发现。”王永雄对此满怀期待。

建立“共享平台”

王永雄一直致力于高通量基因组数据分析与研究。他通过整合新一代测序技术和健康信息技术促进精准医学的发展,以便能够对患者开展个性化诊断、疾病预防和治疗。他在探索性数据分析、多元统计分析、机器学习等方面研发的技术方法,已经在计算生物学和系统生物学领域得到广泛应用。

“生物医学数据的有效利用,对医疗卫生未来的发展至关重要。”王永雄说,然而由于数据所有权分散,以及对于处理敏感健康信息的严格监管,还没有医疗机构间共享临床数据的有效机制。

在全球范围内,大数据的收集、共享都是一个具有挑战性的工作。

在美国,到目前为止,最大的临床数据资源都锁在凯撒医疗集团、VA(美国退伍军人事务部)健康系统等主要医疗集团的防火墙内——虽然它们每家有几百万患者的临床数据,但与美国总人口相比还是非常小。而在英国,因为由政府提供全民医疗,更容易收集、整理和使用全国医院和诊所的临床数据。此外,还有大量公共组织或私人机构在基因、分子数据的生成上投资,以补足临床数据,这助推了英国精准医学的发展。

过去几年中,中国生物医学大数据发展堪称迅猛。在大医院,已经能获取并记录患者的所有临床数据,但依旧需要面临的问题是,如何聚合与分享这些数据(尤其是全国范围的数据),从而支持医疗服务计划,加速医学研究和改善临床效果。医渡云的首席执行官孙喆也曾表示,区域医疗的数据是一个从单体医院逐渐走向区域化数据的过程,“但是在过去中国区域卫生做起来并没有成功,大家还没有意识坐在一起建立共生的生态。”

“如果能谨慎并及时地做到这一点,中国凭借庞大的人口总量会增加其在医学研究和医疗创新上的竞争优势。”王永雄说。



要实现在更大范围内共享临床数据,王永雄认为需要两个条件:首先,利益相关者(包括医院、医生、患者、各级卫生机构等),需要建立一个数据共享机制,让数据有效共享的同时避免敏感数据的滥用;其次,该机制应大规模推广,这对医学研究和临床服务都有益。

王永雄说,“找到一个让所有利益相关者都满意的机制需要不断尝试,这不是一步就能完成的。何况无论是什么机制,要想大规模实施,都是一项非常‘昂贵’的任务。”

但这并非不可实现,王永雄认为,关键一步是建立一个大范围内医疗数据共享、整合和分析的平台。该平台将是灵活的、可重构的,再加上平台本身的数据安全和入口控制等功能,使得任何数据共享机制都能快速实施。

王永雄相信,有一个利益相关者都接受的数据共享机制,并能快速试验和改进,“将给我们带来成功运用中国庞大临床数据资源的最好机会。”

发现“隐形价值”

十年前,王永雄团队跟斯坦福大学医学院妇产科医生Mylene Yao合作做了一个大数据项目——应用首轮体外受精治疗中失败的夫妇的临床数据,用于预测他们第二轮治疗中的成功率。他们成功开发了一个基于机器学习的方法,并将其用于Yao医生的数据集中,相比于标准的预后规则,它极大地改善了预测的准确性。但自那之后,王永雄就开始相信潜藏在临床数据中的“隐形价值”。

在该研究中,王永雄认为成功的关键是Yao医生花费了很多精力来产生高质量的“结构化数据”—— 检阅每一份记录并从中摘取出大量潜在相关可变量。结构化的数据准备好之后,统计机器学习分析就可以识别可预测的模型和变量。

但,在国内医院中医疗数据多为非结构化数据,且多系统数据相对独立、关联性较弱。所以海量医疗的数据的整合,使其从凌乱转换为结构性的,从零碎的转化为黏连的,十分有必要。王永雄说,这需要医学、自然语言处理和信息学等多方面的专家紧密协作。

在欧美等发达国家,对于大数据的“结构化”处理在公共健康系统中得到充分应用,如VA医疗系统、NHS(英国公立医疗系统)抑或大型私营健康集团,都能够从一个电子病历系统中得到多种多样的结构化数据,并应用于患者群体。

事实上,在国内的很多医院,电子病历中也有大量结构化数据,包括各种诊断数码、治疗数码、配药数码等,甚至医疗检查、诊断测试和病理报告的结果转变为结构化数据也并不困难。但要跨医院、跨区域地摄取和统一不同系统的数据,从几亿个电子病历中整理出结构化数据,这无疑是一个巨大的挑战。“医渡云这样的医疗大数据公司,可以在此过程中发挥重要作用。”

王永雄认为,结构化的医疗数据本身蕴含着巨大的价值,通过它能做的事情有很多,其中最迫切的是建立针对具体单个疾病的数据模型和平台。


王永雄说,“每一种疾病,专业的医生和数据科学家都应该紧密合作,找出其关键的数据变量,并设计出一个模型,用于提取与该疾病诊断、预后和治疗相关的分类或数值特征。”毫无疑问,建立这样的具体疾病数据资源需要大量的工作,同时也需要结合更深的医学知识。

而一旦结构化的单病种临床数据被挖掘、处理,并实现最后应用,这会让数据研究者、医院、医生、乃至患者均有“数据+”的获得感。

“大范围的临床数据处理和分析平台对各方都有益。”王永雄说,它可以协助计划或正在进行临床研究、试验的医学研究者;医院管理者可以使用该平台来计算和预估患者数量、疗效和其他任何医院运营相关因素的趋势;医生可以来搜索有相同临床表现的病例,帮助其做出更好的治疗决策;该平台还为患者提供了浏览自己临床数据的工具……

新故事

就王永雄本人而言,他对大数据医疗的巨大热情,源自他希望通过大数据来探索基因变异和突变是如何影响一个人的健康和疾病发展的。

随着基因组测序技术成本的不断降低、容量不断增大,王永雄希望,不久的将来,每个人的医疗记录中都会包含其完整的基因组序列信息。“一旦我们能得到几百万人或几千万人的(来自基因组测序的)基因数据和(来自医疗记录的)表型(Phenotype)数据,就能对上述问题做出前所未有的贡献。”

王永雄一直在寻找拥有覆盖人类健康各个方面临床表型数据的合作者。“大范围的覆盖是非常重要的,因为你不知道哪一种表型和特定基因位点的突变相关。” 因此、拥有庞大的规模和尖端的临床数据平台的医渡云,是一个最理想的合作伙伴。

作为业内迅速崛起的医疗数据智能技术公司,2013年成立的医渡云已与国内20个省市近百家顶级医疗机构及50多位全国专科主委/副主委进行合作,合作涉及超过30个专科疾病、15,000+个专科词汇及50多项国家/省级科研课题。以“医疗大数据智能处理与应用一体化平台 ” (Data Process & Application Platform,简称DPAP)为基础研发的“医渡云医院精益化管理平台”、“医渡云专科数据平台”及“医渡云政务数据平台”等产品,为其用户提供了领先的模块智能定制化解决方案。这为王永雄的研究提供了巨大的支撑。

数据即资源。不过在王永雄看来,基础临床数据的所有权属于患者和医院,医渡云可以帮助医院将其临床数据转变为结构化数据,这样的数据对患者、医生和医院管理者都更有用。在得到医院的许可后,医渡云还可以对来自一家或多家协作医院某种疾病人群的数据,进行统计分析和机器学习的分析。

“在此过程中,我们会确保敏感健康信息的安全。作为一个科学顾问,我的角色将会是对医渡云的数据科学研究项目提供建议和反馈。作为一个协作者,我的团队会使用已脱敏的或聚合的数据集,解决大家共同关心的问题。任何包含敏感数据的计算都会在医渡云受保护的环境下完成。”王永雄说。

当然,已经深刻洞悉大数据潜力与价值的王永雄,加入医渡云的最重要的目标,是通过在大数据领域的深度的挖掘,实现医疗创新。王永雄谈到,“精准医学”的实现,需要医生从基于规则的医学决策走向基于可靠诊断和预后模型的个性化决策转变,一个真正大型的生物医学信息处理和分析平台,将在很大程度上加速这种转变。

可以预期,随着医渡云、王永雄们的持续深耕细作,数据科学和人工智能在健康和医学中的运用将愈发广泛和深入。

王永雄说,“早晚,医疗工作者们会像对待医学指南、综述一样,同样重视和利用从大数据平台和预测模型中得到的经验证据。数据科学、机器学习和统计模型的基本理念,都应该是21世纪医生训练的一部分。”

版权声明:
本网站所有内容来源注明为“梅斯医学”或“MedSci原创”的文字、图片和音视频资料,版权均属于梅斯医学所有。非经授权,任何媒体、网站或个人不得转载,授权转载时须注明来源为“梅斯医学”。其它来源的文章系转载文章,或“梅斯号”自媒体发布的文章,仅系出于传递更多信息之目的,本站仅负责审核内容合规,其内容不代表本站立场,本站不负责内容的准确性和版权。如果存在侵权、或不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。
在此留言
评论区 (1)
#插入话题
  1. [GetPortalCommentsPageByObjectIdResponse(id=1735980, encodeId=57d81e3598075, content=<a href='/topic/show?id=21be3492589' target=_blank style='color:#2F92EE;'>#医疗大数据#</a>, beContent=null, objectType=article, channel=null, level=null, likeNumber=30, replyNumber=0, topicName=null, topicId=null, topicList=[TopicDto(id=34925, encryptionId=21be3492589, topicName=医疗大数据)], attachment=null, authenticateStatus=null, createdAvatar=null, createdBy=d0ea34047589, createdName=aids224, createdTime=Tue Oct 30 00:07:00 CST 2018, time=2018-10-30, status=1, ipAttribution=)]