梁志刚:大数据应用尚需打通采集与规范间的藩篱

2019-08-18 佚名 新华网

数字技术是行业、机构发展的战略制高点。达沃斯发布报告显示,全球企业在数字化转型中投入超万亿美元,仅1%达到或超过预期。医疗行业的数字化程度更是远远落后于其他行业,埃森哲(Accenture)认为其尚不足交通等行业的20%。“这并不是说医疗行业没有数据沉淀,恰恰相反,医疗大数据量增长已达到了PB级,但可用性不够。”宣武医院信息中心主任梁志刚表示,缺乏大数据质量校验和建设规范,使临床面临“无数据”可用

数字技术是行业、机构发展的战略制高点。达沃斯发布报告显示,全球企业在数字化转型中投入超万亿美元,仅1%达到或超过预期。医疗行业的数字化程度更是远远落后于其他行业,埃森哲(Accenture)认为其尚不足交通等行业的20%。

“这并不是说医疗行业没有数据沉淀,恰恰相反,医疗大数据量增长已达到了PB级,但可用性不够。”宣武医院信息中心主任梁志刚表示,缺乏大数据质量校验和建设规范,使临床面临“无数据”可用的尴尬。

大数据的三大特质与应用挑战

每个人一生会产生无限量的医疗健康数据,全球医疗数据量预计到2020年将达到2.314PB,但数据的可用性不高,现阶段数据合格率能达到50%-60%的医疗机构在极少数。

“各行各业都在大谈大数据,‘繁荣’的背后容易轻视追溯大数据的本源,尤其是忽略大数据为谁服务。”梁志刚指出,我们需要的不是“死的”数据,而是要挖掘它的利用价值。单纯的数据汇集或是盲目的数据收集,不足以支撑大数据在决策支持、科研管理等方面的应用。

他认为,真正的大数据应具备三个特质:足够大的量级、多样性、有意义。但现阶段收集的医疗大数据,多为过程数据,属于离散的、不连贯的文本描述性数据,存在非结构化程度高,无法直接用于计算机分析和应用;数据录入也不规范、不完整,有的数据甚至是没有实际意义的,数据质量有缺陷。

“缺乏统一的标准规范、严格的校验机制与平台,没有好的数据治理观念,再多的数据也难以起到反哺临床的作用。”他认为,只有做到数据的标准化、统一化和智能化,才能推动数据的临床价值“变现”。

建立标准规范是大数据服务落地的重要前提

资本行业一直在描绘医疗大数据应用的蓝图;86%二级及以上医疗机构建立了规范化的电子病历系统;作为政策引导方,国家业已出台了数十条 “纲要”或“意见”,建立了医疗大数据初步利好的环境。

但具体如何落实到服务医生、服务患者层面?梁志刚认为,目前尚没有真正成功的大数据应用落地,其最大的壁垒在于缺乏标准和规范。

他介绍,政府层面虽搭建了大数据框架体系,如,居民健康档案、数据中心建设等,也发布了电子病历书写规范,对医疗文书、出院小结等作出了明确定义。这些工作为数据采集和规范奠定了基础,借助人工智能、深度学习技术的运算能力,大数据存取、处理和分析看似已水到渠成了。

“但政策引导是战略性的,缺乏对具体内容的内涵性定义,如果没有执行也是‘纸面’上的。即便AI在某些领域能够超越人类专家,技术始终绕不开路径规范。”梁志刚说,建立大数据的行业规范和标准细则,需要首先建立数据采集的规范。

“通过对数据元素的值域进行定义,利用信息化手段表达出来,建立以病种为单位的专科数据集,梳理出真正有用的数据信息,这是我们目前最需要做的事。”在他看来,标准规范建设可以自下往上,由企业或者行业来梳理,政府层面可以牵头组织,让行业规范上升为国家标准,从而推广至大范围应用。

此外,大数据分析不能盯着“历史数据”,不能停留在数据收集上,更重要的是规范“明天的数据”,做好诊疗过程的标准化,从源头上对诊疗内涵质量和病历内容进行规范,减少垃圾数据的产生。

版权声明:
本网站所有内容来源注明为“梅斯医学”或“MedSci原创”的文字、图片和音视频资料,版权均属于梅斯医学所有。非经授权,任何媒体、网站或个人不得转载,授权转载时须注明来源为“梅斯医学”。其它来源的文章系转载文章,或“梅斯号”自媒体发布的文章,仅系出于传递更多信息之目的,本站仅负责审核内容合规,其内容不代表本站立场,本站不负责内容的准确性和版权。如果存在侵权、或不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。
在此留言
评论区 (0)
#插入话题

相关资讯

数据驱动生命科学创新,美年健康大数据运用又上新台阶

美年健康在生命科学数字化领域又出新动作。近日,在杭州召开的超声大数据与人工智能应用与推广大会上,美年健康和大数据算法与分析国家工程试验室杭州创新中心、浙江省数理医学学会三方在超声人工智能方向达成合作,共建超声大数据库。据了解,美年健康一直深耕预防医学领域,拥有海量的健康大数据并不断发展科技寻求创新突破,致力于以大数据和人工智能,构建美年医疗健康生态图谱,进一步做好“精准预防”,助力预防医学创新转型

JAMA Oncol:出生缺陷与癌症风险关系如何?基于1000多万活产婴儿的大数据为您揭秘

每33名儿童约有1名受到出生缺陷的影响,诸如急性白血病、唐氏综合征等与出生缺陷密切相关,但由于样本量小,既往的研究无法对出生缺陷与儿童肿瘤之间的风险进行全面评估。近期,发表在 JAMA oncology 杂志上一项基于美国1000多万活产婴儿的大数据研究全面评估了出生缺陷与儿童肿瘤之间的相关性风险,揭示出生缺陷与儿童肿瘤 (BD-CC) 的一些特有关联并评估癌症风险比。让我们一起来看看吧。

云计算和大数据重点专项项目成果“多模态自然人机交互神经系统疾病辅助诊断工具”入选国家卫健委“医疗健康人工智能应用落地30更佳案例”

中国科学院软件研究所和中国医学科学院北京协和医院在国家重点研发计划“云计算和大数据”重点专项项目“云端融合的自然交互设备和工具”的支持下,将自然人机交互技术与神经系统疾病临床诊断方法结合,研制了“多模态自然人机交互神经系统疾病辅助诊断工具”,成功应用于神经系统疾病的早期预警与辅助诊断当中,在国家健康医疗相关领域发挥了重要作用,入选国家卫健委颁发的“医疗健康人工智能应用落地30最佳案例”。脑卒中、帕

JAMA Inter Med:30万余人大数据表明遵循健康的植物性饮食可以降低2型糖尿病的风险

哈佛大学陈曾熙公共卫生学院(Harvard T.H. Chan School of Public Health)的一项新荟萃分析显示,坚持以植物为主的饮食的人比没有坚持以植物为主的饮食的人患2型糖尿病的风险更低。研究人员还发现,对于那些饮食强调健康植物性食物的人来说,这种联系更强。该研究将于2019年7月22日发表在《JAMA Internal Medicine》杂志上。

坚持品质与数据驱动战略,美年健康上半年营收36.41亿

7月10日晚,美年健康发布公告显示,经公司初步测算,预计公司上半年实现营业收入36.41亿元人民币。太平洋证券分析报告显示,从公告可以看出,上半年公司经营业绩稳定,回暖趋势明显,略高于市场预期。分析报告进一步指出,2019年上半年营收继续保持4.5%增长,主要得益于报告期内美年健康更加注重高质量发展,坚持“品质和数据驱动战略”,持续投入和强化质控体系建设及优质资源拓展,重点体现在四大方面:一是

CSA&TISC2019丨临床研究大数据与脑重大疾病负担

编者按:近年来,互联网、大数据等技术的快速发展,极大推动医院信息化管理建设。如何充分利用积累的海量数据资源,为疾病诊疗提供助力,成为大家关注的话题。6月28日,CSA&TISC 2019大会于北京召开,首都医科大学附属北京天坛医院潘岳松博士,介绍了怎样通过统一标准化数据元实现不同临床研究数据库的关联,进而加速疾病负担研究结果的产出。