全新AutoML工具实现基因组全自动建模,“宝藏技术”解读生命天书

2020-03-30 生物探索 生物探索

3月27日,华为开发者大会2020(Cloud)期间,华为云发布了全新自动机器学习AutoML(Automated Machine Learning)工具AutoGenome,实现对基因组数据的全自动

自1990年人类基因组计划(Human GenomeProject)的提出,迄今已过去30多年。作为生命的天书,基因从最底层蕴含了许多病症的秘密。从最轻微的传染病到严重的癌症,都能从拥有超过30亿个碱基对的基因中找到答案。

随着测序技术的发展,如今完成一个人全基因组测序已是普通家庭都可以负担起费用的“平常”事,但是关于基因学组的研究却仍处于起步阶段。目前全世界科学家可以解读的遗传密码不超过3%,还有97%的遗传密码犹如一座科学尚未突破的巨塔,而AI或许就是攀登这座巨塔的“宝藏技术”。

慧眼解读“生命天书”

此前,由于基因组数据的复杂性,主流的基于图像和文本的AI模型不能很好地对基因组数据进行建模。如果基因组能够实现全自动AI建模,或许可以帮助科研人员解决数据处理难、解读累的难题。但是由于基因组数据量之大,AI模型搭建是一项非常复杂的任务,开发门槛非常高。想要提高深度学习在基因组中应用的效果,开发者必须经验丰富。

3月27日,华为开发者大会2020(Cloud)期间,华为云发布了全新自动机器学习AutoML(Automated Machine Learning)工具AutoGenome,实现对基因组数据的全自动AI建模。

AutoML是2014来以来机器学习和深度学习领域最炙手可热的方向之一。具体来说,AutoGenome采用了超参数自动搜索、神经网络结构自动搜索和模型自动解释器等最新的AutoML技术。同时,AutoGenome还提出了全新的更加适用于基因组数据建模的残差全连接网络结构(RFCN),在多项不同的基因组数据建模任务中,AutoGenome的准确性都超出传统模型5个百分点以上。

在开发过程上,AutoGenome对于AI的初学者非常友好,用户在华为云ModelArts一站式AI开发管理平台可以一键启动Notebook开发环境,只需要五行代码即可快速完成端到端的基因组数据建模、准确性评估和模型解释。

AutoGenome Examples已经列入华为云ModelArts Notebook任务中

此外,华为云还联合华为2012实验室媒体院研发了Autosearch自动化搜索框架并预置在华为云一站式AI开发管理平台ModelArts中,可以集成更多的AutoML搜索算法,便于支持更多的基因建模能力。

大会期间,中科院基因组所韩大力教授也在现场分享了通过利用AutoGenome对羟甲基化组学数据进行建模,从而实现对肝癌的早期诊断。数据显示,借助AutoGenome的自动建模比文献报道的同类工作准确率高出八个百分点。

在这个AI技术全面渗透的时代,华为云推出的AutoGenome便成了一双“慧眼”, 能够有效地从数据中挖掘到有价值的信息,大大改变了基因组学的研究方式。目前,AutoGenome已经正式上线,用户可在华为云ModelArts一站式AI开发管理平台上免费使用。

“AI抗疫”之战

当前正值新冠疫情在全球扩散态势,国内疫情防控渐见曙光。在这场艰难的攻坚战中,凭借AI这把利剑,华为云打出了“战疫”组合拳。其中,AI辅助诊断、抗病毒药物筛选AI模型表现抢眼。

CT作为新冠肺炎重要的诊疗决策依据手段之一,扮演着重要的角色。但是,由于患者肺内病灶多、变化快,短时间内需要多次复查、图像多等情况,造成影像医生工作负荷显着增加,加上可精准诊断、量化分析新冠肺炎影像的医生紧缺,诊断效率难以大幅提升。

新型冠状病毒肺炎AI辅助医学影像量化分析服务是由华为云联合华中科技大学、蓝网科技等研发并推出。该服务基于华为云领先的计算机视觉与医学影像分析等AI技术,可全自动、快速、准确地为影像及临床医生提供CT量化结果,缓解精准诊断新冠肺炎影像医生紧缺的局面及隔离防控压力,减轻医生诊断工作负荷。

通过大量新冠肺炎案例以及正常案例进行分析,结果显示,华为云AI量化辅助诊断服务实现病灶区域分割DICE(预测病灶和真实病灶的重合度)及AVD(预测病灶体积与真实病灶体积误差)指标业界领先,与医生用手工精准勾勒的结果高度一致。同时,基于华为升腾AI系列芯片,该服务可以实现CT量化结果秒级输出,相较于医生手工勾画ROI进行量化评估的传统方式,极大地提升了诊断效率。

除了辅助诊疗方面发挥了积极作用,AI利用大数据和机器学习方法,在药物筛选应用方面也大有作为。疫情初期,华中科技大学同济医学院基础医学院、西安交通大学第一附属医院、中科院北京基因组研究所、华中科技大学同济医学院附属武汉儿童医院、华为云等组成的联合科研团队,针对新冠病毒的多个靶标蛋白,对8506种上市或者正在进行临床试验的药物中进行超大规模计算机辅助药物筛选工作,并筛选出五种可能对2019新型冠状病毒(2019-nCoV)有效的抗病毒药物。

此次大规模计算机辅助药物筛选,完全基于华为云EI医疗智能体平台(EIHealth)进行。该平台基于华为云AI升腾集群服务、ModelArts一站式AI开发与管理平台的强大AI能力,集成了医药领域众多算法、工具、AI模型和自动化流水线。得益于AI的助力,科研团队能够在短时间内完成上千亿次的模拟计算,让以往耗时数月的计算机辅助药物筛选在数小时内完成。

结语

AI需要数据作为土壤,而医疗行业的数据丰富,且依赖于数据做决策,从这个意义上来说,AI 有望改变医疗行业的未来,而华为云一直在积极践行普惠AI的承诺。云是现在,AI是未来,伴随着5G时代的到来, 云、AI、5G将会应用于越来越多的医疗行业场景。智慧时代,未来已来。



版权声明:
本网站所有注明来源:“梅斯医学”或“MedSci”或“MedSci原创”的文字、图片和音视频资料,版权均属于梅斯医学所有。非经授权,任何媒体、网站或个人不得转载,否则将追究法律责任。取得书面授权转载时,须注明“来源:梅斯医学”。其它来源的文章系转载文章,本网所有转载文章系出于传递更多信息之目的,转载内容不代表本站立场。不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。
在此留言

相关资讯

科技日报:基因组分析显示, 新冠病毒难长存

新冠病毒是否将彻底灭绝?不少专家认为,新冠肺炎可能转化为一种慢性疾病,新冠病毒有可能在人体内长期潜伏,和人类长期共存。难道说我们真的要长期生活在新冠疫情的阴影之下?

病毒基因组自动化鉴定云平台上线

日前,中国科学院上海巴斯德研究所、中国科学院上海营养与健康研究所共同开发,华为提供云计算技术支撑的病毒基因组自动化鉴定云平台(Virus Identification Cloud, VIC)在华为云正式上线。

Cell Death Dis:NBS1与HP1相互作用保护基因组的完整性

HP1(异染色质蛋白1)和MRN(Mre11-Rad50-Nbs1)复合物都是保守因子,对基因组的稳定性和完整性具有重要作用。虽然从染色质组织、端粒维护到DNA复制及修复,HP1与MRN复合物的功能有所重叠,但它们之间功能的相关性仍未明确。本研究发现果蝇中的HP1a蛋白科通过MRN复合物的chromoshadow结构域(CSD)与其结合。此外,MRN复合物的任一成员丢失均会降低HP1a的水平,说明

BMC Infect Dis:CMV基因组变异与有症状的感染和听力损失相关性研究

新生儿巨细胞病毒感染(cCMV)是最常见的先天性感染,并且是长期神经和感觉后遗症的主要诱因,其中最常见的为感官听力损失(SNHL)。尽管已有大量的研究,鉴定疾病风险增加的CMV感染儿童的临床或者实验室标记仍旧还没有鉴定。最近,有研究人员进行了病毒全基因组测序(NGS)来探索病毒多样性和特定的病毒变异与有症状的感染和SNHL相关性情况。研究包括了从30个从婴儿尿液中提取的CMV DNA样。研究人员对

Nature:转移性实体瘤的全癌全基因组分析

最近,研究人员描述了迄今为止最大的转移性实体瘤基因组全癌研究。

Nature:重磅!科学家在人类癌症基因组非编码区域中鉴别出关键的致癌突变

近日,一项刊登在国际杂志Nature上的研究报告中,来自加拿大安大略省癌症研究所的科学家们通过研究在人类癌症基因组中的大量非编码区域(也被称之为人类癌症DNA的“暗物质”)中发现了一种新型的致癌突变;这种突变或能作为一种新型潜在的治疗靶点,帮助科学家们开发治疗多种类型癌症的新型疗法,包括脑癌、肝癌和血液癌症等。