科学家如何解密癌症大数据信息?

2016-10-25 佚名 生物谷

感谢成像领域、模型研究以及遗传学研究的进展,如今大量的数据源源不断地涌入癌症研究者的手中,如今临床试验中来自单一患者肿瘤的相关数据量已经高达1TB了,这些数据信息量相当于13万本书的内容。 但如今研究者仍然缺乏工具来有效处理这些大量的遗传数据从而为疗法的开发进行精准地预测,而治疗癌症似乎依然是研究者未来的一个终极目标,目前研究者并不能准确预测特定的肿瘤如何对任何给定的药物产生反应,以

感谢成像领域、模型研究以及遗传学研究的进展,如今大量的数据源源不断地涌入癌症研究者的手中,如今临床试验中来自单一患者肿瘤的相关数据量已经高达1TB了,这些数据信息量相当于13万本书的内容。

但如今研究者仍然缺乏工具来有效处理这些大量的遗传数据从而为疗法的开发进行精准地预测,而治疗癌症似乎依然是研究者未来的一个终极目标,目前研究者并不能准确预测特定的肿瘤如何对任何给定的药物产生反应,以及患者如何进行治疗,是否癌细胞能够不断进化从而使得疗法失效等等问题。

如今来自美国能源部和国家癌症研究所进行联合研究来抵御癌症,在一项为期三年的研究计划中,研究人员就利用了美国能源部的超级计算功能构建了复杂的计算机模型,从而就能够在分子、病人以及群体水平上来研究抵御癌症的策略。这项研究计划基于美国总统奥巴马提出的精准医疗计划以及副总统近日提出的癌症探月计划,的确研究者的目的是针对个体不同的状况实现个体化的诊断和癌症治疗。

来自美国国家癌症研究所的研究者Warren Kibbe说道,癌症研究者们非常擅长通过基因组数据、蛋白质组数据以及成像数据得出多种类型的数据,但我们并不擅长如何将这些信息数据进行整合,使其成为一种一致性的模型,并且有效预测肿瘤是否会对既定的疗法产生反应。

CANDLE

合作的关键在于计算机框架,其名为“癌症分布式学习环境计划”( CANcer Distributed Learning Environment,CANDLE)。过去很多年里,科学家们进行了多项研究计划,评估了大量的癌症研究数据,其中包括肿瘤的基因组、病人的数据以及多项潜在药物的临床数据等,CANDLE的设计就是利用机器学习算法来在大型数据库中寻找合适的模式,机器的学习就是一类人工智能,其重点关注于那些能够教授我们处理数据的一些程序,这些模式或许最终就能够帮助改善患者的疗法或指导科学家进行新的实验。

截止到目前为止,很多机器学习相关的研究都产生了新型的计算机模型来在单一的数据点评估药物的的反应,然而研究者们想象到了一个更高程度的复杂性并且整合了多种类型的信息,比如药物反应和患者谱系特殊性等。

分子水平上的研究

30%的癌症都表现出了Ras家族的突变,Ras蛋白家族能够帮助诱导细胞机器制造新型细胞或杀灭老细胞。研究者Lawrence Livermore就进行的是分子水平上的试点研究,他利用CANDLE架构来预测Ras蛋白家族蛋白如何在细胞膜上发挥作用,随后他将相关信息加入到了Ras通路问题的研究上,Ras通路问题会导致基因停留在“开启”的位置从而引发肿瘤。

研究者想进行高度复杂性的模拟来描述细胞膜上蛋白质如何移动以及如何结合到特殊位点,他们希望将这些信息能够应用于数百万个Ras通路上,并且明显增强他们的理解,从而预测单一信号在疾病发生过程中的作用。

病人水平上

癌症往往包含着成百上千种疾病,每一种都有着不同的发病原因,因此对于特殊患者而言将精准化引入到疗法选择中或许就是研究者在病人水平上进行研究的终极目的。在CANDLE平台的帮助下,研究人员开发了新型的预测模型,其基于更广泛的多种数据能够引导针对不同肿瘤的疗法选择。

研究者Kibbe说道,研究者们或许会去尝试寻找特殊肿瘤逃脱疗法获产生耐药性的机制,从概念上而言,未来的癌症疗法或许是不断改进变化的,如今我们并不理解癌症对于任何特殊疗法所产生的耐药性对于预测组合性疗法效果的生物学意义,但我认为,模拟将能够帮助我们更好地预测组合性疗法对特殊患者的有效性及重要性。

群体水平上

在任何一个时间点,3%至5%的癌症患者都会参与到癌症临床试验中,而且对患者研究数据的分析编目也仍然是一项非常巨大的手工任务;美国橡树岭国家实验室(Oak Ridge)就将帮助国家癌症研究所的研究者,通过自动化的样品读取及分析过程来监测癌症患者的变化,通过将自然的语言处理及机器学习算法应用到数百万份临床报告中,计算机就会从医生和护士笔记本的信息中提取出有效的东西进行加工。

加工完成后,系统就会自动分析并且提取相关信息以便科学家们监测遍布全球的结果,随后就能指导不同生活方式、环境以及癌症类型的患者进行治疗;档案在进行群体水平的试点研究之前研究者们必须对数据进行去识别化操作。

下一步该怎么做?

在接下来3年里,美国国家癌症研究所及能源部的研究者将会进行一项巨大任务,对此研究者们是由计划的,首先第一年他们讲重点关注合并统计学模型并且构建机器学习方法来对现象进行最好地解释和预测;第二年计算机科学家将会利用计算机进行推断他们对这些预测结果的自信程度;最后一年研究者们将会把所有的信息相结合,同时整合后进行试验性设计分析。

研究者Stevens表示,此刻我们处于一种特殊的阶段,如今在政府部门间出现了一些让人难以置信的谈话,关于如何整合大数据以及信息来理解疾病的发病机制等信息,如果我们能够理解突变、正常生物学过程以及癌症之间的相互作用,那么我们或许就有望对疾病进行干预或预测。

Stevens已经从事了将近20年的计算生物学领域研究,他表示如今他们面临了很多问题,而且他们也并不确定如果他们真的那样做会带来什么后果,但如今癌症探月计划给他们带来了动力,研究者认为,随着后期深入的研究以及多种信息的整合,未来或许有望早期破解癌症大数据,从而为开发新型个体化癌症疗法提供新的思路和希望。

参考资料:

Cancer's big data problem

版权声明:
本网站所有内容来源注明为“梅斯医学”或“MedSci原创”的文字、图片和音视频资料,版权均属于梅斯医学所有。非经授权,任何媒体、网站或个人不得转载,授权转载时须注明来源为“梅斯医学”。其它来源的文章系转载文章,或“梅斯号”自媒体发布的文章,仅系出于传递更多信息之目的,本站仅负责审核内容合规,其内容不代表本站立场,本站不负责内容的准确性和版权。如果存在侵权、或不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。
在此留言
评论区 (0)
#插入话题

相关资讯

薄荷提取物薄荷素油,“死不了的癌症”的克星

近日,来自比利时的一项新的临床研究显示,薄荷提取物薄荷素油可以用于肠易激综合症的解痉剂。 肠易激综合征(IBS)目前认为是一种肠功能紊乱性疾病。临床上以腹痛、腹胀、排便习惯改变和大便性状异常等症候群为主要特征,常呈慢性间歇发作,经检查排除器质性疾病。过去常用结肠功能紊乱、结肠过敏、痉挛性结肠炎、粘液性结肠炎等命名,近年来统称为肠易激综合征。 肠易激综合征起病隐匿,症状反复发作或慢性迁延,病

Nat Med:重磅!科学家发现阻断癌症扩散的新方法

日前,一项刊登在国际杂志Nature Medicine上的研究报告中,来自麦吉尔大学健康中心和伦敦癌症研究所的研究人员通过联合研究发现,某些癌细胞能够从成熟的血管中抽取血液来促进其继续生长扩散,相关研究或可帮助研究者后期开发新型疗法来改善结肠癌患者的生命及预后情况,研究者还希望能够继续深入研究理解结肠癌扩散的机制,从而为更早地开发出有效阻断癌症扩散的新型靶向性疗法提供思路。通过外科手术通常就能移除

美国副总统拜登提交报告介绍癌症“登月计划”进展

美国副总统乔-拜登周三表示旨在实现治愈癌症目的的癌症“登月计划”在即将过去的这一年中取得了实质进展,虽然美国目前正在进行总统大选,但是政府还有更多工作需要去做。拜登副总统对聚集在美国波士顿的几百名健康医疗专家和研究人员发表了讲话,这名现年73岁的民主党人,在今年一月份巴拉克奥巴马总统在他任内最后一年的国情咨文中提出癌症“登月计划”以后,一直致力于这项工作,由他主持领导的“癌症登月”特别工作小组参

科学家发现可以检测多种癌症的血液标记物

2016年10月24日讯 /生物谷BIOON/ --胰腺癌的早期症状相对不明显,经常导致癌细胞扩散到其他器官之后才被发现。为了改善胰腺癌病人的预后,开发早期胰腺癌检测方法变得非常重要。为了实现这一目标,来自日本的科学家们在血液中发现了一些蛋白能够加强对胰腺癌的检测。结合传统的生物标记物,能够实现对早期阶段胰腺癌的诊断,这在之前是非常困难的。为了发现可以用于胰腺癌检测的生物标记物,研究人员决定对已经

PLoS ONE:烟草烟雾引发癌症再添新证据

近日,刊登在国际杂志PLoS ONE上的一项研究报告中,来自肯塔基大学的研究人员通过研究阐明了一种新方法,即烟草烟雾能够促进肺癌的发生,研究者发现,烟草烟雾或许能够抑制DNA的核苷酸切除修复(NER)过程,从而导致肺癌的发生。烟草烟雾中的很多成分都是能够损伤DNA的致癌物,这种损伤能够被DNA修复过程所移除从而就能够抑制机体遗传性突变的产生,诸如核苷酸切除修复等DNA修复过程对于阻断诱发肺癌发生的