AJHG:基于超3千个体血浆蛋白质组的全转录组关联分析,揭示复杂性状背后的顺式和反式调节机制

2024-03-14 测序中国 测序中国 发表于上海

研究团队使用跨组织基因表达预测揭示了影响血浆蛋白质组的调控特征,发现影响基因表达的遗传因素也为了解血浆蛋白质组和相关性状提供了窗口。

遗传变异会引起复杂的性状差异,这背后的机制依赖于基因表达和蛋白质丰度的调节。表达数量性状位点(eQTL)是指染色体上一些能特定调控mRNA和蛋白质表达水平的DNA区域,在不同人群中有所不同。近年来,通过在多个人类组织中进行eQTL共定位分析,科研人员发现了多种远端(反式)和近端(顺式)与基因表达相关的变异。顺式eQTL通常比反式eQTL具有更大的作用效应,但反式eQTL在基因表达的遗传力中占更大比例、更具组织特异性,可在细胞类型分化中发挥重要作用。

由于多重检测负担较高、效应较低等原因,目前通过数量性状位点(QTL)定位方法来检测反式作用的能力有限。随着捕获蛋白质和蛋白质丰度检测技术的不断发展,蛋白质数量性状位点(pQTL)定位技术能够识别与蛋白质表达水平相关的遗传变异。反式pQTL与反式eQTL类似,往往具有较低的作用效应和组织特异性。为此,科研人员设想模仿检测反式eQTL的方法,有可能改善反式pQTL的检测。

近期,美国Broad研究所的研究人员及合作者在American journal of human genetics上发表了题为“Transcriptome-wide association study of the plasma proteome reveals cis and trans regulatory mechanisms underlying complex traits”的文章。研究团队使用跨组织基因表达预测揭示了影响血浆蛋白质组的调控特征,发现影响基因表达的遗传因素也为了解血浆蛋白质组和相关性状提供了窗口。具体而言,研究团队检测了基因表达的顺式成分与观察到的血浆蛋白水平的关系,从而确定了调节蛋白水平的顺式和反式作用基因;使用基因型组织表达(GTEx)项目中49个组织的转录组预测模型,预测了基因表达的顺式成分,并检测了每个组织中每个基因的预测表达与在3,301名个体(INTERVAL研究)检测到的3622个血浆蛋白丰度之间的关系。

研究团队还对精准医学跨组学(TOPMed)动脉粥样硬化多民族研究(MESA)中971名个体进行重复性测试。结果显示,有1,168个顺式和1,210个反式作用关联重现,跨组织的中位预期真阳性率(π1)分别为0.806和0.390;反式作用基因靶蛋白富集了转录因子结合位点和自身免疫性疾病的GWAS目录。此外,研究团队还发现同一底层基因的预测表达与蛋白质水平之间的相关性高于观察表达,这表明基因表达的顺式作用遗传调控(可遗传)成分在组织中比观察到的总表达(遗传+环境)更一致,有助于揭示与复杂性状相关的SNP功能

图片

文章发表在American journal of human genetics

1. 蛋白质的全转录组关联分析(TWAS)鉴定出基因-蛋白质关联

通过PrediXcan软件框架,研究团队检测了基因表达的遗传调控成分(GReX)与血浆蛋白水平的关系(图1)。发现集来自INTERVAL队列,TOPMed MESA队列则用于验证。基于先前构建的GTEx项目中49个组织的预测模型,研究团队预测了发现集和验证集的基因表达;并计算了在INTERVAL队列中检测的3,622个蛋白质的预测基因表达和观察到的蛋白质水平之间的相关性。重要的转录物-蛋白质对被量化为顺式(彼此相距1Mb以内)或反式(相距大于1Mb)作用,顺式作用对进一步分为顺式相同(cis-same)即转录物与其编码的蛋白质相关和顺式不同(cis-different)即转录物与邻近不同基因的蛋白质产物相关。

图片

图1. 蛋白水平全转录组关联研究(TWAS)。

在INTERVAL中,研究团队为482个独特的蛋白质(240个顺式不同,242个顺式相同)确定了3,699种显著(FDR<0.05)独特的顺式作用关联,为2,016个独特的蛋白质确定了13,598种显著(FDR<0.05)独特的反式作用关联

图片

图2. 重要转录物-蛋白质关联概览。

平均而言,与在INTERVAL中发现的重要反式作用关联相比,在INTERVAL队列中发现的重要顺式作用关联在更多组织中共享(图3)。

图片

图3. INTERVAL中,跨组织共享的顺式和反式作用。

在INTERVAL检测的转录物-蛋白质对中,反式作用结果的预期真阳性率(π1)最低,在所有49个组织中π1中位数为0.004;其次是顺式不同结果,π1中位数为0.099;顺式相同结果的π1中位数为0.278(图4)。研究团队在TOPMed队列中对上述结果进行了重复性测试,结果显示,跨组织反式作用关系的中位π1为0.390,顺式不同关系组为0.783,顺式相同关系组为0.888

图片

图4. 跨组织转录物蛋白对的预期真阳性率(π1)。

2. 富含转录因子靶基序和GWAS目录表型的多向调控区

研究团队检测了在TOPMed MESA中重现的蛋白质靶点(顺式作用基因靶点和反式作用基因靶点),以寻找转录因子(TFs)靶向基序的富集情况。结果显示,顺式靶点未富集TFs靶向的基序;反式靶标富集了TFs NFKB2、RELA、NFAT1C、FOXF2、AR、GATA1和STAT1靶向的基序。研究团队还对顺式和反式作用靶点进行了GWAS目录关联的富集分析,发现反式靶点富集了血液蛋白水平和炎症性肠病,而顺式靶点富集了血液蛋白水平、强直性脊柱炎、炎症性肠病和慢性炎症性疾病

图片

图5. 反式作用基因靶蛋白TF结合位点的富集情况

通过量化与每个转录物显著相关的靶蛋白的数量,研究团队确定了几个可能参与整个基因组中许多不同蛋白质调控的位点,并将其命名为“多效性调控”位点。在INTERVAL中,共发现11个不同的多效性调控位点,其中多数位点在TOPMed MESA队列中复制的靶点不多,但也有少数位点复制性良好。

3. 预测的基因表达与蛋白质水平的相关性更好

研究团队利用TOPMed MESA的RNA测序数据检测了观察到的基因表达与观察到的蛋白质丰度之间的相关性,以及预测基因表达与观察到的蛋白质丰度之间的相关性;并使用GTEx预测模型将观察到的表达结果与顺式相同的TWAS结果进行比较(图6)。结果显示,与观察到的基因表达和观察到的蛋白质水平之间存在显著相关性的基因(FDR<0.05)相比,预测表达和观察到的蛋白质水平之间有显著相关性的基因更多。总体而言,在所有49个预测组织中,407个具有显著的顺式相同相关性的基因;121个基因在3个预测组织(PBMC、单核细胞和T细胞)中具有显著的顺式相同相关性;89个基因的预测和观察到的表达都存在显著顺式相同相关性,其余基因则是独特相关性。此外,在预测的组织中,真阳性顺式相同关联比例平均高于观察到的组织

图片

图6. 使用预测表达与观察表达的顺式关联。

最后,研究团队探究了预测的表达与蛋白质丰度的相关性是否强于观察到的基因表达与蛋白质丰度的相关性(图7)。结果显示,对于显著的顺式相同作用基因,GReX与蛋白质丰度的平均相关性强于观察到的基因表达;与血浆密切相关的预测组织(如全血和肝脏),在基因表达水平和蛋白质水平的中位数相关性方面排名靠前,而大多数脑组织的表达水平和蛋白水平的中位数相关性最低。

图片

图7. 组织预测表达和蛋白质水平的顺式关联。

综上所述,研究团队应用TWAS框架检测了基因调控的基因表达与测得的血浆蛋白水平之间的相关性,以探究反式作用和顺式作用基因之间的基因调控关系。这项研究结果强调了与观察到的表达相比,使用预测表达的优势:与基因表达数据相比,具有全基因组基因型的研究更多,所以计算预测表达比测量观察到的表达更容易。研究团队共发现了2,016个反式作用基因的蛋白质靶点,其中239个验证队列TOPMed MESA中得到重现,表明该研究在识别反式作用效应方面比典型的QTL研究更有效。此外,与反式作用效应相比,顺式作用效应在更多的组织中共享,后者往往更具组织特异性。

文章通讯作者Heather E Wheeler表示:“这些发现指出了使用基因表达的遗传预测,来挖掘复杂性状或条件中涉及的遗传变异潜在功能影响的优势,特别地,与实际的基因表达测量相比,实际的血浆液蛋白质水平似乎与基于遗传学的表达预测更一致。”

参考来源:

1.https://www.cell.com/ajhg/fulltext/S0002-9297(24)00006-5

2.https://www.genomeweb.com/microarrays-multiplexing/genetically-predicted-gene-expression-analysis-provides-look-plasma

版权声明:
本网站所有内容来源注明为“梅斯医学”或“MedSci原创”的文字、图片和音视频资料,版权均属于梅斯医学所有。非经授权,任何媒体、网站或个人不得转载,授权转载时须注明来源为“梅斯医学”。其它来源的文章系转载文章,或“梅斯号”自媒体发布的文章,仅系出于传递更多信息之目的,本站仅负责审核内容合规,其内容不代表本站立场,本站不负责内容的准确性和版权。如果存在侵权、或不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。
在此留言
评论区 (1)
#插入话题
  1. [GetPortalCommentsPageByObjectIdResponse(id=2193239, encodeId=a66a219323920, content=<a href='/topic/show?id=01ab11228943' target=_blank style='color:#2F92EE;'>#血浆蛋白质组#</a> <a href='/topic/show?id=d61b418860a' target=_blank style='color:#2F92EE;'>#基因表达#</a>, beContent=null, objectType=article, channel=null, level=null, likeNumber=23, replyNumber=0, topicName=null, topicId=null, topicList=[TopicDto(id=41886, encryptionId=d61b418860a, topicName=基因表达), TopicDto(id=112289, encryptionId=01ab11228943, topicName=血浆蛋白质组)], attachment=null, authenticateStatus=null, createdAvatar=null, createdBy=cade5395722, createdName=梅斯管理员, createdTime=Thu Mar 14 17:43:49 CST 2024, time=2024-03-14, status=1, ipAttribution=上海)]