高通量基因表达数据的预处理策略

2013-11-18 MedSci MedSci原创

一次微阵列实验能获得细胞在某一条件下的全基因组表达数据,包含成千上万个基因在细胞中的相对或绝对丰度,不同条件(细胞周期的不同阶段、药物作用时间、肿瘤类型、不同病人等)下的全基因组表达数据就构成了一个G×N的数据矩阵M,通常情况下G>>N,其中每一个元素 表示第 i 个基因在第 j 个条件下的表达水平值(在多数应用情况下,是 Ratio 值或 log(Ratio) ),行向量

一次微阵列实验能获得细胞在某一条件下的全基因组表达数据,包含成千上万个基因在细胞中的相对或绝对丰度,不同条件(细胞周期的不同阶段、药物作用时间、肿瘤类型、不同病人等)下的全基因组表达数据就构成了一个G×N的数据矩阵M,通常情况下G>>N,其中每一个元素 表示第 i 个基因在第 j 个条件下的表达水平值(在多数应用情况下,是 Ratio 值或 log(Ratio) ),行向量 代表基因 i 在 N 个条件下的表达水平,称为基因 i 的表达谱,列向量 代表某一条件下的各基因的表达水平。  (8-1) 对基因表达 数据进行聚类、分类等数据分析之前,往往需要进行预处理,包括对丢失数据进行填补、清除不完整的数据或合并重复数据等数据清洗,根据分析的目的进行数据过滤,以及针对分析方法选择合适的数据转换方法等。 数据清洗是数据分析前必须进行的一项工作,对于基因表达数据,目的是去除表达水平是负值或很小的数据、或者明显的噪声数据 ( 单个异常大或小的峰谷信号 ) ,同时处理缺失数据。 DNA 微阵列实验得到的数据一般是经过归一化处理的,每个点的信号强度是前景信号减去背景信号

版权声明:
本网站所有内容来源注明为“梅斯医学”或“MedSci原创”的文字、图片和音视频资料,版权均属于梅斯医学所有。非经授权,任何媒体、网站或个人不得转载,授权转载时须注明来源为“梅斯医学”。其它来源的文章系转载文章,或“梅斯号”自媒体发布的文章,仅系出于传递更多信息之目的,本站仅负责审核内容合规,其内容不代表本站立场,本站不负责内容的准确性和版权。如果存在侵权、或不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。
在此留言
评论区 (3)
#插入话题
  1. [GetPortalCommentsPageByObjectIdResponse(id=2009586, encodeId=249c2009586c4, content=<a href='/topic/show?id=434e42463ec' target=_blank style='color:#2F92EE;'>#处理策略#</a>, beContent=null, objectType=article, channel=null, level=null, likeNumber=36, replyNumber=0, topicName=null, topicId=null, topicList=[TopicDto(id=42463, encryptionId=434e42463ec, topicName=处理策略)], attachment=null, authenticateStatus=null, createdAvatar=, createdBy=373a131, createdName=jxrzshh, createdTime=Sun Dec 08 02:09:00 CST 2013, time=2013-12-08, status=1, ipAttribution=), GetPortalCommentsPageByObjectIdResponse(id=1969409, encodeId=4967196940955, content=<a href='/topic/show?id=6532102e6059' target=_blank style='color:#2F92EE;'>#高通量#</a>, beContent=null, objectType=article, channel=null, level=null, likeNumber=0, replyNumber=0, topicName=null, topicId=null, topicList=[TopicDto(id=102760, encryptionId=6532102e6059, topicName=高通量)], attachment=null, authenticateStatus=null, createdAvatar=, createdBy=ad7f282, createdName=yang0210, createdTime=Mon Feb 03 04:09:00 CST 2014, time=2014-02-03, status=1, ipAttribution=), GetPortalCommentsPageByObjectIdResponse(id=1347995, encodeId=b861134e995cb, content=<a href='/topic/show?id=d61b418860a' target=_blank style='color:#2F92EE;'>#基因表达#</a>, beContent=null, objectType=article, channel=null, level=null, likeNumber=29, replyNumber=0, topicName=null, topicId=null, topicList=[TopicDto(id=41886, encryptionId=d61b418860a, topicName=基因表达)], attachment=null, authenticateStatus=null, createdAvatar=, createdBy=395f25, createdName=bioon1, createdTime=Wed Nov 20 01:09:00 CST 2013, time=2013-11-20, status=1, ipAttribution=)]
  2. [GetPortalCommentsPageByObjectIdResponse(id=2009586, encodeId=249c2009586c4, content=<a href='/topic/show?id=434e42463ec' target=_blank style='color:#2F92EE;'>#处理策略#</a>, beContent=null, objectType=article, channel=null, level=null, likeNumber=36, replyNumber=0, topicName=null, topicId=null, topicList=[TopicDto(id=42463, encryptionId=434e42463ec, topicName=处理策略)], attachment=null, authenticateStatus=null, createdAvatar=, createdBy=373a131, createdName=jxrzshh, createdTime=Sun Dec 08 02:09:00 CST 2013, time=2013-12-08, status=1, ipAttribution=), GetPortalCommentsPageByObjectIdResponse(id=1969409, encodeId=4967196940955, content=<a href='/topic/show?id=6532102e6059' target=_blank style='color:#2F92EE;'>#高通量#</a>, beContent=null, objectType=article, channel=null, level=null, likeNumber=0, replyNumber=0, topicName=null, topicId=null, topicList=[TopicDto(id=102760, encryptionId=6532102e6059, topicName=高通量)], attachment=null, authenticateStatus=null, createdAvatar=, createdBy=ad7f282, createdName=yang0210, createdTime=Mon Feb 03 04:09:00 CST 2014, time=2014-02-03, status=1, ipAttribution=), GetPortalCommentsPageByObjectIdResponse(id=1347995, encodeId=b861134e995cb, content=<a href='/topic/show?id=d61b418860a' target=_blank style='color:#2F92EE;'>#基因表达#</a>, beContent=null, objectType=article, channel=null, level=null, likeNumber=29, replyNumber=0, topicName=null, topicId=null, topicList=[TopicDto(id=41886, encryptionId=d61b418860a, topicName=基因表达)], attachment=null, authenticateStatus=null, createdAvatar=, createdBy=395f25, createdName=bioon1, createdTime=Wed Nov 20 01:09:00 CST 2013, time=2013-11-20, status=1, ipAttribution=)]
    2014-02-03 yang0210
  3. [GetPortalCommentsPageByObjectIdResponse(id=2009586, encodeId=249c2009586c4, content=<a href='/topic/show?id=434e42463ec' target=_blank style='color:#2F92EE;'>#处理策略#</a>, beContent=null, objectType=article, channel=null, level=null, likeNumber=36, replyNumber=0, topicName=null, topicId=null, topicList=[TopicDto(id=42463, encryptionId=434e42463ec, topicName=处理策略)], attachment=null, authenticateStatus=null, createdAvatar=, createdBy=373a131, createdName=jxrzshh, createdTime=Sun Dec 08 02:09:00 CST 2013, time=2013-12-08, status=1, ipAttribution=), GetPortalCommentsPageByObjectIdResponse(id=1969409, encodeId=4967196940955, content=<a href='/topic/show?id=6532102e6059' target=_blank style='color:#2F92EE;'>#高通量#</a>, beContent=null, objectType=article, channel=null, level=null, likeNumber=0, replyNumber=0, topicName=null, topicId=null, topicList=[TopicDto(id=102760, encryptionId=6532102e6059, topicName=高通量)], attachment=null, authenticateStatus=null, createdAvatar=, createdBy=ad7f282, createdName=yang0210, createdTime=Mon Feb 03 04:09:00 CST 2014, time=2014-02-03, status=1, ipAttribution=), GetPortalCommentsPageByObjectIdResponse(id=1347995, encodeId=b861134e995cb, content=<a href='/topic/show?id=d61b418860a' target=_blank style='color:#2F92EE;'>#基因表达#</a>, beContent=null, objectType=article, channel=null, level=null, likeNumber=29, replyNumber=0, topicName=null, topicId=null, topicList=[TopicDto(id=41886, encryptionId=d61b418860a, topicName=基因表达)], attachment=null, authenticateStatus=null, createdAvatar=, createdBy=395f25, createdName=bioon1, createdTime=Wed Nov 20 01:09:00 CST 2013, time=2013-11-20, status=1, ipAttribution=)]

相关资讯

Cell:扼住肿瘤生长的咽喉--CDK8可能成为肿瘤治疗靶点

当肿瘤生长之时,在它们的中央处会出现供氧短缺的情况。因此肿瘤必须触动特异的遗传开关,才能在这样的环境下生存。 当前一系列的经费资助性研究都只是停留在基础科学层面上,而一篇刊登在《细胞》(Cell)杂志上的论文则指向了临床应用。来自霍华德·休斯医学研究所的科学家意外发现了对低氧环境中的肿瘤生存至关重要的、一个可用药物控制的靶点。研究人员表示,以一个基础生物学问题为起始的研究现在被证实与患者相关的角

PNAS:积极心理状态对于人类基因表达的影响

好的心态会对你的基因产生影响。在首个该类研究中,来自加州大学洛杉矶分校和北卡罗来纳大学的研究人员调查了积极心理状态对于人类基因表达的影响。他们发现,不同类型的快乐对人类基因组的影响有着很大的差异。研究报告在线发表在PNAS杂志上。 那些有着高水平实现幸福感(eudaimonic well-being,由深切地感受生活的目标和意义而获得的一种快乐)的人们,他们的免疫细胞中显示非常有利的基因表达

PNAS:抑郁症破坏基因表达的日常模式

日前,一项研究发现,健康的人类大脑存在着基因表达的日常周期,而在临床上有抑郁症的个人的这些模式被破坏了。广泛的推定人为人类大脑中存在着基因表达的日常周期,但是却很难证明,因为捐献给研究的每一个尸检样本都代表了一天24小时中的单个时间点。研究人员通过把大脑基因表达的测量数据与死者死亡时间关联起来从而克服了这个问题。研究人员对来自55名个体大脑的6个区域中的1.2万个基因进行了日表达节律的筛选,这55

PNAS:血液基因表达分析可区别病毒和细菌导致的发烧

在无其他疾病的症状下,如何判断孩子发烧是由病毒还是细菌引发的?发热是病毒和细菌感染的一个常见症状,但是发热源常常在临床检查中不那么显而易见。现在,华盛顿大学医学院的科学家们发现,血液中的基因表达特征可以帮助区别幼儿的发热是由病毒还是由细菌造成的。【原文下载】在这项研究中,科学家们研究了发热儿童的血液是否表现出了病毒和细菌的特定基因表达特征,这些特征可能在区别这两种发热源方面有用。研究人员分析了来自