Service Center

定量PCR
Western Blot
凝胶电泳迁移率EMSA
基因芯片
高通量测序
 
 
  Solutions For Your Research   
  English
 
相关连接
EBI
NCBI
UCSC
IHWG
GENMAPP
Nature China
北大生物信息中心
中华人民共和国科学技术部
艾普进(北京)生物技术有限公司
 
 
 
 
 
首页新闻资讯技术服务产品中心解决方案资料下载关于我们联系方式
表达谱芯片数据分析
数据分析类别

一、数据均一化
       对基因芯片数据的标准化处理, 主要目的是消除由于实验技术所导致的表达量(Intensity)的变化,并且使各个样本(sample)和平行实验的数据处于相同的水平,从而使我们可以得到具有生物学意义的基因表达量的变化。对于表达谱芯片,一般采用的标准化方法有分位数标准化(Quantile Normalization)。

二、差异筛选统计分析
1. 单因素两组数据统计分析
       对于同一影响因素下的2组数据,每组数据3个以上生物学重复的实验设计,采取T-Test方法进行单因素统计分析。例如试验组3个样本,对照组3个样本,比较两组间的差异基因。
2. 单因素多组数据统计分析
      对于同一影响因素下的多组数据,每组数据3个以上生物学重复的实验设计,采用one-way ANOVA方法进行单因素多组数据统计分析。例如不同药处理后看不同药与对照组,不同药之间的差异; A药3个样本,B药3个样本,对照组3个样本。
3. 多因素数据统计分析
      对于多个影响因素下的2组数据,每组数据3个以上生物学重复的实验设计,采用two-way ANOVA方法进行多因素数据统计分析。例如不同的组织来源样本组,而且这些样本还有不同的处理时间点,比较两组间不同影响因素单独作用或协同作用下的差异基因。

三、聚类分析
1. 非监督层次聚类分析(Hierarchical Clustering)
       计算多个样品两两之间的距离,构成距离矩阵,合并距离最近的两类为一新类,计算新类与当前各类的距离,再合并、计算,直至只有一类为止,用挑选的差异基因的表达情况来计算样品直接的相关性,以热图(heatmap)形式显示。一般来说,同一类样品能通过聚类出现在同一个簇中,聚在同一个簇中的基因可能具有相似的生物学功能。
2. 自组织映射聚类分析(SOM)
       自组织映射聚类是以神经网络算法为基础的一种分割性聚类方法。SOM 按照每一基因表达向量与各类中参照向量的相似性,将基因分类,因此它与均值聚类的不同之处就是需要定义参照向量。在确定类的几何形状时,研究者就在有效地确定分类的数目。SOM将高维的表达数据呈现在低维的空间中,结果便于解释。相邻节点的参照向量接近,结果图中保存了邻簇关系,更便于对结果进行调整。

四、主成分分析(PCA)
       PCA(Principal Component Analysis)的原理是找到数据方差的两个或者三个主成分(向量),将数据投影在这些主成分上,以达到降维的目的,通过图像上的点之间的相互距离来显示样本之间的相似度。通过PCA分析,可以观察样本的分布情况,验证试验设计的合理性,考察生物学重复样本的均一性。各组样本分布在二维空间的不同区域,同组的样品在空间分布比较集中,说明这些基因选取具有代表性。

五、样本相关性分析
       对于设有生物学重复实验的样品组数据,可以通过计算不同样本之间的皮尔逊相关系数,检测各个样品间的相关性,进而验证生物学重复之间的均一性,以相关图(Correlation Plot)展示。

 六、功能分析
1. GO富集分析(GO Analysis)
       Gene Ontology(GO)是基因功能国际标准分类体系,可分为分子功能(Molecular Function)、生物学过程(Biologycal Process)、细胞组成(Cellular Component)三个部分。GO富集分析是对差异基因等按GO分类,并对分类结果进行基于离散分布的显著性分析、错判率分析、富集度分析,得到与实验目的有显著联系的、低错判率的、靶向性的基因功能分类,该分类即导致样本性状差异的最重要的功能差别。在芯片的数据分析中,研究者可以找出哪些变化基因属于一个共同的GO功能分支,并用统计学方法检定结果是否具有统计学意义,从而得出变化基因主要参与了哪些生物功能。
2. Pathway富集分析(Pathway Analysis)
       目前,KEGG是有关Pathway的主要公共数据库。根据挑选出的差异基因,计算这些差异基因同Pathway 的超几何分布关系,Pathway 分析会对每个有差异基因存在的pathway 返回一个p-value,小的p 值表示差异基因在该pathway 中出现了富集。Pathway 分析对实验结果有提示的作用,通过差异基因的Pathway 分析,可以得到与主流表达趋势相关的所有基因参与的显著、靶向的Pathway,寻找不同样品的差异基因可能和哪些细胞通路的改变有关。

七、基因表达趋势分析(STC)
       对于按照处理时间、浓度、疾病恶化程度顺序设计的序列实验,为了筛选出随样本顺序变化影响最显著、最主流的基因群,需要对样本的差异基因进行基因表达趋势分析。应用模糊聚类等机器学习方法,计算出随着时间、浓度梯度或恶性程度等变化过程中基因的表达趋势,得到相应的主流表达趋势,其所属基因的表达变化是与时间、浓度或恶性程度具有显著性联系的基因,主流表达趋势所属基因将作为进一步研究的目标基因。

 

公司首页 | 关于我们 | 联系我们 | 信息反馈 | 帮助

 版权所有© 2005-  基莱生物科技  京ICP备05061876号