跳转到主页内容gydF4y2Ba
访问键gydF4y2Ba NCBI主页gydF4y2Ba MyNCBI主页gydF4y2Ba 主要内容gydF4y2Ba 主导航gydF4y2Ba
比较研究gydF4y2Ba
.gydF4y2Ba 2006年12月19日;7:538。gydF4y2Ba
doi: 10.1186 / 1471-2105-7-538。gydF4y2Ba

基于强度的层次贝叶斯方法改进了微阵列实验中差异表达基因的检测gydF4y2Ba

从属关系gydF4y2Ba
免费PMC文章gydF4y2Ba
比较研究gydF4y2Ba

基于强度的层次贝叶斯方法改进了微阵列实验中差异表达基因的检测gydF4y2Ba

莫林·萨特gydF4y2Baet al。gydF4y2Ba BMC生物信息学gydF4y2Ba.gydF4y2Ba .gydF4y2Ba
免费PMC文章gydF4y2Ba

摘要gydF4y2Ba

背景:gydF4y2Ba如果每个基因都独立考虑,小样本量通常用于微阵列实验,导致方差估计差。然而,在微阵列实验中准确估计基因表达测量的可变性是正确识别差异表达基因的必要条件。最近开发的几种检测基因差异表达的方法利用层次贝叶斯模型从多个基因“汇集”信息。我们开发了一种统计检验程序,通过将充分记录的基因绝对表达水平和基因表达测量的方差之间的关系纳入一般经验贝叶斯框架,进一步改进了目前的方法。gydF4y2Ba

结果:gydF4y2Ba我们提出了一种新的贝叶斯调节t,在两个真实的双通道微阵列实验和两个受控的单通道实验中,我们表明它在模拟中表现良好。在模拟中,新方法在正确估计假阳性的真实比例时获得了更大的能力,在两个公开的“峰值”实验的分析中,新方法比所有测试的替代方法表现得更好。我们还将我们的方法应用于两个实验数据集,并讨论了我们的方法与其他方法相比所揭示的额外生物学见解。实现我们算法的r源代码可以在http://eh3.uc.edu/ibmt免费获得。gydF4y2Ba

结论:gydF4y2Ba我们使用贝叶斯层次正态模型来定义一种新的基于强度的调节t统计量(IBMT)。该方法完全依赖于数据,使用经验贝叶斯理论估计超参数,因此不需要任何自由参数的规范。IBMT在微阵列数据分析中具有平衡两个重要因素的能力:方差相对于同一性的独立程度(即t检验vs.等方差假设),以及方差与信号强度之间的关系。当这种方差-强度关系较弱或不存在时,IBMT减少到前面描述的调节t统计量。此外,我们的方法可以直接应用于任何阵列平台和实验设计。总之,这些特性表明IBMT在几乎任何微阵列实验的分析中都是一个有价值的选择。gydF4y2Ba

数据gydF4y2Ba

图1gydF4y2Ba
图1gydF4y2Ba
基因变异对平均对数强度的依赖性gydF4y2Ba.对数方差对平均圆点强度的依赖形式的典型例子。红线用局部回归确定。数据来自小鼠胚胎成纤维细胞gydF4y2BaAhrgydF4y2Ba -/-gydF4y2Ba数据集。gydF4y2Ba
图2gydF4y2Ba
图2gydF4y2Ba
模拟中使用的值gydF4y2Ba.(A)平均日志表达水平的分布。(B)模拟中使用的基因标准差对表达强度依赖性的三个强度。gydF4y2Ba
图3gydF4y2Ba
图3gydF4y2Ba
IBMT正确地估计了假阳性的比例gydF4y2Ba.除Fox (gydF4y2BatgydF4y2Ba-test, SMT和IBMT)正确控制的真假阳性率。所显示的数据是100次模拟的平均值和方差的中等强度依赖于表达水平gydF4y2Ba(一)gydF4y2Ba dgydF4y2Ba ggydF4y2Ba= 4,gydF4y2BadgydF4y2Ba 0gydF4y2Ba= 1,gydF4y2Ba(B)gydF4y2Ba dgydF4y2Ba ggydF4y2Ba= 4,gydF4y2BadgydF4y2Ba 0gydF4y2Ba= 4,gydF4y2Ba(C)gydF4y2Ba dgydF4y2Ba ggydF4y2Ba= 4,gydF4y2BadgydF4y2Ba 0gydF4y2Ba= 16,和gydF4y2Ba(D)gydF4y2Ba dgydF4y2Ba ggydF4y2Ba= 4,gydF4y2BadgydF4y2Ba 0gydF4y2Ba= 100。gydF4y2Ba
图4gydF4y2Ba
图4gydF4y2Ba
假阳性曲线示例gydF4y2Ba.等级≤的误牵连差异表达基因数量gydF4y2BaxgydF4y2Ba为了简单gydF4y2BatgydF4y2Ba-test, fold change cut-off, SMT, Fox和IBMT方法。图中显示了按基因排序的假阳性积累情况。所显示的数据是100次模拟的平均值gydF4y2Ba(一)gydF4y2Ba方差的高强度依赖于表达水平和100个先验自由度,和gydF4y2Ba(B)gydF4y2Ba中等强度依赖和1个先验自由度。gydF4y2Ba
图5gydF4y2Ba
图5gydF4y2Ba
假阳性曲线下的面积,为所有三个强度的方差依赖性的平均点强度,并为额外的模拟gydF4y2Ba.将区域归一化,使可能的最高(最坏)区域为0.50,最低(最好)区域为0.00。gydF4y2Ba(一)gydF4y2Ba低强度依赖-折叠变化方法表现最差的低先验自由度,而简单gydF4y2BatgydF4y2Ba-test最穷,具有较高的先验自由度。在这种情况下,IBMT的性能只比SMT好一点点。Fox的表现类似于fold changegydF4y2Ba(B)gydF4y2Ba中等强度依赖-类似于上述,但具有IBMT的优势,具有较高的先验自由度gydF4y2Ba(C)gydF4y2Ba高强度依赖性——IBMT比所有其他方法表现更好,特别是对于中等到高的先验自由度。gydF4y2Ba(D)gydF4y2Ba4张幻灯片模拟——类似于(C),但总体性能较差gydF4y2BatgydF4y2Ba-test, IBMT的优势稍好。gydF4y2Ba(E)gydF4y2Ba10张幻灯片模拟——Fox现在的表现明显优于折叠变化,但由于先前自由度较低,两者的表现都很差。IBMT仍然表现最好。gydF4y2Ba
图6gydF4y2Ba
图6gydF4y2Ba
Choe等人的实验结果gydF4y2Ba.gydF4y2Ba(一)gydF4y2BaIBMT的误报率最低。其他的方法,从好到坏依次是Fox, Cyber-T, SMT,gydF4y2BatgydF4y2Ba-test,然后折叠更改。gydF4y2Ba(B)gydF4y2Ba比较每种方法估计假阳性的真实比例的准确性。简单的gydF4y2BatgydF4y2Ba-test在正确估计其假阳性率方面表现最佳,尽管所有方法都低估了假阳性的真实数量,如[25]所述。Fox的方法,特别是Cyber-T的结果是错误阳性的低估。gydF4y2Ba
图7gydF4y2Ba
图7gydF4y2Ba
HG-U133拉丁方峰入实验结果gydF4y2Ba.gydF4y2Ba(一)gydF4y2Ba考虑到方差对信号强度依赖性的方法(IBMT、cybert和Fox)累积的假阳性最少gydF4y2Ba(B)gydF4y2Ba简单的gydF4y2BatgydF4y2Ba-test在估计假阳性的真实比例方面表现最好,其他从最佳到最差的是SMT, IBMT, Cyber-T和Fox。gydF4y2Ba

类似的文章gydF4y2Ba

引用的gydF4y2Ba

参考文献gydF4y2Ba

    1. 崔旭,裴建平,李晓燕。微阵列数据分析:从无序到整合和共识。Nat Rev Genet。2006;7:55-65。doi: 10.1038 / nrg1749。-gydF4y2BaDOIgydF4y2Ba-gydF4y2BaPubMedgydF4y2Ba
    1. Storey JD, Tibshirani R.全基因组研究的统计学意义。中国科学(d辑:自然科学版)2003;doi: 10.1073 / pnas.1530509100。-gydF4y2BaDOIgydF4y2Ba-gydF4y2BaPMCgydF4y2Ba-gydF4y2BaPubMedgydF4y2Ba
    1. Baldi P, Long AD。微阵列表达数据分析的贝叶斯框架:正则化t检验和基因变化的统计推断。生物信息学。2001;17:509 - 519。doi: 10.1093 /生物信息学/ 17.6.509。-gydF4y2BaDOIgydF4y2Ba-gydF4y2BaPubMedgydF4y2Ba
    1. 王晓燕,王晓燕,王晓燕。微阵列实验的经验贝叶斯分析。中华统计杂志2001;96:1151-1160。doi: 10.1198 / 016214501753382129。-gydF4y2BaDOIgydF4y2Ba
    1. Jain N, Thatte J, Braciale T, Ley K, O'Connell M, Lee JK。用少量复制微阵列识别差异表达基因的局部池误差检验。生物信息学。2003;19:1945 - 1951。doi: 10.1093 /生物信息学/ btg264。-gydF4y2BaDOIgydF4y2Ba-gydF4y2BaPubMedgydF4y2Ba

发布类型gydF4y2Ba

网格计算gydF4y2Ba

物质gydF4y2Ba

LinkOut -更多资源gydF4y2Ba