admin 管理员组文章数量: 1184232
1. 回顾超几何分布的定义
一般地,假设共有N件产品,其中M件次品,现在从中抽取n件做检查,抽到k件次品的概率分布服从超几何分布。
数学表达式如下:
2. 超几何分布的一个应用:求解overlap显著性
- 以一个实际的生物实验为例。
在上述实验中,我们假设总共的基因个数为20000个(假定为产品的总数),图中左边圈的总数为2005(1740+265)个(假定为次品的总个数),现从中抽取805(540+265)个,需要计算得到基因的个数(次品数量)大于等于265的概率。
思考过程:在次品个数是少数的情况下,overlap越高,从超几何分布来看,发生的概率越小。现在的overlap是265,可能会是过高的那种情况,那么现在计算overlap是265以及大于265的概率之和,如果这个概率很小,那就说明发生265这个事件不是随机的,进而就推出来了overlap为265是显著性高的一个事件。
# 用R语言计算为:
phyper(265-1
版权声明:本文标题:overlap的显著性检验-超几何检验Fisher`s 检验 内容由网友自发贡献,该文观点仅代表作者本人, 转载请联系作者并注明出处:http://www.roclinux.cn/b/1754940090a3052409.html, 本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。
发表评论