超几何分布和二项分布都是概率分布,用来描述一系列独立事件中成功的次数。但它们在应用场景和计算方式上有着显著区别。
1. 应用场景
二项分布:适用于从一个无限大的总体中进行有放回抽样。这意味着每次抽取后,样本会被放回总体,因此每次抽取的概率都是独立的。例如,连续抛硬币十次,每次抛硬币的概率都是独立的。
超几何分布:适用于从一个有限的总体中进行无放回抽样。这意味着每次抽取后,样本不会被放回总体,因此每次抽取的概率会受到之前抽取结果的影响。例如,从一个包含10个红球和5个白球的盒子中,无放回抽取3个球,每个球被抽取的概率会随着每次抽取而变化。
2. 计算方式
二项分布:使用二项式定理进行计算。公式为:P(X = k) = (nCk) p^k (1-p)^(n-k),其中n为试验次数,k为成功的次数,p为单次试验成功的概率。
超几何分布:使用组合的方式进行计算。公式为:P(X = k) = (KCK) (N-K)C(n-k) / NCn,其中N为总体的个数,K为总体中成功的个数,n为样本的大小,k为样本中成功的个数。
3. 主要区别
总体大小: 二项分布假设总体是无限大的,而超几何分布假设总体是有限的。
抽样方式: 二项分布使用有放回抽样,而超几何分布使用无放回抽样。
概率变化: 二项分布中,每次试验的概率都是独立的,而超几何分布中,每次抽取的概率会受到之前抽取结果的影响。
二项分布、(超)几何分布异同
他们全部是描述概率分布。
二项分布:重复n次独立的伯努利试验,发生k次事件的概率
几何分布:重复伯努利试验中,直达k次才第一次成功的概率
超几何分布:N中有M个特定种类,抽取n个时,会有k个特定种类的概率。
抽取n个,有k个特定种类的组合一共有:C(M,k)*C(N-M,n-k)
抽取n个,所有的组合数:C(N,n)
超几何分布 P(x=k)=C(M,k)*C(N-M,n-k)/C(N,n)
超几何分布跟二项分布的区别:抽取n个的过程中,抽得特定种类的概率会变化(因为不归还),但抽完后每个组合的发生概率是一样的。而二项分布重复n次实验,每次概率不变。