比较两个样本

接下来,我们有两个分布,其可以判定为相同或者来自不同的分布,以及我们希望测试是否这些
样本有相同的统计特征。

均值

以相同的均值产生的样本进行检验:

  1. >>> rvs1 = stats.norm.rvs(loc=5, scale=10, size=500)
  2. >>> rvs2 = stats.norm.rvs(loc=5, scale=10, size=500)
  3. >>> stats.ttest_ind(rvs1, rvs2)
  4. (-0.54890361750888583, 0.5831943748663857)

以不同的均值产生的样本进行检验:

  1. >>> rvs3 = stats.norm.rvs(loc=8, scale=10, size=500)
  2. >>> stats.ttest_ind(rvs1, rvs3)
  3. (-4.5334142901750321, 6.507128186505895e-006)

对于两个不同的样本进行的KS检验

在这个例子中我们使用两个同分布的样本进行检验.设因为P值很高,毫不奇怪我们不能拒绝原假设。

  1. >>> stats.ks_2samp(rvs1, rvs2)
  2. (0.025999999999999995, 0.99541195173064878)

在第二个例子中,由于均值不同,所以我们可以拒绝空假设,由P值小于1%。

  1. >>> stats.ks_2samp(rvs1, rvs3)
  2. (0.11399999999999999, 0.0027132103661283141)