统计211

标题: 关于一份资料的检验方法讨论,看法 [打印本页]

作者: wwy    时间: 2010-9-14 23:03
标题: 关于一份资料的检验方法讨论,看法
资料:两组计量资料,样本含量为第一组280,第二组236;采用独立样本T检验方法;方差不齐
(P=0.031);T'=2.137,P=0.033。
一般情况下,我就直接这样做了,也会相信软件给出的结果,但是仔细看,两组均值相差不大--0.0034,方差也很小,按实际情况,应该是无统计学意义的啊,为何会这样?

仔细分析如下:
第一组:N=280,均数=0.7977;S=0.01709,SD=0.00111;SKEWNESS=0.14;KURTOSIS=0.546;
Kolmogorov-Smirnov(a上标)检验--[Analysis - Descriptive Statistics --Explore],统计量
=0.043,P=0.200;
下面是Analysis -Nonparametric tests -- One sample K-S test结果:
Kolmogorov-Smirnov Z =0.717;P=0.683

第二组:N=236,均数=0.7943;S=0.01932,SD=0.00115;SKEWNESS=-0.472;KURTOSIS=2.000;
Kolmogorov-Smirnov(a上标)检验--[Analysis - Descriptive Statistics --Explore],统计量
=0.075,P=0.003。
下面是Analysis -Nonparametric tests -- One sample K-S test结果:
Kolmogorov-Smirnov Z =4.116;P=0.000

不管K-S检验的哪个结果,都显示,第一组正态性,第二组非正态,所以其实是不满足T检验的前提的,T'检验也不满足(它是满足正态的前提下,对方差不齐纠正的一种方法)。

那么结果就应该是用错了方法,不应该采用T’检验,而是秩和检验,
采用秩和检验,结果如下:Z=-1.576,P=0.115。也就是两组无统计学意义。

问题在我看来似乎是明了了,不知道坛里各位坛友有何高见,可以一起讨论下。
另外,在我的印象里,200多个样本,已经很大了,如果不是实际情况比较明显不符(或者说,想得到无意义结果)的情况下,我可能都不考虑方法是否用错了--大于50就会考虑近似正态,然后就直接用T检验了。

大家是否要对  样本含量和正态分布  等相关方面的看法要改观了呢??一起讨论下哈。

作者: linxiuquan001    时间: 2010-9-15 21:50
从方法的适用性来说,偏态分布的情况一定要用非参数检验,只有正态分布(或近似正态分布)才用参数检验。对于两个偏态分布总体中得到的两个大样本,检验时用非参数检验是最合适的,一般不用参数检验,因为变量如果是偏态分布,总体均数不能描述变量在总体中的取值特征,因此比较样本均数的差别是没有意义的,除非是偏性不是很强的总体。
——一位统计老师的解答,一起分享。
作者: linxiuquan001    时间: 2010-9-15 21:53
所以如果总体是偏型很强的偏态分布资料,即使样本量大于50,也不能用参数检验。
作者: wwy    时间: 2010-9-18 09:31
所以如果总体是偏型很强的偏态分布资料,即使样本量大于50,也不能用参数检验。
linxiuquan001 发表于 2010-9-15 21:53



呵呵,非常感谢回答。说的很对,我现在也开始接受这个观点了--
但是疑惑的是,为啥上课时,老师说的正态性与样本有关,书上还有讲,样本含量,大于50,或者60,就默认为正态分布。--所以我上课的时候,也是这样给学生讲的,现在才明白,自己需要更多的学习。

作者: wwy    时间: 2010-9-18 09:33
这个问题,我有邀请SEIGEI来探讨,不过,他没有留言,而是与我私下交流。
他的看法是:一份资料,他会把两种方法做一遍,(比较保险),结果不一样的处理办法是--阳性看非参数,阴性看参数检验。
我还没有完全理解透的他的话,有待于慢慢理解和应用吧。
与大家一起学习。
作者: wwy    时间: 2010-9-18 09:33
这个问题,我有邀请SEIGEI来探讨,不过,他没有留言,而是与我私下交流。
他的看法是:一份资料,他会把两种方法做一遍,(比较保险),结果不一样的处理办法是--阳性看非参数,阴性看参数检验。
我还没有完全理解透的他的话,有待于慢慢理解和应用吧。
与大家一起学习。
作者: wwy    时间: 2010-9-30 15:42
新看法:
刚教研室老师在,我就请教了L老师,总结下:
1、其实“样本含量超过60,可以看做正态分布”的说法 还是认同的。
2、如果一种数据结果显示统计学上有意义,也只能下结论为统计学意义,而实际上是否有意义,得结合专业意义;所以你可以在分析的时候,说明他们均值相差甚小,实际意义不大,即统计学意义与实际意义相结合考虑;
3、上述处理方法,在原理上,我采用非参数检验,是可以的,但是检验功效会低于参数检验,所以根据根据L老师的看法,应该仍然采用T检验,但是检验水准,可以定义为0.01,即我在设计该实验的时候,就考虑到样本含量大,”希望两者无意义的”目的下,把检验水准定低些,即第一类错误的概率要小些。这样也是一个处理办法。

最后,我的感觉啊,统计方法很多变动,似乎有时是自己诱导的感觉,自己想要的结果,然后在考虑处理方法,最终得出自己想的结果,,,感觉很汗~!!!
At last, my feelings are as follows:
statistical methods are still a lot of changes, and it is depended on statisticians’further discussions. Sometimes, it seems that the author can do something to achieve his goal that he likes or wants. Something likes choice of methods.
I don’t know it is right or wrong ,but when I thought this ,I feel cold.





欢迎光临 统计211 (http://tj211.com/) Powered by Discuz! X3.2