2006年2月16日的一则新闻:
据路透社最新报道:国际奥委会委员、世界反兴奋剂机构(WADA)主席庞德当地时间2月16日公开表示,在都灵冬奥会开幕之前被确定血红蛋白超标的12名滑雪运动员一定是服用了兴奋剂。
据路透社援引庞德的话说:“坦率地说,我们认为我们是在处理兴奋剂事件,因为在冬季奥运会之前,很凑巧地有12人血红蛋白超标。”
从上面这一则新闻中,我们可以读出两点:
(1)庞德认为:“在都灵冬奥会开幕之前被确定血红蛋白超标的12名滑雪运动员一定是服用了兴奋剂”。
庞德的语气非常肯定。那么所基于的理由是什么呢?这就是我们读出的第二点。
(2)因为在冬季奥运会之前,很“凑巧”地有12人血红蛋白超标。”
庞德潜台词是,如果他们没有服用兴奋剂,那么这事情实在是太“凑巧”了,于是便得出了如上的结论。
但是我们仔细地分析就会发现,庞德的结论下得有点武断,在逻辑上存在着漏洞。我们会问这样一个问题:为什么就不能这么凑巧呢?或者:难道很凑巧的事情就不会发生吗?
这就涉及到统计推断的另一种形式:显著性检验。
庞德的推理过程实际上是以如下的方式进行的。
首先假设这12名运动员没有服用兴奋剂,然后在这个前提下计算这12名运动员血红蛋白全部超标的可能性有多大。据另一篇相关报道中说,庞德计算出来的这个概率为万分之三。
我们知道,万分之三是一个极小的概率,于是根据实际推断原理,小概率事件在一次试验中是不会发生的,而现在居然发生了,那只能说明推出这个小概率的原假设,即这12名运动员均没有服用兴奋剂的假设是错误的。
由于统计推断不是逻辑推断,因此庞德结论必然包含着一定的犯错误的概率。于是,接下来的问题是,庞德的结论犯错误的概率有多大?根据我们上面的分析可以很容易的算出这个概率,它就是万分之三。
于是问题又变成了,以万分之三的概率犯错误而做出的判断究竟算不算是一个很有把握的判断,毕竟是否服用兴奋剂对于一个运动员来说是非常重要的一件事情,搞不好就会断送他们的运动生涯,所以必须慎之又慎。
显然庞德认为,万分之三的概率已经是一个很小的概率了,因此便“信心十足”地做出了这批运动服用了兴奋的判断。
但是奥委会还是决定作进一步的调查。
实际上,奥委会最后必须在如下的两个假设选择一个。
原假设H0:这12名运动员没有服用兴奋剂;
备择假设H1:这12名运动员服用了兴奋剂.
不管最后会做出什么样的选择,都难免会犯如下的两类错误的一类。
第一类错误(弃真):原假设为真,但拒绝了原假设;
第二类错误(取伪):原假设为假,但接受了原假设。
很自然的,我们都希望犯这两类错误的概率都很小。可是不幸的是,如果样本的容量给定(即给定试验的结果),要想同时缩小犯这两个错误的概率是不可能的,当其中一个减小时,另一个就会增大。
于是便又存在着取舍的问题,那就是在样本信息给定的情况下,首先应该控制犯那一类犯错误的概率。
奈曼和皮尔逊(Neyman-Pearson)提出了一个原则,即在控制第一类错误的概率的条件下,使犯第二类错误的概率尽量的小.根据该原则,首先需要控制的错误是第一类错误.
Neyman-Pearson原则的出发点:我们提出原假设时是经过细致调查和考虑的,它必须是一个要加以保护的假设,因此当我们要拒绝它时必须非常慎重,一般情况下不宜轻易拒绝.
这种假设检验问题称为显著性检验问题.称犯第一类错误的概率为显著性水平.
显然,由于事关重大,我们是不能轻易地做出这12名运动员服用兴奋剂的决定的。但是由于“12名运动的血红蛋白均超标”这一事件与正常结果之间的偏离程度非常“显著”(因为在正常的情况下这一事件发生的概率只有万分之三),因此,庞德最后做出结论:他们服用了兴奋剂!
显著,英文的原文是(significant),即有价值的、有意义的。
有些差异是有意义的,但是有些差异是没有意义的。比如说,某教务处长声称全校高等数学的平均成绩达到了80分。为了验证这个结论,决定抽查一部分学生的成绩进行统计,结果算得平均分数为78分。很显然这个差异是不显著的,因此不能由此就说教务处长在吹牛。但是如果算得的平均分数是60分,那么我们就会认为这个差异有意义的,因而也是显著的,因此便得出结论,教务处长在撒谎!
显著性检验只关心要不要拒绝原假设,如果不能信心十足的拒绝,便只好接受了。至于接受原假设时犯第二类错误的概率的控制问题,则是在我们控制显著性水平时所必须忽略的问题,这是一个不得不付出的代价 .
综上所述,显著性检验中蕴含了如下两个思想。
一、反证法思想。
假设原假设为真,则“12名运动血红蛋白均超标”是一个“有违常规”的事件,应该是不会发生的,而现在居然发生了,因此他们一定服用了兴奋剂。
二、小概率原理
上面所提到的“有违常规”的现象,并不是形式逻辑上的绝对不可能现象,而是基于小概率原理或统计推断原理基础上的不可能.小概率原理认为:概率很小的事件在一次试验中实际上是不会发生的.
注意,这里的“不会”不是逻辑意义上的不会,而是统计意义上的不会,并且事实上我们每一个人都是这个命题的忠实实践者.
一个人在一生的很多场合都有可能会出现不幸的意外.比如,过马路可能会被车撞,在露天有可能被雷打,在家里可能会遇到地震,乘飞机有可能会出现空难。但是我们依然会出现在这些场合,因为这时我们会想:哪有这么凑巧的,这么倒霉的事情怎么会给我碰到呢?
有些事情可以用凑巧来解释,比如随机抛两次硬币均出现正面。但有些事情则不能用凑巧来解释,比如抛10次硬币均出现正面,因为这是在“太”凑巧了,我们宁愿相信抛硬币的人有技巧或者硬币有问题。
“12名运动员血红蛋白均超标”这一事件在原假设为真的情况下实在是太“凑巧”了,以至于我们有充足的把握拒绝原假设。
就像“看起来最像”是理解最大似然法的关键词一样, “凑巧”是理解显著性检验思想的关键词。
来自:http://blog.sina.com.cn/s/blog_4a16ddee01009l0z.html
|