《女士品茶》第57章


品植既ッ枋鱿质怠?989年他写了《归纳和概率的哲学导论》(An Introduction to the Philosophy of Induction and Probability)一书,书中他提出了一个关于彩票的悖论,他认为那是康涅狄格州卫斯理大学(Wesleyan University in Middletown Connecticut)的西摩?屈贝里(Seymour Kyberg)教授发明的。
假定我们接受假设或者显著性检验的观点,我们赞同如果现实中该假设的相应概率非常小,就可以拒绝这个假设。为了更进一步说明,假设0。0001就是一个非常小的概率,让我们组织一次公正的10000张彩票的抽彩活动。按这个假设,1号彩票中奖的概率,我们也可以拒绝这种假设,依次类推,我们可以拒绝类似的任何针对某号彩票的假设。按照这一逻辑规则,如果A不为真,B和C都不为真,那么A、B、C的集合也不为真。也就是说,按照这一逻辑规则,如果每一张彩票都中不了奖,那么就没有彩票可中奖(而事实却是总会有中奖的彩票)。
在科恩较早写的《可能与可证》(the Probable and the Probable)一书中,基于普遍的法律实践,他提出了这种悖论的一个变形。在习惯法(mon law)中,一个涉及民事诉讼的原告提供了“有利”证据,其陈述看起来是真的,那么他就会胜诉,法庭接受原先诉求的概率高于50%。科恩还提出了一个关于“无票入场者”(gate crashers)的悖论:假设在一个有1000个席位的音乐厅里举办一场摇滚音乐会,主办单位只售出499张票,但是当音乐会开始的时候,1000个席位都坐满了,根据英国的习惯法,主办单位有权在音乐会上向每个现场的人收票钱,因为他们每个人无票入场的概率都是50。1%,这样,虽然音乐厅只有1000个席位,但是主办单位却将会有1499张门票的收入。
这两个悖论都说明了,以概率为依据所得到的决策是不合逻辑的,逻辑和概率是矛盾的。费歇尔在设计良好的实验基础上,利用显著性检验来证明科学研究中的归纳推理是可取的,但是科恩的悖论则表明,这样的归纳推理是不合逻辑的。杰里?科恩菲尔德根据积累的大量证据来判断吸烟会导致肺癌这个说法,但连续的研究表明,除非你假设吸烟是致癌的原因,否则这个结论是极不可能的。相信吸烟致癌是不合逻辑的吗?
以逻辑推理和统计为基础所得出决策上的不一致,是不能靠在科恩提出的悖论中找到错误的假设来解决的。这种不一致的深层次原因存在于逻辑的含义中(科恩认为概率模型可以由一种我们称为“模型逻辑”(model logic)的复杂数学逻辑结构来代替,但是我认为这个方法会产生更多的问题,比它所解决的问题还要多)。在逻辑上,一个命题是对还是错,我们是完全不同的。但是概率引入的观念却是说一些命题“可能”或者“多数”是对的。就是结果的这一点点不确定性,就使我们在分析原因和结果时,难以应用事物实质蕴涵的冷酷的精确性。在临床实验中,处理这类问题的方法,是把每个临床研究看作是对某个治疗方案的效果提供资料。这些资料的价值取决于这个研究的统计分析,但则无也取决于研究的质量。研究质量这一额外的测量决定了哪些研究对结论起决定作用。但是,质量的概念含糊不清而且难以计算,悖论依然存在,而且吞噬着统计方法的核心。这种不一致的毛病是否需要在21世纪发起一场新的革命?
当概率应用于现实生活中时,其含义是什么?
柯尔莫哥洛夫建立了概率的数学定义:概率是一个抽象空间里对一事件集合的一种测量。所有概率的数学特征都可由这个定义导出。当我们希望在现实中使用概率时,我们需要确定眼前特定问题事件的抽象空间。当气象播音员说明天降雨的概率为95%时,什么是所测量的抽象事件的集合?是指明天要外出的所有的人吗?其中有95%的人会淋雨?还是指可能逗留在外面的时间?其中有95%的时间我会淋雨?或是说在一个1平方英寸大的地方,有95%的面积会下雨?当然这些解释都不对,那么到底是什么意思呢?
柯尔莫哥洛夫之前的K?皮尔逊认为概率分布是可以通过收集到的数据观察得出的,我们已经看到了使用这个方法存在的问题。
威廉?S?戈塞特试图为一个设计好的试验描述其事件空间。他说事件空间就是试验得出所有可能结果的集合。这听起来可能是对的,但是在实践中却是无用的。在实验中,我们必须相当精确地描述出结果的概率分布,才能计算出统计分析中需要用到的概率值。“所有可能实验结果的集合”的概念非常含糊,我们怎样才能得到一个精确的概率分布呢?
起初费歇尔同意戈塞特的想法,继而他发展了一个更好的定义。在他的实验设计中,治疗方案是随机分配给各个实验单位的。如果我们想在肥老鼠身上做实验,比较两个治疗动脉硬化的方案,我们就随机地在一些老鼠身上使用A方法,而在其余的老鼠身上使用B方法。实验开始进行,我们开始观察结果。假设两种治疗方案具有同样的效果,因为动物是随机使用治疗方法的,所以另外一些分配治疗的效果应该是同样的。随机治疗方法的标签是不相关的,只要治疗效果是一样的,我们就可以在动物间随意调换。因此,对于费歇尔,事件的空间是所有可能随机分配的治疗方案的集合。这是一个事件的有限集合,所有的事件都是等概率发生的。在所有治疗方法的效果是相等的零假设(null hypothesis)条件下,实验结果的概率分布是可以计算出来的,这就是我们所说的排列检验(permutation test)或随机检验。当费歇尔提出这一检验方法时,还不能计算出所有可能的随机实验分配方式,费歇尔证明了,他的方差分析公式可以求得一个非常理想的排列检验的近似值。
那时还没有高速计算功能的计算机,而现在进行排列检验是可能的,因为电脑可以不知疲倦地进行计算,这样费歇尔的方差分析公式就不再需要了,而且很多数理统计学家经过多年求证得出的非常聪明的定理也不再需要了。只要数据结果是来自于一个随机控制的实验,就可以在计算机上用排列检验来进行所有的显著性检验。
如果对观测数据用一个显著性检验,那就不可能了。这是费歇尔反对吸烟与健康问题研究的主要原因。一些论文的作者使用统计检验方法证明他们的例子。费歇尔认为,除非他们研究的是随机化的实验,否则统计显著性检验就是不合适的。在美国法院中的歧视性案件就常常是根据统计的显著性检验来裁决的。美国最高法院(The U。 S。 Supreme Court)规定,统计显著性检验是一种可以在裁决中使用的方法,可以用来判定是否因为性别或种族歧视的原因而造成了影响。费歇尔如果知道,他一定会强烈反对。在20世纪80年代后期,美国国家科学院(The U。 S。 National Academy of Science)赞助了一项研究,研究在法院中使用统计方法作为裁决依据是否合理。这项研究的主持者是卡内基梅隆大学(Carnegie Mellon University)的斯蒂芬?菲恩伯格(Stephen Fienberg)和明尼苏达大学(the University of Minnesota)的塞缪尔?克里斯洛夫(Samuel Krislov)。这个研究小组在1988年发表了他们的研究报告。研究报告中的许多论文批判了将显著检验用于歧视性案件的作法,所持的论点类似于费歇尔在反对吸烟导致癌症的证据时所使用的理由。如果最高法院想在诉讼中使用显著性检验,它必须确定产生概率的事件空间。
如何找出柯尔莫哥洛夫事件空间?第二种方法来自于样本调查理论。当我们希望通过一个随机样本去判断整个群体的某些事时,我们要精确地确定要研究的人群总体,确立一个选取样本的方法,并且根据该方法进行随机抽样。在实验的结论中存在不确定性,我们可以使用统计方法来量化这一不确定因素。不确定性产生的原因,是因为我们处理的是样本而不是所有人群。我们研究的宇宙现象的真实数值是固定不变的,例如,支持总统施政政策的美国选民的百分数是确定的,只是他们不知道。能够使用统计方法的事件空间,是所有可能的随机样本的集合,同样,这是一个有限集合,它的概率分布是可以计算出来的。概率在现实生活中的含义清楚地建立在抽样调查之上。
当统计方法应用于天文学、社会学、流?
小说推荐
返回首页返回目录