《女士品茶》第54章


供公共住宅。这个建议吓坏了市政官员,以往,在公布安置公共住宅时,他们通常的做法是先到先受理,这是惟一公平的做法,他们不能拒绝那些先提出申请而却是因为计算机的随机抽取而没有选中的人。但是约翰?霍普金斯大学的统计学家指出,不管使用何种方法,那些最先申请的人通常都是最积极并且有野心的人,如果这种说法是对的,那么住在公共住宅里的人本来就比另外一些人干得好,这与提供住宅本身无关。
科克伦的结论是,如果他们不能够采用已经设计好的科学实验,那么通过追踪那些住进公共住宅以及那些没有住进的家庭,他们可以采用观察研究的方法来替代。这些家庭有很多因素不同,如年龄、受教育程度、宗教信仰以及家庭的稳定状况。他对这类观察研究的统计分析提出了许多方法,在各种方法中,他会考虑不同家庭的上述因素对测量结果进行调整,建立一个数学模型,其中包括年龄、是否是单亲家庭、宗教信仰等因素的影响力。一旦代表这些因素的影响力参数估计出来了,剩下的影响就应该是由公共住宅造成的。
如果临床研究声称,治疗效果的差异已经根据病人年龄和性别的差异进行了调整,那就是说研究人员在估计治疗方法的主要效果时,已经应用了科克伦的方法,并且考虑了在治疗中为病人指定方法不平衡性的影响。几乎所有社会学研究都采用了科克伦的方法,但有些研究的作者可能没有认识到他们用的方法来自科克伦,而且认为其中很多特殊技术通常比科克伦的研究还要早。然而,科克伦为这些方法建立了稳定的理论基础,他写的关于观察研究的论文已经影响了医学、社会学、政治科学和天文不,在这些领域里“治疗方法”的随机指派,既不可能,也不道德。
鲁宾模型
在20世纪80年代和90年代,哈佛大学的唐纳德?鲁宾(Donald Rubin)提出了不同的方法,来解决皮托的问题。在鲁宾的模型中,假设每个病人对每个治疗方法都有一个可能的反应,也就是说,如果有两个治疗方法A和B,我们可以只观察采用其中一种治疗方法的病人,这些病人采用的方法是已经确定的。我们可以建立一个数学模型,在这个模型的公式中用一个符号来表示每种病人可能会有的反应。鲁宾界定了这个数学模型的使用条件,而在估计病人转而使用其它治疗方法会有什么样的反应时,这些条件是必需的。
鲁宾模型和科克伦的方法可以应用于现代统计分析中,因为应用计算机可以处理大量的数据。这些方法即使在费歇尔时代有人想到了,也是不可能实现的,因为这个数学模型涉及的数据太多,计算非常复杂,必须要借助于计算机。这个方法经常要求进行迭代计算,计算机要进行上万甚至百万次的计算,最后才会收敛于一个最终的答案。
科克伦和鲁宾的方法是高度依赖特定模型的,也就是说,除非所用的这个复杂的数学模型能非常准确地描述现实,否则就不会得出正确的答案。如果使用他们的方法,就要求分析人员要建立一个能够全面或近似全面描述事实各个方面的数学模型,如果事实与模型不符,那么分析的结论就不成立。像科克伦和鲁宾这些方法的一个伴生部分,已经成为去确定事实与模型怎样的拟合度下,结论是稳健的一种尝试。目前,数学界正在致力于研究:在结论不再成立之前,事实与模型之间可以有多大偏差。科克伦在直到1980年去世以前的日子里,一直在研究这些问题。
统计分析方法可以看作是一个连续过程,一端是高度依赖模型的方法,如科克伦和鲁宾的方法;另外一端则是一些非参数方法,采用最普通的方式检查数据。正如计算机的出现使模型模拟的方法得以实现一样,在使用非参数方法时,也发起了一场计算机革命,这种方法极少或根本不用设计数学结构,数据不必放在一个预想的模型中就可以展现它们的含义。这些方法在使用中都有一些奇怪的名字,像“解靴带”(“bootstrap”,我们称为“自助法”——译者注)。这是下一章要叙述的内容。
第28章 电脑随心所欲
圭多?卡斯泰尔诺沃(Guido Castelnuovo)出生于显赫的意大利犹太家庭,他的家庭背景可以追溯到古罗马最早的凯撒时代。1915年,卡斯泰尔诺沃当时是罗马大学(University of Rome)的数学教授,他正在进行一场孤独的战争,他想在研究生项目中引入一些有关概率和精算数学的课程。当时,安德烈?柯尔莫哥洛夫还没有建立起概率论的基础,数学家认为概率只是一个使用了复杂计算技术的众多方法的集合,是数学中的一个有趣的花絮,经常作为代数课里的一个部分来教授,在纯数学美丽的微光尚待关注的时候,没有人认为值得在研究生项目中开设这种课程。就精算数学而言,这段时间是应用数学最低迷的时期,人的寿命及意外事故发生频率的计算都只是采用简单算术,所以,系里其他的数学教授都认为没有开设这个课程的必要。
卡斯泰尔诺沃不仅在代数几何学这个抽象领域做了许多开创性工作,他对数学应用也有着浓厚的兴趣,他还劝说系里的其他人允许他开设这个课程。作为教学的成果,他在1919年出版了第一本关于概率与统计应用的教科书《概率运算与应用》(Calcolo della probabilità e applicazioni),这本书被意大利其它一些大学用于类似课程的教学中。到了1927年,卡斯泰尔诺沃已经在罗马大学成立了统计与精算科学学院(The School of Statistics and Actuarial Sciences),而且在整个20年代和30年代,意大利学校里致力于精算研究的统计学家越来越多,他们与瑞典该领域的专家进行极其活跃的交流。
1922年,贝尼托?墨索里尼(Benito Mussolini)在意大利实行法西斯主久,利用强权控制人民的言论自由,对大学里的学生和教职工都进行调查,以驱逐所谓的“国家的敌人”。在这次驱逐行动中,因为没有提及种族问题,所以卡斯泰尔诺沃是犹太人这件事没有被考虑进去 。所以最初的7年里他能够继续在法西斯政府的统计下工作。到了1935年,意大利法西斯与德国纳粹的联合导致在意大利实行反犹太的法律,70岁的卡斯泰尔诺沃失去了工作。
但是,这些并没有使这位不知疲倦的人停止工作,直到1952年去世。随着纳粹种族政策的实施,许多有前途的犹太研究生也被逐出大学。卡斯泰尔诺沃就在他和其他犹太教授的家里设立了特殊的课堂,坚持授课,以帮助这些犹太研究生继续他们的学业。卡斯泰尔诺沃除了写一些关于数学历史的书外,还在他87岁时的最后日子里,研究决定论和机遇之间的哲学关系,并试图去说明因果的概念——这些我们已经在前面的章节中接触过了,在本书的最后一个章节我将作进一步的探讨。
由于卡斯泰尔诺沃的努力而建立起来的意大利统计学派,拥有稳定的数学基础,但大多数研究都是以在实际应用中遇到的困难作为出发点。而与卡斯泰尔诺沃同时代的年轻人科拉多?基尼(Corrado Gini)则带领罗马中央统计研究所(Istituto Centrale Statistica in Rome)进行了在精算方面的深入研究。罗马中央统计研究所是一家由保险公司设立的私人研究机构。基尼对所有应用课题的极大兴趣促使他在20世纪30年代期间与活跃在数理统计领域大部分年轻的意大利数学家保持着密切的联系。
格利文科-坎泰利引理
在这些意大利数学家中有一位叫弗朗切斯科?保罗?坎泰利(Francesco Paolo Cantelli,1875-1966),他差不多先于柯尔莫哥洛夫就建立了概率论的基础。坎泰利对基础理论研究(如研究概率的意义是什么?)不感兴趣,没有像柯尔莫哥洛夫那样更深入地研究概率论,他只是满足于用概率运算的各种方法去推导出一些基本的数学定理,而这些概率运算的方法都是自18世纪数学家亚伯拉罕?棣莫弗将微积分引入概率计算后就存在的。1916年,坎泰利发现了我们所称的数理统计的基本原理。尽管它非常重要,却起了一个不起眼的名字“格利文科-坎泰利引理”(the GlivenkoCantelli Lemma )。坎泰利是第一个证明了这个定理的人,并且,他非常理解它的重要性。至于柯尔莫哥洛夫的学生——约瑟夫?格利文科(Joseph Glivenko)对此定理也做出了贡献,他采用一种新的数学符号,即斯?
小说推荐
返回首页返回目录