《女士品茶》第47章


行矶嘤虢峁薰氐囊蛩孛挥蟹掷氤隼矗庋纳杓剖遣豢赡艿玫秸媸档慕峁沟摹M米佑辛街谎劬Γ谑遣┛怂估盟男律杓普攵哉飧鍪率堤岢隽艘桓龇浅<虻サ氖笛椋飧鍪笛楹芸煜允菊庵纸舛炯粮臼俏扌У摹?br /> 他们准备写一份描述这些结论的报告,作者是一个英国军官,博克斯负责写统计附录,即解释这个结论是怎样得出的。一个负责审核报告的军官坚持删除博克斯写的那部分,他认为这部分太复杂了,没有人能看懂(事实上是这位负责审查的人看不懂)。但是约翰?加德姆爵士已经阅读了初稿,他跑去恭贺博克斯在附录部分所做的工作,得知这部分将在最终报告中删除,于是他拉着博克斯怒气冲冲地闯进了组合行军棚屋,当时审查报告委员们正在开会,用博克斯的话说:“我感到很尴尬,这个非常有名的大人物为在场的所有国家公职人员读了一段我写的附录,然后说:‘把这些东西给我放回去’。”他们很快就照办了。
战争结束后,博克斯认为去学习统计学是非常有价值的,他已经读了费歇尔的书,知道费歇尔在伦敦大学的大学学院任教,于是他来到了这所大学,但是他不知道费歇尔已经在1943年离开了伦敦大学到剑桥大学任遗传系主任了。会见博克斯的是E?皮尔逊,费歇尔曾对他跟奈曼合作进行的假设检验进行过刻薄的批评。会谈时,博克斯热情洋溢地描述他对费歇尔理论的认识,介绍他在实验设计中的心得,皮尔逊静静地听着,最后说:“好吧,总之你可以来我校就读,但是我想你将来会知道,在统计界里除了费歇尔外,还有其他一个或两个人的存在。”
博克斯留在大学学院里学习,取得了学士学位,接着又继续攻读硕士学位。他发表了许多关于实验设计的文章,被认为可以当作博士论文,于是,他直接得到了博士学位。当时,帝国化学工业公司(Imperial Chemicals Industry(ICI))是英国最主要的发明新化学药品的公司,博克斯应邀参加了该公司的数学服务小组,他从1948年至1956年一直在ICI公司工作,其间他写了一系列的论文(通常是合著),这些论文扩展了实验设计方法,检验了一些在生产过程中为提高效益进一步调整产出的方法,同时,也是他后来对柯尔莫哥洛夫随机理论进行应用研究的起点。
博克斯在美国
博克斯到了普林斯顿大学任统计方法研究小组的负责人,接着到威斯康星大学开设了统计学系。他已经是所有重要统计组织的成员,因为他卓越的成就得到了好几项声望很高的奖励。即使在退休后,他仍然致力于学术研究和学术组织的管理工作。他的研究成果覆盖了很多统计研究领域,不但有理论研究还有应用研究。
博克斯在帝国化学工业公司工作时认识了费歇尔,但是私交并不深。当他在普林斯顿大学负责统计方法研究小组的工作时,费歇尔的一个女儿琼(Joan)得到了一个去美国的机会,她的朋友为她在普林斯顿大学找到了一个秘书的工作,博克斯与她相遇,后来两人结了婚。琼在1978年时出版了一本权威性传记,记录了她父亲和她丈夫的工作。
博克斯还有一个对统计的贡献就是“稳健”(robust)一词。他考虑到很多统计方法都是依赖于数学定理的,而这些数学定理对数据分布特性的假设可能不正确,如果数学定理的条件不成立,能找到可用的统计方法吗?博克斯提议称这些方法为“稳健方法”。他做了一些初步的数学研究,发现“稳健性”(robustness)的含义太不明确,但他反对对此概念赋予更加明确的含义,因为他认为一个概括性的模糊思想会对方法的选择更加有利。然而,这种思想本身还是得到了发展,用一个术语定义假设检验的稳健性就是:误差概率(the probability of error)。斯坦福大学的统计学教授布拉德利?埃弗龙(Bradley Efron)把费歇尔的一个几何学概念作了延伸,他在1968年证明了“学生”t-检验具有稳健性,他还用E?J?G?皮特曼(E。 J。 G。 Pitman)的方法证明了大多数的非参数检验也是同样稳健的。
20世纪60年代末,普林斯顿大学的图基和他的研究小组成员以及他的学生们,研究如何处理那些显而易见是错误的测量值。他们的成果就是1972年发表的“普林斯顿稳健性研究”。这项研究的基本观点是有瑕疵的分布(contaminated distribution)(有的辞典上将之翻译为污染分布——译者注)。通常情况下,我们假设取得的测量值绝大部分是来自于一个概率分布,而且这个概率分布的参数是我们要估计的,但是,测量值当中总会有极少的一些测量从上到下为自于另外一个分布,所以我们说这些测量值是有瑕疵的。
在第二次世界大战期间,有一个典型的关于瑕疵分布的例子。美国海军改进了一种新型的光学测距仪,要求使用者用一个三维立体镜去看目标的影像,用一个大三角“罩”在目标上,为了确定这个仪器的统计误差,让几百名水手来试用,测量一个已知距离的目标。在试用前,根据随机数表重新确定了目标的位置,这样后来的水手就不会受先前已知位置的影响。
设计这个研究的工程师不知道,有20%的人看东西不是立体的。因为他们是我们所说的弱视(lazy eye),这样有五分之一的数据是完全错误的。单从手头研究得到的数据看,不可能知道哪些数据是来自于弱视者的,因此分不出哪些数据来自于有瑕疵的分布。
普林斯顿的研究是在计算机上实施蒙特卡罗法(Monte Carlo )模拟计算大量来自有瑕疵分布的数据,寻找估计这个分布的中心趋势的方法。当数据有瑕疵时,一般人通常喜欢用的平均数是不可靠的,关于这一点也有一个经典的例子,讲的是20世纪50年代耶鲁大学所做的一次试验,估计该校的毕业生10年后的收入情况。如果他们用平均值,那么收入是非常高的,因为有几个当时是千万富翁,但是,事实上,80%以上的毕业生平均收入均低于这个平均数。
“普林斯顿稳健性研究”发现,平均数在一个有瑕疵的分布中受个别值的影响往往很大,这正是那位药理学家告诉我的小白鼠溃疡研究实验中出现的数据问题,而这位药理学家所学的统计方法都是用平均值来做分析。读者可能会问:如果这些极端的、而且看起来是测量值实际上是对的,假设他们是属于我们正在检验的面盆,并不是来自另外的分布,会怎么样?如果将这些数据剔除,结论就会产生偏差。
普林斯顿的稳健性研究找到了一个解决方案,有以下两种方法:
1。 如果测量值有瑕疵,就降低瑕疵测量值的影响力;
2。 如果测量值没有瑕疵,就找出正确的答案。
我建议这个药理学家使用其中的一种方法,这样他就可以根据数据得出正确的结论。后来他的下一步实验得到了一致的结果,说明稳健分析是对的。
博克斯与考克斯
博克斯还在帝国化学工业公司工作的时候,他经常去拜访大学学院里的统计小组,在那里他遇到了大卫?考克斯。考克斯已经成为统计的主要创新者,是《生物统计》(K?皮尔逊的期刊)的主编。这两个人都觉得他们的姓氏相像,很有意思,而且博克斯和考克斯连起来刚好是英国戏剧里的一个术语,意思是一个赏扮演两个小角色,还是一个英国经典音乐讽刺喜剧中的两个人物的名称,剧中,博克斯和考克斯租住一间房里的同一张床,一个白天睡,一个晚上睡。
博克斯与考克斯决定共同写一篇论文。但是,他们在统计领域中的兴趣不同,随着时间的推移,他们一再地努力,但是他们的兴趣实在是太不相同了,这样,如果要共同写这篇论文,他们就不得不对各自持有的关于统计分析性质的不同角度进行调和。1964年,他们的论文终于在《皇家统计学会期刊》上发表,就如这篇论文广为人知一样,“博克斯?考克斯”成为统计方法中的一个重要部分。在这篇论文中,他们阐述了如何用一种方法转换测量值,使得大部分的统计程序更具有稳健性。用他们的名字命名的“博克斯-考克斯变换”(BoxCox transformations)方法用于研究化学物质使活细胞突变的效应,也用于经济计量分析,甚至用于农业研究——费歇尔方法最初产生的领域。
第24章 重塑产业的人
1980年,美国国家广播公司(NBC)播出了一部电视记录片,片名为《日本人能,我们为什么不能?》。美
小说推荐
返回首页返回目录