《女士品茶》第52章


利维不满于当时作为复杂计算方法之集合的概率理论(那里安德烈?柯尔莫哥洛夫的理论尚未出现)。利维寻找一些基础性的抽象数学概念,以便把这些方法统一起来。在这一过程中,棣莫弗正态分布的推导和数学家的“大众定理”(FOLK theorem)打动了他。(按大众定理,棣莫弗的结果在许多其它情况下也都成立,现在叫做“中心极限定理”)我们已经看到利维(与荷兰的林德伯格(Lindeberg))如何在20世纪30年代早期最终证明了中心极限定理,以及这个定理成立的必要条件。与此同时,利维着手对正态分布公式进行研究,通过逆向推导,寻求这一分布的独特性质,使得该分布能由这么多的情形产生出来。
然后,利维又另辟新路,从另一个角度探讨这个问题,探询这种正态分布成立的特定条件是什么。他确定只需两个简单的条件就能使一组数列趋向一个正态分布。但这两个条件并不是正态分布能产生的唯一途径,利维对中心极限定理的证明建立了一组更具有普遍意义的必要条件,这两个条件相当于有一组随机产生的一个接一个的数列:
1。 变异是有界的,因此个别值不可能是无穷大的,也不可能是无穷小的。
2.下一个数字的最佳估计值必是它的前一个数值。
利维称这样的数列为鞅(martingale)。
这里,利维借用赌博中的一个术语。在赌博中,martingale的意思是指赌博者在输了的情况下加倍下注,如果他输赢的机会各半,即50%:50%,那么损失的期望值就等于他原来的损失。Martingale这个英文词还有另外两个含义。一个意思是用来描述法国农夫套马的一种装置,让马低着头不向后甩。在此装置控制下,马的头可以随意活动,但马头下一个最有可能的位置是它现在所在的位置。Martingale的另一种解释是用在航海上的。指一片很重的木头,悬挂在船帆的下桁上,用以防止帆的下桁因剧烈摇晃而左右摆动。这里,帆的下桁最后的位置也就是它下一次位置的最佳估计。至于这个词本身,是来源于法国的一个叫马提克(Martique)的小镇,该小镇的居民以小气而著称。据说他们下周要花的一点小钱,估计起来最有可能等于他们今天花的钱。
利维正是从马提克小镇居民的小气习性中受到启发,创立了最小气可能性的抽象数学概念,而具有这种性质的数列通常是正态分布的。到1940年,鞅已经成为抽象数学理论的一个重要的工具。它的简单必要条件,意味着诸多类型的随机数列都具备鞅的性质。1970年,挪威奥斯陆大学(the University of Oslo)的奥德?奥伦(Odd Aalen)研究发现,在临床试验中,病人的反应方式就是一个鞅。
鞅与充血性心脏病研究
回想前面有关充血心脏病研究所引发的问题,因为患者的反应各不相同,我们的问题就是如何解释研究中患者住院治疗的时间早晚问题(当患者年龄已经很大的时候),如何处理患者住院治疗的次数和住院时间的长短。把长时间得到的数据看成鞅,所有这些问题的答案都可能回答。奥伦特别注意到,当一个患者住院治疗时他可以从分析中排除,到其出院后再列入研究范围。重复多次的住院治疗可以把每次住院作为一个新事件来处理。在每一个时间点,分析人员需要了解的就是仍在研究中(或回到研究中)的病人数和最初进入研究的病人数。
在20世纪80年代初,奥伦与丹麦奥尔胡斯大学(Aarhus University)的埃里克?安德森(Erik Anderson)及荷兰乌得勒支大学(University of Utrecht)的理查德?吉尔(Richard Gill)一起探索他的新发现。在本书的第1章我就曾指出,数学的发展总是和科学发展具有不可分割的联系。抽象的数理统计是如此错综复杂以至于很容易出错,只有通过同事间共同的讨论和批评,才能发现其中可能出现的错误。正是奥伦和安德森、吉尔这三个人的通力合作,造就了20世纪最后十年这个领域的一项最富成效的研究结果。
之后,理查德?奥尔森(Richard Olshen)与其在华盛顿大学的合作者,以及哈佛大学的魏立人(LeeJen Wei)教授又对奥伦、安德森和吉尔三个人的研究成果进行了补充。他们又提出了大量用于分析临床试验中序列事件的新方法。特别是魏立人对于两个鞅之差仍然是鞅这一概念的开拓性的应用,消除了对模型进行多个参数估计的必要性。如今鞅方法在慢性疾病的临床试验研究统计分析中占据着主导地位。
以马提克上镇居民以小气著称的传奇故事为起点,法国人利维创立了建立在最小气原理的数学概念之上的鞅方法的最初概念。之后,又经过更多头脑的共同研究开发,他们包括美国人、德国人、俄国人、英国人、意大利人和印度人。之后,又由挪威人、丹麦人和荷兰人将这种方法运用于临床试验研究。两个美国人,其中一个出生在中国的台湾,又进一步将这项研究推向深入。20世纪80年代以来,有关这方面问题研究的文章和书籍特别多,光是作者名录就可以写好多页,研究者还来自上面没有提到的很多国家。的确,数理统计学已成为一种国际合作性的研究。
第27章 意向治疗法
在20世纪80年代初,英国杰出的生物统计学家雷沙尔?皮托(Rechard Peto)遇到了一个难题,当时他正在分析比较不同癌症治疗方法的临床试验结果。根据费歇尔实验设计规定,典型临床实验研究要求确定需要治疗的病人群体,并且采用随机的方法分配给病人不同的治疗实验方法。
数据的分析应该是相当直接的,用费歇尔方法,只要在不同治疗方法的组别间,比较病人的5年存活率即可。另外还可以进行更加精确的比较,就是用奥伦(Aalen)的鞅方法(martingale approach),分析从开始研究到每个病人死亡的时间,以此作为衡量治疗效果的基本标准。不论是哪种方法,分析结果的准确性取决于最初分配给病人采用治疗方法的随机选择。根据费歇尔定律,指定病人采取何种治疗方法与研究的结果是完全不相关的,假设检验的P值是可以计算出来的。
皮托的难题是所有病人的治疗方法并不是随机指定的。这些病人也是人,正饱尝病痛的折磨,而且很多人得的是绝症,因此医生沉得有责任放弃实验性的治疗,或者如果觉得对于病人来讲是最好的选择的话,至少也要进行方案的调整。盲目地照搬某种治疗方法而不考虑病人的需要和反应是不首先的。与费歇尔的实验设计要求相矛盾,在这些实验中的病人经常变换治疗方法,而对治疗方法的选择主要取决于病人的治疗效果,如果效果好可能会继续采用这种方法,一旦觉得治疗效果不理想就会改变治疗方法。
这是癌症研究中的一个典型问题。从20世纪50年代人们刚刚开始研究癌症起,这就一直是一个令人困扰的问题,直到皮托涉入此领域研究之前,通常的做法只是去分析那些坚持采用随机分配治疗方法的病人,而其他的病人不在分析的范围之内。皮托认为这会导致严重的错误。例如,假设我们正在比较两种治疗方法,一种是有效的治疗,另一种只是给病人服用安慰剂,即一种没有生物作用的药物。如果病人对治疗无反应,就会转而使用常规的治疗。服用安慰剂、没有效果就转而使用别的治疗方法的病人不能做为研究对象,只有那些继续服用安慰剂、因为某些原因有反应的病人才是研究的对象。如果在研究分析中的研究对象只有那些继续服用安慰剂并且有反应的病人,那么研究的结果必然是:安慰剂治疗方法与有效的治疗具有同样的疗效,甚至可能疗效更好。
德克萨斯州安德森医院(M。 C。 Anderson Hospital)的埃德蒙?吉亨(Edmund Gehan)比皮托更早发现了这个问题。他当时的办法只是提出:因为这些研究不符合费歇尔实验的条件,所以不能够作为比较不同治疗方法的有效实验,只能算是研究中通过对采用不同治疗方法病人仔细观察而取得的记录,最多只是对实验结果的一种总体描述,为以后的治疗提供了一些思路。后来,吉亨也考虑了解决这个问题的不同方法,但是他的第一个结论让人非常气馁,竭力想在一个设计和执行都不好的实验中运用统计分析方法看来是不可能的。
皮托提出了一个直截了当的解决方法:当比较不同的治疗方法的疗效时,病人采用哪种治疗方法应该是随机的,否则不可能在假设检验?
小说推荐
返回首页返回目录