《女士品茶》第56章


、政治科学以及心理学等领域。那时,人们相信寻找规律的难点在于测量不准确。
19世纪初,一些数字家如皮埃尔?西蒙?拉普拉斯认为,天文测量存在微小误差,可能是因为大气状况和测量的人为因素。他提出,这些误差也应该存在一个概率分布,从而开启了统计革命的大门。按照库恩的观点,这就是在获得新的数据后对机械式宇宙观进行的修正。19世纪,比利时学者兰伯特?阿道夫?雅克?凯特莱(Lambert Adolphe Jacques Quételet)最早开创了统计革命,他认为人类行为的规律也具有概率论的性质。他没有用皮尔逊的多参数方法,并且也不知道最佳估计方法(optimum estimation),他的模型是极其朴素的。
最终,人们发现,更加精确的测量反倒使模型预测值和实际观测值之间的差异变得更大,关于科学的决定论观点彻底崩溃,测量的越加精确,不但没有按照拉普拉斯的想法去消除误差,反而降低了人们观测行星真实运动的能力,而且表现出的差异越来越大。基于这一点,科学界已经做好了接受皮尔逊及其参数分布的准备。
本书前面的章节已经介绍了皮尔逊的统计革命是怎么逐渐改变整个现代科学的,尽管分子生物学遵循这种决定论(基因会决定细胞产生特殊的蛋白质),但是,在该科学中产生的实际数据充满了随机性,而且基因事实上就是这些随机数据分布的参数。现代药物对人体功能的影响是绝对的,1毫克或2毫克药物就可能对血压或精神有很大的影响,这一点是确定无疑的。但是证明了这一影响力的药理研究过程,却是按照概率分布来设计和分析的,影响力就是这些分布的参数。
同样,经济计量学的统计方法被用来模拟一个国家或者一个企业的经济活动。我们确信的电子的质子这些次原子粒子在量子力学中都是作为概率分布描述的。社会学家用总体的加权算术平均数来描述个体的交互作用,但这只能按照概率分布的方式进行。在许多类似的科学领域里,统计模型的应用在它们的方法论中非常广泛。当谈及分布的参数时,好像它们是真的并且是可测量的一样。多变且不确定的数据集合,就是这些科学的起点,计算结果则是隐藏在大量计算中,以参数形式来表示,这些参数是永远不能通过直接观测得到的。
统计学家失去控制权
现代科学中的统计革命如此彻底,以致于统计学家已经失去了对过程的控制。在数理统计文献的基础上,分子遗传学家已经独立发展了自己的概率计算方法。计算机对大量数据的处理能力,和人们对整理并搞清楚这些巨大信息库含义的需求,促使信息科学这一新学科的诞生。在信息科学新期刊的文章中已经很少提到数理统计学家的工作,而且,在《生物统计》或《数理统计年报》中刊登过的许多分析方法,都正在被重新发现。统计模型在公共政策问题研究中的应用,已经演变成了一个被称为“风险分析”(risk analysis)的新学科,并且风险分析的新期刊也忽视数理统计学家的工作。
现在几乎所有新学科的期刊,要求在结论中有一个结果表,列出对统计结论产生影响的不确定因素的测量值。统计分析的标准方法已经成为大学中这些学科的研究生课程,通常,课程的讲授还不必同一个学校的统计系参与。
自K?皮尔逊发现偏斜分布的一百多年里,统计革命不仅扩展到大多数的科学领域中,而且其许多思想已经传播到了一般的文化当中。当电视新闻主持人宣布,某项医学研究已经表明被动吸烟的人的死亡风险比不吸烟的人高一倍时,几乎每个听众都认为他或她明白主持人的意思;当一个公众民意调查说65%的公众对总统表示满意,上下误差3%时,我们大多数人都认为我们都明白这个65%和3%的含义;当我们听到气象播报员预测明天下雨的概率为95%时,大多数人出门都会带上一把雨伞。
除了这些我们自以为理解的可能性和比例问题外,统计革命对流行思潮和文化,有更深刻的影响力。即使实际测量的数据不够精确地与这些结论吻合,我们还是接受基于估计参数的科学研究结果。我们愿意根据众多数据算出的数来制定公共政策和安排我们的个人计划。我们认为搜集人口出生和死亡的数据,不仅是一个正当的程序,更有必要的工作,我们不必担心数人数会惹怒了上帝。从语言描述方面,我们用“相关”(correlation)或“相关的”(correlated)这两个词,好像它们意味着什么,也好像我们知道其含义。
写这本书的初衷是为了向那些没有数学专业背景的人士解释这场统计革命,我已经尽力描述了在这场革命背后的基本思想,它将如何应用于其他科学领域?它将如何最终主导几乎所有科学领域?我也尽力用语言和实例解释了一些数学模型,使大家不用再去研究抽象的数学符号就能够理解。
统计革命走到尽头了吗?
深邃未及的这个世界是一个集情感、事件与骚动的复杂混合体。我同意库恩的观点,我不相信人类的头脑能够构造一个理想的结构去解释、甚至不能挖地描述这个世界的真实情况。任何这种努力都存在根本的缺陷,最终,这些缺陷会变得非常明显,以至于科学模型必须不断地被修正,最终将走到它的终点,取而代之的是其它的什么东西。
随着统计方法应用的扩展,越来越多地应用到了人类生活的很多领域,哲学问题就显现出来。因此,我认为以讨论哲学问题作为本书的结尾是个好主意。接下来的将是在哲学领域中的一次冒险经历。读者可能想知道哲学究竟对科学信现实生活起到了什么作用。我的答案是,哲学并不是一些被称为哲学家的怪人们所做的神秘学术练习,哲学关注的是我们日常文化思想和活动的基本假设(underlying assumption)。我们的世界观来自于我们的文化,是受许多微妙的假设影响的,甚至很少有人会意识到它们。学习哲学会让我们揭开这些假设,并去检查它们的有效性。
我曾经在康涅狄格大学的数学系教过一门课程,这门课程有一个正式的名称,但是系里的人却更愿称之为“给诗人开的数学”。这门课只开一个学期,是为艺术专业的学生设计的,目的是向他们介绍基本的数学观念。在学期的开始,我向学生们介绍了16世纪意大利数学家吉罗拉莫?卡尔达诺(Girolamo Cardano)的一本书《高等艺术》(Ars Magna),在这本书中,第一次描述了代数的方法。与他的大部头著作相呼应,卡尔达诺在该书的介绍中写道:代数不是新东西。他暗示他不是无知的傻子,他认为自人类产生以来,人类对知识的掌握一直在减少,亚里士多德所拥有的知识远远要多于卡尔达诺那个时代的任何一个人。他断言不可能有新的知识。然而,由于他的无知,他没能在亚里士多德的著作中找到关于代数思想的参考书目,所以他就把代数——这个看起来像是新东西的概念介绍给读者,他确信一些更加有知识的读者会从古人的著作中找到出处,这看起来是新东西的观念一定会被找出来的。
坐在我教室里的这些学生,生活在一个不同的文化环境中,他们不但相信后人会发现新事物,而且事实上,还鼓励创新。他们被卡尔达诺震惊了。写这些是多么愚蠢的呀!我告诉他们,在16世纪的时候,因为当时的一些基本哲学假设,欧洲人的世界观具有局限性,他们的世界观中,一个重要的部分就是人类的堕落以及随之而产生的道德、知识、工业等所有事物的持续退化,这些在当时是如此的真实,以至于很少有人去探寻究竟。
我问学生们,他们的世界观的基本假设中,哪些可能在500年后看起来是很荒谬的?他们一个都想不出来。
因为统计革命的表面观念已经传播到现代文化中,越来越多的人相信所谓的真实性,而不考虑它的基本假设,所以,让我们用统计的宇宙观来考虑下面三个哲学问题:
1。 可以用统计模型来做决策吗?
2。 当概率应用于现实生活中时其含义是什么?
3。 人们真的懂得什么是概率吗?
可以用统计模型来做决策吗?
牛津大学的L?乔纳森?科恩(L。 Jonathan Cohen)是被他称之为“帕斯卡式”(“Pascalian”)观点的尖锐批评家,所谓“帕斯卡式”观点就是认为可以用统计分布去描述现实。1989年他写了《归纳和概率的哲学导论》(An Introduction to the Philosophy of Inductio
小说推荐
返回首页返回目录