《女士品茶》第58章


梢约扑愠隼吹摹8怕试谙质瞪钪械暮迩宄亟⒃诔檠鞑橹稀?br /> 当统计方法应用于天文学、社会学、流行病学、法律或者天气预报等观测研究中时,事件空间就不好确定。在这些领域之中的很多争论,通常都是因为不同的数学模型会产生不同的结论。如果我们不能确定可进行概率计算的事件空间,那么就不能说某种模型比另外一种更适用。就像在很多法律案件中所显示的那样,两个统计专家分析同一组数据却得不到统一的结论。当统计方法越来越多地被政府和社会团体应用到观察研究和解决社会问题时,这个基本问题的存在,即不可能算出确切概率的事实,将使人们对这些统计方法的有效性产生怀疑。
人们真的懂得什么是概率吗?
概率在现实生活中还有一个含义是“个人概率”。美国的L?J?萨维奇和意大利的布鲁诺?德费奈蒂是倡导这种观点的先驱。其先驱地位的确定是因为萨维奇1954年出版的《统计学基础》(The Foundations of Statistics)一书。在这种观点下,概率是一个广泛的概念,人们很自然地使用概率来支配生活。在进行冒险前,人们总会本能地根据可能产生结果的概率根据可能产生结果的概率进行决策,如果预想危险的概率很高,人们就会采取回避的态度。对萨维奇和德费奈蒂来说,概率是一个普通的概念。人们不必去联系柯尔莫哥洛夫的数学概率,我们所要做的就是建立一些一般性的规则,将个人概率与生活联系起来,因此,我们只要假设人们在判断事件的概率时所遵照的规则是一致的就可以了。萨维奇在这一假设下提出了一些关于内部一致性的规则。
按照萨维奇和德费奈蒂的方法,个人概率对每个人来讲是独特的。对同样的数据进行同样的观察,有的人会判断降水概率是95%,有的人则会判断是72%,这样的事情是极有可能发生的。利用贝叶斯定理,萨维奇和德费奈蒂向人们展示了具有相同个人概率的两个人如果分析的是同一序列数据,最终他们会得到相同的概率估计。这是一个令人满意的结论:人看起来都是不同的,但却都是理性的。如果提供了足够的数据,理性的人们会最终求得共识,哪怕最初他们是存在意见分歧的。
约翰?梅纳德?凯恩斯在1921年发表的题为《关于概率的讨论》(A Treatise on Probability)的博士论文中,对个人概率提出了不同的看法。凯恩斯认为,概率是在某一文化教育背景下的人们,对其既定情况的不确定性的测量,概率的判断不仅是个人内心的直觉,还与个人的文化背景有关系。如果我们想在72%和68%之中作出哪一个更准确的选择,用凯恩斯的方法就会很困难,因为人们的总体文化水平很难达到精确的同一程度。凯恩斯指出,如果只是为了做决定,我们很少或根本不必去知道这些事件确切的概率数值,只要将事件进行排序就足够了。根据凯恩斯的理论,我们只要知道哪一事件更可能发生就可以了。明天下雨比下冰雹的可能性要大,或者说明天下雨的可能性是下冰雹可能性的两倍。凯恩斯指出,概率可以是部分排序(partial ordering)。不必要把每件事与其它事情进行比较。我们可以忽视某些概率关系,如根本不必要把扬基队得总冠军的概率与明天下雨的概率联系起来。
照这样,关于概率含义的两个结论取决于人类对不确定性量化的愿望,或者至少是大致的量化的要求。在凯恩斯的《关于概率的讨论》中,他为他的个人概率的部分序列设计出了一个正式的数学结构。他的做法比柯尔莫哥洛夫为数学概率建立基础理论还要早。他所做的工作没有借鉴柯尔莫哥洛夫的理论。凯恩斯声称,他的概率的定义有别于1921年提出的概率数学的一系列数学计算公式。为了使凯恩斯的概率定义得到应用,使用者还必须符合萨维奇的一致性原则。
凯恩斯的定义提供了关于概率的一种观点,它是用统计方法进行决策的基础。这种观点认为概率不再以事件空间为基础,而是产生于所涉及人员的个人感觉的数值。接着希伯来大学(Hebrew University)的两个心理学家——丹尼尔?卡内曼(Daniel Kahneman)和阿莫斯?特韦尔斯基(Amos Tversky)开始了他们关于个人概率的心理学研究。
在20世纪70年代和80年代间,卡内曼和特韦尔斯基研究了个体理解概率的方式。他们的研究成果编入了由P?斯洛维奇(P。 Slovic)编辑的《不确定情况下的判断——启发与偏见》(Judgment under Uncertainty: Heuristics and Biases)一书中。他们为大学生、大学教员和一般的市民提出了许多概率场景,他们发现没有人符合萨维奇的一致性原则,相反,大多数人对不同概率数值的含义甚至没有一个一致的观点。他们所发现最好的一点就是人们对50:50和“几乎肯定”的含义有着一致的认识。通过卡内曼和特韦尔斯基的研究,我们可以得出结论:天气预报员尽力想区分降雨概率90%和75%间的不同,但实际上他们根本不可能说清楚,而那些预报的收听者也不可能真的说清楚这两者间的区别。
1974年,特韦尔斯基在皇家统计学会的一次会议上宣布了他的研究结果。在随后的讨论中,斯坦福大学的帕特里克?苏佩斯(Patrick Suppes)提出了一个简单的概率模型,符合柯尔莫哥洛夫的公理,并且也模拟卡内曼和特韦尔斯基的发现。这意味着用这个模型的人在他们的个人概率方面应该是一致的,在苏佩斯的模型中只有五个概率值:
必然为真
为真的可能性大
为真的概率为一半
为真的可能性小
必然为假
这导出了一个很无趣的数学理论。大概只有六个理论可由此模型导出,并且它们的论证几乎是不言而喻的。如果卡内曼和特韦尔斯基是对的,那么惟一有用的个人概率将对奇妙的抽象数学理论十分不利,并且由此产生的统计模型极基有限。事实上,如果苏佩斯的模型是惟一适合个人概率的模型,许多标准统计分析方法就毫无用处了,因为它们算出的差异水平低于人类感觉的水平。
概率真的必要吗?
统计革命背后的基本观点是:科学真实的主体是数字的分布,这个分布可以通过参数来描述。将概念溶入概率理论并处理概率分布,这是数学的方便之处。将数字的分布看作是概率数学理论的元素,这样就可以建立参数估计量的最优化标准,然后,去解决用数据描述分布时遇到的数学问题。因为概率看起来与分布的概念的关系是与生俱来的,许多人做了很多工作,试图让人们理解概率的含义,努力将概率的含义与现实生活联系起来,并且使用条件概率这一工具去解释学实验和观测的结果。
分布的思想可以存在于概率理论之外。事实上,许多“非正常分布”(improper distributions)(因为这些分布不符合概率分布的所有要求)已经应用于量子力学和一些贝叶斯方法中。排队论(queuing theory)(指两次排队间的平均间隔时间等于在队伍中等候的平均时间)的发展,推导出一个非正常的分布——描述一个人加入队伍必须要等候的时间。这正是一个将概率论的数学理论应用于实际生活,同时却将我们带离概率分布集合的一个例子。
21世纪将会发生什么事?
柯尔莫哥洛夫表现出来的最后的聪明才智,是他用一组有限符号序列的特性来描述概率。在这个描述中,信息理论不是概率计算的结果,而是概率本身的起源。也许在将来,某个人会继续他的工作,并且发展一个新的分布理论,而在新的分布理论中数字计算机的特性会被带入哲学理论的范畴。
谁知道呢?也许在什么地方有另外一个费歇尔,正工作于科学的最前沿,并在不久的将来,会以其前所未有的见识和观念打破目前的书面?也许在中国的内地,另一个吕西安?勒卡姆已经在一个没有文化的农家出生了;或者在北美,另一个乔治?博克斯只上了初中就休学了,现在正在做机修工,正在努力自学;也许另一个格特鲁德?考克斯将要放弃当传教士的愿望,被科学和数学的谜团深深吸引;或者另一位威廉?S?戈塞特正在努力寻找方法去解决啤酒发酵问题;或者另一个奈曼或皮特曼正在印度某个偏远的地方学院里教书,并且思考着深奥的问题。谁知道下一个伟大的发现将发生在什么地方?
当我们进入21世纪的时候,统计革命在科学领域取得了胜利,除了极少数的角?
小说推荐
返回首页返回目录