为什么概率分布函数是右连续?个人对概率的理解
阿狸的一百种玩法
2019年06月27日 19:57
收录于文集
共13篇

       概率分布函数的定义是:随机变量X≤x的概率,也就是P{X≤x}的大小。

它有四条性质:

       第一,因为概率分布函数的数值代表的意义也是概率,所以大于等于零,小于等于一。

       第二,函数不减,因为x越大,随机变量X就越容易被取到。

       第三,当x趋向于正无穷时,函数等于一,因为随机变量不管取何值都会落在零到正无穷                    区间内,x趋向于负无穷时,函数等于零,因为随机变量取何值都不会小于负无                        穷。

        第四,分布函数如果有间断点,一定是右连续。

        我对第四条表示不理解。我首先上网查了查,感觉众说纷纭,大部分都是云山雾罩,甚至有人说什么想通了就明白了,fei hua,想通了我干嘛点开你的文章。于是我打算用实例来帮助自己理解。

        用简单的扔硬币试验来辅助说明,把正面朝上赋值为X=0,把反面朝上赋值为X=1,(不考虑硬币立起来)。那么这个试验结果的概率的分布函数为下图:

扔硬币的概率分布函数

       为什么最左侧红线落在负无穷到零的开区间,因为开区间的含义是无限趋近,P{X≤0}与P{X≤x | x趋向于零但不等于零}  二者在概念上有本质区别。也就是说,因为含义不同,导致计算范围不同,最终导致概率不一样。

       当x趋向于零但不等于零时(X<0等价于X≤x时x趋向于零但不等于零),它的概率对于抛硬币试验来说一定是零。但是X≤0,含义和范围就发生了变化,变成了 X<0 或者 X=0,也就是不管是 X<0 还是 X=0 都算作这个事件发生了,行话讲叫和事件,所以概率就是0+0.5=0.5而不是0了。正是分布函数经过跳跃间断点时含义发生变化的特点,导致概率分布函数是右连续的。

       离散随机变量的分布函数是间断的,而对于离散随机变量是不研究概率密度的,因为离散随机变量上一点的概率是有实在意义的。拿上述的硬币实验来说,X=0和X=1是有明确含义的,一个是正面,一个是反面。而连续随机变量上一点的概率是0,准确来说是无限趋向于0,因为连续随机变量的总体是无穷的。比如说,向一个长1的线段上扔一个点,那么这个点落在线段左半部分概率是0.5,那么再将范围缩小,落在左1/4长度内的概率就是0.25,当范围逐渐缩小,点落在其中的概率也就逐渐变小,当范围缩小到一个点了,概率就是0了,故密度函数上一点的函数值没有实际意义。所以研究一个连续随机变量只研究它的范围,通常来说就是对x的定积分(二维三维就是二重三重积分)。而离散随机变量就直接把每个点的概率都列出来就可一目了然。

       有小伙伴会说了,那不是还有取值是无穷多个的离散随机变量吗,那为什么每个点都是有含义的呢?比如泊松分布,二项分布等等。像这类分布,你需要考虑取值时的意义,比如二项分布,在每一次求概率时,实际上是对前n次伯努利试验取值,比如前5次,前9999次等等,是有限次的。而泊松分布是对二项分布取极限得到的。

       至于我们日常学习的概率随机性,都是在宏观经典情况下的,比如说从盒子里摸球,扔硬币等,尤其是古典概型。当我们从盒子里摸球时,我们以什么角度伸手进去,把球放进盒子里后球的分布,甚至我在盒子里搅拌一下时我的手是怎么运动的,搅拌时球的受力和初始状态都是确定的,所以最终摸出哪个球在我们一伸手时就是确定的。但是我们为什么还要算个概率来说明可能性呢?因为我们没有必要去计算我们伸手进去后手和球的运动状态,因为太复杂了,所有人都懒得去考虑手和球的运动。当然想算还是可以算出来的,毕竟是低速宏观下的运动。但是在量子领域,一切就不同了,以人类目前所掌握的量子力学知识来看,电子的动量和位置不可同时观测到,观测位置时电子出现的位置是随机的,目前开来,这才真正意义上的随机事件。