抱歉,您的浏览器无法访问本站
本页面需要浏览器支持(启用)JavaScript
了解详情 >

摘要 :中心极限定理的研究在概率论具有重要地位,它揭示了大量独立同分布的的随机变量之和的极限趋势为正态分布,在统计学以及其它许多学科中都有重要的应用。但教材[1]中并没有给出其具体证明。本文将从傅里叶变换中的卷积定理的角度证明该定理。

关键词 :中心极限定理, 傅里叶变换, 卷积定理

引言

Everyone believes in it: experimentalists believing that it is a mathematical theorem, mathematicians believing that it is an empirical fact. [2]

Henri Poincaré

对中心极限定理的研究实质上始于1733年棣莫弗(A. de Moirvre)对二项分布的极限分布的研究,并得到了拉普拉斯(P.-S. Laplace)、泊松(S.-D. Possion)、贝塞尔(A.L. Bessel)、柯西(A.-L. Cauchy)等人的进一步研究和推广。但总体上,由于当时概率论不太受数学家重视,中心极限定理在很长一段时间没有得到一个完整的严格证明,直到1901年李雅普诺夫(A.M. Lyapunov)借助特征函数的工具才有了一个条件较为宽松的严格证明。[3]

一个常用的中心极限定理如下:[1]

定理 1 (独立同分布的中心极限定理)
如果随机变量序列 X1,X2,,Xn,X_{1},X_{2},\cdots ,X_{n},\cdots 独立同分布,并且具有有限的数学期望和方差 E(Xi)=μ,D(Xi)=σ2>0(i=1,2,3,)E(X_{i})=\mu ,D(X_{i})=\sigma ^{2}>0 (i=1,2,3,\cdots ) ,则对一切 xRx\in {\rm\bf{R}}

limnP(1nσ(i=1nXinμ)x)=x12πet22dt\lim_{n\to\infty} P\left(\frac{1}{\sqrt{n}\sigma}\left(\sum_{i=1}^{n}X_{i}-n\mu \right)\le x\right) = \int_{-\infty }^{x}\frac{1}{\sqrt{2\pi}}e^{-\frac{t^{2}}{2}}\mathrm{d}t

本文将以上述定理为例,从卷积定理的角度对其进行证明。

卷积定理及中心极限定理的证明

卷积、卷积与独立随机变量之和的关系

在傅里叶变换的语境下,卷积的概念如下:[4]

定义 1 (卷积)
给定定义在 (,+)(-\infty,+\infty) 上的函数 f1(t)f_{1}(t)f2(t)f_{2}(t) ,称由含参变量 tt 的广义积分所确定的函数

g(t)=+f1(τ)f2(tτ)dτg(t) = \int_{-\infty}^{+\infty}f_{1}(\tau)f_{2}(t-\tau)\mathrm{d}\tau

为函数 f1(t)f_{1}(t)f2(t)f_{2}(t) 的卷积,记为

g(t)=f1(t)f2(t)g(t) = f_{1}(t) \ast f_{2}(t)

出于方便,我们只考虑连续型随机变量(离散型随机变量通常可以通过在连续型随机变量的概率密度函数中使用 Dirac δ 函数来表示)。我们注意到,对于独立随机变量 X1,X2X_{1},X_{2} ,其概率密度为 f1(x1),f2(x2)f_{1}(x_{1}),f_{2}(x_{2}) ,那么对于任意的 YRY\in \textbf{R} ,都有

P(X1+X2Y)=x1+x2Yf1(x1)f2(x2)dx1dx2=Y+f1(x1)f2(yx1)dx1dy=Y(f1f2)(y)dy\begin{aligned} P(X_{1}+X_{2}\le Y) &= \iint_{x_{1}+x_{2}\le Y}f_{1}(x_{1})f_{2}(x_{2})\mathrm{d}x_{1}\mathrm{d}x_{2} \\ &= \int_{-\infty}^{Y}\int_{-\infty}^{+\infty}f_{1}(x_{1})f_{2}(y-x_{1})\mathrm{d}x_{1}\mathrm{d}y \\ &= \int_{-\infty}^{Y}(f_{1}\ast f_{2})(y)\mathrm{d}y \end{aligned}

亦即,若记随机变量 Y=X1+X2Y=X_{1}+X_{2},则其概率密度函数

fY(y)=(f1f2)(y)f_{Y}(y) = (f_{1}\ast f_{2})(y)

归纳地,对于随机变量 Y=X1+X2++XnY=X_{1}+X_{2}+\cdots+X_{n},其概率密度函数

fY(y)=(f1f2fn)(y)f_{Y}(y) = (f_{1}\ast f_{2} \ast \cdots \ast f_{n})(y)

中心极限定理的证明

众所周知,傅里叶变换可以将函数的卷积变换为像函数的乘积,即所谓的卷积定理[5]

定理 2 (卷积定理)
给定两个函数f1(t),f2(t)f_{1}(t),f_{2}(t),记F1(ω)=F[f1(t)],F2(ω)=F[f2(t)]F_{1}(\omega)=\mathscr{F} [f_{1}(t)],F_{2}(\omega)=\mathscr{F} [f_{2}(t)],则

F[f1(t)f2(t)]=F1(ω)F2(ω)\mathscr{F} [f_{1}(t) \ast f_{2}(t)] = F_{1}(\omega)\cdot F_{2}(\omega)

这样,独立的随机变量之和的概率密度函数的求解可以得到简化。

下面进行对定理 1 进行证明:

对于独立同分布的随机变量序列 X1,X2,,Xn,X_{1},X_{2},\cdots ,X_{n},\cdots ,具有相同的概率密度 f(x)f(x),不妨取其期望 E(Xi)=0E(X_{i})=0, 方差 D(Xi)=1D(X_{i})=1(一般的,对于期望为 μ\mu,方差为 σ2\sigma^{2} 的随机变量 XX',总能通过变换 X=XμσX=\frac{X'-\mu}{\sigma} 化为这种“标准”的形式)。另记随机变量

Yn=1n(i=1nXi)Y_{n} = \frac{1}{\sqrt{n}}\left(\sum_{i=1}^{n}X_{i} \right)

其概率密度为

fn(y)=n(ffn)(ny)f_{n}(y) = \sqrt{n}(\underbrace{ f\ast\cdots\ast f}_{n})(\sqrt{n}y)

F[f(x)]=F(ω)\mathscr{F}[f(x)]=F(\omega) ,对 fn(y)f_{n}(y) 做傅里叶变换

F[fn(y)]=F[n(ffn)(ny)]=nF[(ffn)(ny)]=(F(ffn))(ωn)=(F(ωn))n\begin{aligned} \mathscr{F} [f_{n}(y)] &= \mathscr{F} [\sqrt{n}(\underbrace{ f\ast\cdots\ast f}_{n})(\sqrt{n}y)] \\ &= \sqrt{n}\mathscr{F} [(\underbrace{ f\ast\cdots\ast f}_{n})(\sqrt{n}y)] \\ &= (\mathscr{F} (\underbrace{ f\ast\cdots\ast f}_{n}))\left(\frac{\omega}{\sqrt{n}}\right) \\ &= \left(F\left(\frac{\omega}{\sqrt{n}}\right)\right)^{n} \end{aligned}

另一方面

F(ωn)=+f(x)eıωnxdx(1)F\left(\frac{\omega}{\sqrt{n}}\right) = \int_{-\infty}^{+\infty}f(x)e^{-\imath\dfrac{\omega}{\sqrt{n}}x}\mathrm{d}x \tag{1}

注意到 eıωnx=1\left\vert e^{-\imath\frac{\omega}{\sqrt{n}}x}\right\vert =1,故上述积分绝对收敛。

eıωnxe^{-\imath\frac{\omega}{\sqrt{n}}x} 做泰勒展开

F(ωn)=+[1ıωnx+12(ıωnx)2+Rn(x)]f(x)dx=+f(x)dxıωn+xf(x)dxω22n+x2f(x)dx++Rn(x)f(x)dx=1ω22n++Rn(x)f(x)dx\begin{aligned} F\left(\frac{\omega}{\sqrt{n}}\right) &= \int_{-\infty}^{+\infty} \left[1 - \imath\dfrac{\omega}{\sqrt{n}}x + \dfrac{1}{2}\left(\imath\dfrac{\omega}{\sqrt{n}}x\right)^{2} + R_{n}(x)\right] f(x)\mathrm{d}x \\ &= \int_{-\infty}^{+\infty}f(x)\mathrm{d}x - \imath\dfrac{\omega}{\sqrt{n}}\int_{-\infty}^{+\infty}xf(x)\mathrm{d}x - \dfrac{\omega^{2}}{2n}\int_{-\infty}^{+\infty}x^{2}f(x)\mathrm{d}x + \int_{-\infty}^{+\infty}R_{n}(x)f(x)\mathrm{d}x \\ &= 1-\dfrac{\omega^{2}}{2n} + \int_{-\infty}^{+\infty}R_{n}(x)f(x)\mathrm{d}x \end{aligned}

由于式(1)中的积分总是有限的,故上式中

+Rn(x)f(x)dx=o(1n),n\int_{-\infty}^{+\infty}R_{n}(x)f(x)\mathrm{d}x=o\left(\frac{1}{n}\right) \qquad ,n\to\infty

因而

limn(F(ωn))n=limn(1ω22n+o(1n))n=eω22\lim_{n\to\infty}\left(F\left(\frac{\omega}{\sqrt{n}}\right)\right)^{n} = \lim_{n\to\infty}\left(1-\frac{\omega^{2}}{2n}+o\left(\frac{1}{n}\right)\right)^{n} = e^{-\frac{\omega^{2}}{2}}

对上式求傅里叶逆变换即可得

limnfn(y)=F1[eω22]=12πeω22\lim_{n\to\infty}f_{n}(y) = \mathscr{F}^{-1} \left[e^{-\frac{\omega^{2}}{2}}\right] = \frac{1}{\sqrt{2\pi}}e^{-\frac{\omega^{2}}{2}}

定理 1 得证。

类似地,只要将 YnY_{n} 改写为 X1+X2++Xnn\frac{X_{1}+X_{2}+\cdots +X_{n}}{n},按同样的方法不难得到大数定律。

结论

中心极限定理的研究曾在概率论中占据中心地位,而傅里叶变换对微分、积分、卷积等运算都具有简化的作用。将傅里叶变换运用到概率论中可以获得极大的便利,由于概率分布具有归一化的性质,因而对概率密度函数使用傅里叶变换总是可行的,实际上,概率论中的“特征函数”就是对概率密度函数的傅里叶变换,可以说,它的出现把概率理论的研究推上了一个新的台阶。


参考资料:

[1]: 王勇主编 2014 大学数学. 概率论与数理统计 (北京:高等教育出版社) 第141页

[2]: JinZhihui 2013 正态分布的前世今生(下) http://cos.name/2013/01/story-of-normal-distribution-2/

[3]: 杨静, 邓明立 2013 中心极限定理的创立与发展 科学 Vol.65 No.5

[4]: 哈尔滨工业大学数学系组编;包革军,邢宇明,盖云英编 2013 复变函数与积分变换 (第三版) (北京:科学出版社) 第241页

[5]: 哈尔滨工业大学数学系组编;包革军,邢宇明,盖云英编 2013 复变函数与积分变换 (第三版) (北京:科学出版社) 第247页

评论