抱歉,您的浏览器无法访问本站
本页面需要浏览器支持(启用)JavaScript
了解详情 >

(高中毕业的暑假写的)
百度文库版


前言:

这是本人第一次写科普,解释可能并不很形象。建议知识水平在初中以上的读者阅读(高中水平以下的建议先阅读后面的注释[1])。本人水平有限,如有错误,欢迎各位指正。


一、“可望不可即”——芝诺之惑

一只运动速度为10米每秒的兔子与一只运动速度1米每秒的乌龟同向而行。开始时,乌龟在兔子前方9米处。问:何时兔子追上乌龟?[2]

这道题即使是小学四五年级的学生应该也能立即答出“一秒”的答案来的。然而,我们“聪明的”古希腊哲学家芝诺却为这个问题头疼不已。他在脑中模拟,想:兔子在追上乌龟之前,先要抵达两者原距离的一半处,而此时乌龟已经向前走了一段距离,接下来,兔子又要先到两者第二次距离的一半处,这时乌龟又向前走了一段,如此往复,兔子永远也无法追上乌龟。[3]

芝诺的做法似乎无可非议,可问题在哪呢?

有人认为,时空并非无限可分,存在某种最小单元[4],因此,他的“如此往复”,必将终止于某一阶段。那么,假如我们暂时抛却这个瑕疵,假设时空是 无限可分的 ,芝诺的推理就对了吗?

聪明的读者也许很快就会注意到:无穷的过程是否需要无限的时间?这便是这个问题的关键。[5] [6]为了避免文章中出现许多公式与符号,我们将这个问题简化成另一个等价的问题上:

“永远无法抵达的终点”:当乌龟正为自己的秘术沾沾自喜时,却发现自己永远也抵达不了一米前的终点。他首先要抵达终点的一半处,然后要抵达剩余路程的一半处,如此往复,自己永远也到达不了终点的地方。再强化一点,将终点无限移近,那他甚至无法起动。[7]

果真如此吗?

答案当然是否定的。

对于每一段,乌龟所花的时间分别是 12,14,18,116,\frac{1}{2},\frac{1}{4},\frac{1}{8},\frac{1}{16},\cdots

乌龟所花的总时间 t=12+14+18+116+t=\frac{1}{2}+\frac{1}{4}+\frac{1}{8}+\frac{1}{16}+\cdots

有一点级数知识的读者当然知道求解,但我这里要提供一个小学生也能看懂的办法[8]

12+14+18+116+=12+12(12+14+18+116+)12(12+14+18+)=1212+14+18+=1\begin{aligned} \frac{1}{2}+\frac{1}{4}+\frac{1}{8}+\frac{1}{16}+\cdots &= \frac{1}{2}+\frac{1}{2}(\frac{1}{2}+\frac{1}{4}+\frac{1}{8}+\frac{1}{16}+\cdots) \\ \Rightarrow \frac{1}{2}(\frac{1}{2}+\frac{1}{4}+\frac{1}{8}+\cdots) &= \frac{1}{2} \\ \Rightarrow \frac{1}{2}+\frac{1}{4}+\frac{1}{8}+\cdots &= 1 \end{aligned}

当然,更聪明的读者也许会说:在空间上, 12,14,18,116,\frac{1}{2},\frac{1}{4},\frac{1}{8},\frac{1}{16},\cdots 这些距离都是从11m中分割出来的,而且除此之外也 没有剩下的 [9],那它们的总和自然也是11

显然, 无限的过程并不对应着无限的时间 。而且,这样算出的时间与一般方法并无二致。芝诺的错误,在于 人为的 将连续统进行了无限的划分,并错误的认为无限的任务必定不能在有限的时间内完成。

不过,我们的数学家又怎会止步于此,他们在此基础上提出了一种思想实验——“超级计算机”:这种计算机启动后0.5秒输出圆周率小数点后的第一位数,然后过0.25秒输出第二位数,之后再0.125秒输出第三位数,以此类推,那么一秒后我们可以得到圆周率的最后一位数。(尽管我们知道它没有最后一位)[10]

当然,在现实世界中,由于种种原因,这样的机器是不可能实现的,但这并不妨碍数学家们的想象它的运作。它从某个侧面揭示了数学的一种反常识现象。[11]但如果从实证的角度,这种“超级任务”不可完成,恰恰证明了芝诺这种将时间进行 人为划分 是无效的。[12]

芝诺的谬误,在现在看来是可笑的。但是在这条通往正确的荆棘之路上,第奥根尼、亚里士多德、黑格尔……大量的数学家哲学家或是误入歧途,或是倒在了求索之路上。与此同时,伴随着流数、级数等运算的深入研究,“无限”这个既抽象又形象的概念,也就需要一个逻辑上更切实的定义。

二、“瞬时是不是零?”——牛顿的尴尬

上节提到的芝诺其实是一个相当“高产”的哲学家,他一生曾巧妙地构建了四十多个悖论,其中,为了捍卫他老师巴门尼德关于“存在”不动、是“一”的学说[13]所提出的有关运动的四个悖论最为著名,上节讲的“追击悖论”便是当中的一个。而另一个著名悖论“飞矢不动”则更加凶猛,时日至今仍争论不断。

“飞矢不动”:

芝诺问他的学生:“一支射出的箭是动的还是不动的?”

“那还用说,当然是动的。”

“确实是这样,在每个人的眼里它都是动的。可是,这支箭在每一个瞬间里都有它的位置吗?”

“有的,老师。”

“在这一瞬间里,它占据的空间和它的体积一样吗?”

“有确定的位置,又占据着和自身体积一样大小的空间。”

“那么,在这一瞬间里,这支箭是动的,还是不动的?”

“不动的,老师”

“这一瞬间是不动的,那么其他瞬间呢?”

“也是不动的,老师”

“所以,射出去的箭是不动的?”

芝诺的论证中,有许多十分可疑的概念,而最可疑的是他对“ 不动 ”的阐述: 有确定的位置,又占据着和自身体积一样大小的空间 。表述十分拗口,而且仔细观察,这是有关运动的概念,却完全没有涉及时间。现在我们知道,在 运动 这个概念中时间是 必不可少的[14]很显然,如果失去时间,运动自然也就不复存在。而对任何一个瞬间,仅凭这一瞬间的空间状态其运动与否是无法判断的,只有这一瞬间 前后 物体的空间状态明晰了,我们才能判断它的运动状态。

然而,“瞬时速度”的横空出现让我们上面的说法又变得尴尬起来。原则上,我们只要知道某一刻的瞬时速度,它在这一刻的运动状态就几乎完全确定下来。[15]而瞬时速度是 瞬时的 ,它所讲的应该是 这一时刻 ,而非时间。因此,时间对运动状态判断的影响似乎又不那么重要了。

瞬时速度,这个概念也许诞生于伽利略对匀变速直线运动的研究,或者在更早的时候就有了雏形,但真正普适的计算方法,却是伴随着微积分的诞生与发展而产生的。

说起微积分,大家可能会想起牛顿与莱布尼兹的微积分创始人之争。事实上,微积分既非开始于他们,也非完成于他们。积分的概念上可追溯到古希腊的阿基米德,而导数(微分)的计算也在他们半个世纪前的开普勒时代就出现了。到17世纪,一批继承了伽利略和开普勒工作的科学家,关心着两个问题:①求切线的问题;②求曲线长度、曲面面积以及不规则物体体积的问题。而牛顿和莱布尼兹的伟大之处就在于指出了这两个问题的重要联系,即我们今天所说的牛顿-莱布尼兹公式。牛顿出于动力学研究的需要,在他的老师巴罗的工作的影响下,得到了这个重要的结果,但这个结果的广泛使用相当程度上应归功于莱布尼兹出色的形式符号。其实,巴罗在几何学的研究中已经揭示出了上面两个问题的联系,但他并未提出一般的导数与积分的概念,因而完全没有涉及运动学与动力学领域。而到了牛顿,他虽先于莱布尼兹得到这个结果,但却没有立即发表。之后,莱布尼兹在与物理学家惠更斯为一件外交事务交往时,在一个短的惊人的时间内学到了微分和积分这种新的数学概念,不久,他便独立于牛顿获得了这一结果,并立即发表了它。事后,崇拜牛顿的人与莱布尼兹的朋友发生了激烈的争执,前者毫无根据地指责莱布尼兹剽窃。随后,卷入这场争执的人越来越多,甚至发展成了一场英国科学家与欧洲大陆科学家之间历时两百多年的争执。这样的争执对科学发展是毫无意义的。特别,使用比较繁琐的牛顿的符号,并蔑视欧洲大陆莱布尼兹学派的工作,竟成为英国数学家爱国与忠于信仰的表现。这种陈腐的思想使得到了18世纪,欧洲大陆出现了伯努利、欧拉、拉格朗日以及拉普拉斯这样的数学大家时,英吉利海峡北面的不列颠岛上竟没有一个人的才华可以与他们相提并论的。事实上,不同的人从不同的问题出发,经历不同的思路,得到同一个重要的结果,这种“殊途同归”的现象在人类文明史上是屡见不鲜的。而那种追名逐利的做法却会给科学带来巨大伤害。

再回到瞬时速度,假如我们直接套用平均速度的算法显然是行不通的,因为一瞬间,时间是0,物体的位移也是0,而 00\frac{0}{0} 是无意义的。那么牛顿他们是怎么做的?[16]

我们知道,对于自由落体运动,其位移 ss 与时间 tt 的关系满足: s=12gt2s=\frac{1}{2}gt^{2}

给时间tt一个极小的增量 Δt\Delta t,显然从 ttt+Δtt+\Delta t 这段时间的平均速度为

v=ΔsΔt=12g(t+Δt)212g(t)2Δt=12g(2t+Δt)v=\frac{\Delta s}{\Delta t}=\frac{\frac{1}{2}g(t+\Delta t)^{2}-\frac{1}{2}g(t)^{2}}{\Delta t}=\frac{1}{2}g(2t+\Delta t)

略去 Δt\Delta t,即瞬时速度 v=gtv=gt

这也就是我们说自由落体是匀加速直线运动(速度随时间线性增加)的原因。

在这里,我们注意到一个重要的步骤: 略去 Δt\Delta t 。略去它,从本质上是令它 等于零 。牛顿对此解释称其为无限小增量,是一种 静止 的无穷小量,而莱布尼兹则认为它是高阶无穷小的误差,应当忽略。

很显然,这样的推理是不严密的, Δt\Delta t 一会儿不是零,一会儿又是零。另一方面,直觉和经验告诉人们运动的物体每一刻都有一个相对应的瞬时速度,而牛顿和莱布尼兹的做法确实可以求出相应的瞬时速度来,许多数学家和物理学家因而也承认了这种做法的有效性。

好景不长,1734年英国的哲学家神学家贝克莱发表了一本针对微积分基础的小册子《分析学家》,引起了数学界的轩然大波,诱发了我们所谓的“第二次数学危机”。这本小册子只有104页,却对微积分的基本概念,基本方法等全部内容提出了全面批评。

一方面,他批评了微积分当中许多基本概念如流数、瞬[17]、无穷小增量、初生量、消失量[18]等的模糊性。在他看来,这些重要的概念都是“隐晦的神秘物”,是“混乱与模糊”、“无理与荒谬”。对于瞬时速度,贝克莱的观点似乎与现在思想异曲同工——既然速度不能离开时间和空间,那么根本不能想象一个时间为零的瞬时速度。

另一方面,他指出了微积分基本方法的缺陷。称牛顿首先给xx一个增量,之后又令它“消失”(等于零),显然违背了背反律,所得流数实际上不过是0/0。对于消失量,他讥讽的诘问:“这些消失的增量究竟是什么呢?它们既不是有限量,又不是无限小,也不是零,难道我们不应该称它们为消失的鬼魂吗?”同时,他也攻击莱布尼兹的微分法,认为莱布尼兹依靠“忽略高级无穷小的误差”的做法,不过是“从错误的原理出发,通过错误的抵消,得出的不科学但是正确的结论。”

“在每一门其他科学中,人们用他们的原理证明他们的结论,而不是用结论来证明他们的原理。”

贝克莱主教的诘难,无疑是犀利的。他一针见血地指出了早期微积分发展时种种逻辑上的弊病,使微积分的基础问题得到了更大的重视。尽管如此,整个18世纪众多数学家弥补微积分漏洞的尝试都没能获得圆满的结果。分析学(微积分是其基础)就在这种浑浑噩噩的状态下不断发展。直至19世纪,柯西迈出了微积分走向严格化的关键一步,并由德国数学家魏尔斯特拉斯提出了完善的“ε-δ定义”,将微积分与实数紧密结合起来,最终实现“分析算术化”,使微积分建立在一个严谨的逻辑基础上,第二次数学危机也就此圆满解决。

三、“ ε-δ 的无穷小分析”——魏尔斯特拉斯的解释

在讲魏尔斯特拉斯的解释之前,我们先来谈谈两个数学的逻辑符号的意义:

逻辑算子“\forall”“\exists”。它们往往放在命题的前面,用于约束命题中的变量。

\forall”是全称量词,读作“对任意的……”,但它的意义应当是“对任意 给定的 ……”。比如一个命题,“xU,p(x)\forall x\in U, p(x)”,其中, xxUU 中的任一元素。但同时,在判定 p(x)p(x) 之前, xx 必须确定下来。此时,单独研究 p(x)p(x) 所用的是之前给定的 xx ,不能再更改。

\exists”是特称量词,读作“存在……”,它的意义比“\forall”要显然一些。但有一点值得注意:特称量词既不能确定满足条件的变量的个数,更无法得到满足条件的解。如果说全称命题是先给定 xx ,再考虑 p(x)p(x) 的话;对特称命题的判定则应先看 p(x)p(x) ,再考虑是否存在满足的 xx

从这里,可以看出,全称量词下的变量乍看之下是“运动”的,却也有静止的时候;特称量词下的变量,看起来固定,却又有些随意。这种辩证的关系贯穿着整个数学,尤其是数学分析。认识了这一点,才能正确的理解微积分的内涵。

有了之前的铺垫,下面便开始讲魏尔斯特拉斯的阐释。
首先,来看他关于函数极限的几条看起来比较吓人的定义[19]

1.假设函数 f(x)f(x) 的定义域是在实轴上并包含 (aA,a)(a,a+A)(a-A,a)\cup (a,a+A) 的集合(其中 AA 是某个允许的正数)。若

ε>0,0<δA,x(aδ,a)(a,a+δ),f(x)α<ε\forall \varepsilon>0, \exists 0< \delta\le A, \forall x\in (a-\delta,a)\cup (a,a+\delta), \vert f(x)-\alpha\vert < \varepsilon

则称函数 f(x)f(x)xax\to a趋于 (或 收敛于 )极限 α\alpha

也称函数 f(x)f(x)xax\to a有极限 α\alpha,记作 limxaf(x)=α\lim_{x\to a}{f(x)}=\alpha

2.假设函数 f(x)f(x) 的定义域是在实轴上并包含 (aA,a)(a-A,a) 的集合(其中 AA 是某个允许的正数)。若

ε>0,0<δA,x(aδ,a),f(x)α<ε\forall \varepsilon>0, \exists 0< \delta\le A, \forall x\in (a-\delta,a), \vert f(x)-\alpha\vert < \varepsilon

则称函数 f(x)f(x)xax\to a_{-}趋于 (或 收敛于 )极限 α\alpha

也称函数 f(x)f(x)xax\to a有左极限 α\alpha,记作 limxaf(x)=α\lim_{x\to a_{-}}{f(x)}=\alpha

3.假设函数 f(x)f(x) 的定义域是在实轴上并包含 (a,a+A)(a,a+A) 的集合(其中 AA 是某个允许的正数)。若

ε>0,0<δA,x(a,a+δ),f(x)α<ε\forall \varepsilon>0, \exists 0< \delta\le A, \forall x\in (a,a+\delta), \vert f(x)-\alpha\vert < \varepsilon

则称函数 f(x)f(x)xa+x\to a_{+}趋于 (或 收敛于 )极限 α\alpha

也称函数 f(x)f(x)xax\to a有右极限 α\alpha,记作 limxa+f(x)=α\lim_{x\to a_{+}}{f(x)}=\alpha

4.假设函数 f(x)f(x) 的定义域是在实轴上并包含 (aA,a)(a-A,a) 的集合(其中 AA 是某个允许的正数)。若

MR,0<δA,x(aδ,a),f(x)>M\forall M \in\mathbb{R}, \exists 0< \delta\le A, \forall x\in (a-\delta,a), f(x)>M

则称函数 f(x)f(x)xax\to a_{-}趋于 (或 发散于\infty

也称函数 f(x)f(x)xax\to a有左极限是无穷大,记作 limxaf(x)=\lim_{x\to a_{-}}{f(x)}=\infty

类似的,还有 右极限是无穷大

5.假设函数 f(x)f(x) 的定义域是在实轴上并包含 (aA,a)(a-A,a) 的集合(其中 AA 是某个允许的正数)。若

MR,0<δA,x(aδ,a),f(x)<M\forall M \in\mathbb{R}, \exists 0< \delta\le A, \forall x\in (a-\delta,a), f(x)< M

则称函数 f(x)f(x)xax\to a_{-}趋于 (或 发散于-\infty

也称函数 f(x)f(x)xax\to a有左极限是负无穷大,记作 limxaf(x)=\lim_{x\to a_{-}}{f(x)}=-\infty

类似的,还有 右极限是负无穷大

6.假设函数 f(x)f(x) 的定义域是在实轴上并包含 (A,+)(A,+\infty ) 的集合(其中 AA 是某个允许的正数)。若

ε>0,MA,x>M,f(x)α<ε\forall \varepsilon>0, \exists M\ge A, \forall x>M , \vert f(x)-\alpha\vert < \varepsilon

则称函数 f(x)f(x)x+x\to +\infty趋于 (或 发散于 )极限 α\alpha

也称函数 f(x)f(x)x+x\to +\infty有极限 α\alpha,记作 limx+f(x)=α\lim_{x\to +\infty}{f(x)}=\alpha

类似的,还有当 xx\to -\infty有极限 α\alpha

7.假设函数 f(x)f(x) 的定义域是在实轴上并包含 (A,+)(A,+\infty) 的集合(其中 AA 是某个允许的正数)。若

MR,LA,x>L,f(x)>M\forall M \in\mathbb{R}, \exists L\ge A, \forall x>L , f(x)>M

则称函数 f(x)f(x)x+x\to +\infty趋于 (或 发散于\infty

也称函数 f(x)f(x)x+x\to +\infty有极限 \infty,记作 limx+f(x)=\lim_{x\to +\infty}{f(x)}=\infty

类似的,还有当 xx\to -\infty有极限 \infty 的,当 x+x\to +\infty有极限 -\infty 的,当 xx\to -\infty有极限 -\infty

8.除此之外,还有当 xx 趋于某个值或无穷时函数 f(x)f(x) 没有极限的情况。

上面的概念看似复杂而且数目繁多,但其理念都是相似的。其中, 1 是最具有普遍性,也最利于我们加以阐明的。为了使论述更加形象,我们从一个具体的例子开始。

考虑函数 f(x)=x3+xxf(x)=\frac{x^{3}+x}{x}

显然,函数f(x)f(x)x=0x=0处没有定义,但 x0,f(x)=x2+1\forall x\ne 0, f(x)=x^{2}+1 。即 f(x)1=x2f(x)-1=x^{2} 。这样,我们只需把 xx 限制在0的 充分小的邻域内 ,这个差就可以小到 任何我们所希望的程度 。比如,

x=±110f(x)=1100x=±1100f(x)=110000\begin{aligned} x&=\pm\frac{1}{10} &{} f(x)&=\frac{1}{100}\\ x&=\pm\frac{1}{100} &{} f(x)&=\frac{1}{10000} \end{aligned}

等等。一般地,对于任何一个确定的正数 ε\varepsilon,无论它有多么小,只要我们控制xx与0的差小于 δ=ε\delta =\sqrt{\varepsilon} 的话,那么 f(x)f(x) 与1之间的差将小于 ε\varepsilon。因为

x<εf(x)1=x2<ε\vert x\vert < \sqrt{\varepsilon} \Rightarrow \vert f(x)-1\vert =\vert x^{2}\vert < \varepsilon

此时我们就称 limx0x3+xx=1\lim_{x\to 0}{\frac{x^{3}+x}{x}}=1

再让我们回到极限概念 1 ,第一句话实际是为了让求x=ax=a处的极限成为可能—— f(x)f(x) 要在 aa 的附近有定义。这个“附近”应当与 aa 无限的“近” [20],而它的半径 AA 可以任意的小。注意这个定义是挖去了“心” x=ax=a 的,但它并没有要求 f(x)f(x)aa 处没有定义。
事实上, f(a)f(a) 是否存在以及其值是多少对 f(x)f(x) 在该点的极限都没有影响。只有 f(x)f(x) 在该点附近的“趋势”才决定它的极限。

第二句话也就是定义的关键。首先,是“对于任意的正数ε\varepsilon”。注意,在这一步后, ε\varepsilon 必须给定,无论是100还是1/100或是别的什么,固定下来进入下一步后就不能改变。
然后,为了方便理解,我们先跳过“存在……”这个部分,因为 δ\delta 要根据后面来确定[21]。先看“对任意包含于 (aδ,a)(a,a+δ)(a-\delta ,a)\cup (a,a+\delta )xx”,当然,这里的 xx 同样要给定。但由于我们的 δ\delta 还“未定”,因此,我们更要留意 xx 的遍历性,即 xx 是可以 取遍 条件内的任何值的。
再到最后一个部分,即 f(x)f(x) 与某定值 α\alpha 之间的差可以小于之前给定的 ε\varepsilon。这时再往回看,如果定值 α\alpha 真是 f(x)f(x)aa 处的极限,那么我们总能找到一个合适的 δ\delta,使得任何一个包含于 (aδ,a)(a,a+δ)(a-\delta ,a)\cup (a,a+\delta)xx ,都能使最后一部分的论断成立。
最后,我们再考虑 ε\varepsilon 的任意性,你可以不断缩小 ε\varepsilon,但上述的论断始终成立。这样,定值 α\alpha 便是 f(x)f(x)aa 处的极限,否则,就不是。

需要注意的是,定值 α\alpha 的确定是先于这里面所有的步骤的,极限的定义实际上是一种判定定理,但如何求出它则有赖于我们的数学技巧。

还有一点,我们虽然通常把求极限的过程称为“趋于……”,但在 εδ\varepsilon-\delta 定义中,自变量的范围是被动的[22],它不以任何物理或几何意义去“趋于”一个极限 aa。然而这个词以及符号 \to 我们仍然保留,而且没有任何一个科学家需要或打算忽视这种表达所具有的启示性直观感受。
但当我们要验证或判定一个极限时,我们仍需应用 εδ\varepsilon-\delta 定义。至于这个定义是否很好的符合我们直观“动态”的趋近的观念,正如几何公理并不完美地提供了空间直观观念的描述[23],它的表述丢掉了一些直观认为是真实的东西,却让这些概念有了更合适更逻辑化的数学结构。

最后,我们再梳理一遍定义 1 的文字表述(省去前面有关函数定义域的要求):对于任意小的正数 ε\varepsilon,我们总能找到一个正数 δ\delta,使得任何在 (aδ,a)(a,a+δ)(a-\delta ,a)\cup (a,a+\delta ) 内的 xx,都能让 f(x)f(x) 与某定值 α\alpha 之间的差可以小于之前给定的 ε\varepsilon

阐明了最关键的定义 1 ,我们再来看看其它几个概念中需要注意的地方。

左极限与右极限实际上是极限的弱化,它们使求区间边界处的极限成为可能。但另一方面,在某点有左极限、右极限并不意味着一定有极限,只有该点左右极限相等时才有极限。

另外一个重要概念的就是我们分析中的“无穷”。通常,分析中的“无穷”不是一个 实在的 概念[24],而且往往要与其它成分结合起来使用。比如我们可以把极限的概念说成当自变量与 aa 相差一个无穷小量时,因变量与 α\alpha 的差也是一个无穷小量。这里,我们要注意前后两个“无穷小量”的意义是 不同的
当然,这种说法十分粗略,正如前面所说,牢记极限的标准概念才是研究科学应有的谨严态度(尽管如此,许多物理学家和工程师都喜欢用“无穷小量”、“微元”之类的表述)。
类似的,所谓“无穷大”在不同的地方意义也不同。用于自变量时是“存在某个值,当 xx 大于它,……”;用于因变量时是“对于任意某个给定值,(某条件下), f(x)f(x) 都比它大”。
同样,也有人把它简单地理解成“一个比任何其他数都要大的数”。显然,照这样理解,一个有限的数无论如何也加不到无限,这大概也是芝诺追龟问题的理由吧。[25]

理清了极限的概念,在谈导数之前,我们先来讲一下“连续”。

有了前面的极限的铺垫,连续也就很好定义了。

先说 f(x)f(x) 在(不在边界的)某一点 aa(附近)的连续性[26]

  1. 函数值 f(a)f(a) 存在;
  2. 极限 limxaf(x)\lim_{x\to a}{f(x)} 存在;
  3. f(a)=limxaf(x)f(a)=\lim_{x\to a}{f(x)}

以上三点都成立的话,我们就称f(x)f(x)aa处连续。

如果函数的定义域连通[27]且函数在定义域内的每一点连续,我们则称函数f(x)f(x)连续。

了解了前面极限的几何意义,我们很容易看出,连续的定义也符合我们直观上对连续的认识。而如果我们从连续的角度看的话,极限在很多时候是把一些不连续的函数扩张成一个连续的函数,譬如之前例举的函数 f(x)=x3+xxf(x)=\frac{x^{3}+x}{x} ,如果我们令一个新函数

f(x)={f(x),if x01,if x=0\overline{f}(x)= \begin{cases} f(x),& \text{if}\ x\neq 0 \\ 1, & \text{if}\ x=0 \end{cases}

那么新函数在原来函数的定义域内与原来的函数完全是相同的。但与原来函数不同的是,它成了 R\mathbb{R} 上的一个连续函数。这个过程我们叫“保证函数连续性的延拓”[28],它合理地将函数的范围扩大了,同时函数原有的部分也没有改变。只要我们承认函数的连续性,这样的延拓就是有意义的。

最后,我们再来谈谈分析中最基础的,也是曾困扰了数学界许多年的导数(微分)。

在抛弃了无穷小量的现在[29],借助极限,我们很容易将导数的概念建立在一个严谨的逻辑基础上面。

函数 f(x)f(x) 在某点 aa 处的导数定义为[30]

f(a)=limΔx0f(a+Δx)f(a)Δxf'(a)=\lim_{\Delta x\to 0}{\frac{f(a+\Delta x)-f(a)}{\Delta x}}

至于所谓的瞬时速度不过是位移对时间的导数 v=limΔt0ΔsΔt\vec v =\lim_{\Delta t\to 0}{\frac{\overrightarrow{\Delta s}}{\Delta t}} ,由极限的定义我们知道瞬时速度绝不是单属于某一 时刻 的性质,而与这一时刻 前后 的状态息息相关。
那么瞬时速度本身的涵义,则是 ttt+Δtt+\Delta t(或 t+Δtt+\Delta tttΔt<0\Delta t<0 时)的平均速度 v(Δt)v(\Delta t)Δt=0\Delta t=0 处进行延拓的结果,而只要我们相信时空的连续性[31],瞬时速度的内涵也无可置疑。
有了瞬时速度,配合我们所谓的“无穷小分析”,大量的动力学问题也才有了解决的可能。

在现代科学中,“无穷小分析”已经渗透到各个领域,几乎无所不在。本文主要介绍的不过是无穷小分析中基础中的基础——极限与导数,而关于它们的认识却困扰了数学界百余年。一切正如马克思所说:“在科学上没有平坦的大道,只有不畏劳苦沿着陡峭山路攀登的人,才有希望达到光辉的顶点!”


参考资料:

[1]【美】莫里斯·克莱因. 古今数学思想.第1册. 张理京,张锦炎,江泽涵译. 上海:上海科学技术出版社. 2002
[2]【美】莫里斯·克莱因. 古今数学思想.第2册. 朱学贤等译. 上海:上海科学技术出版社. 2002
[3]【美】莫里斯·克莱因. 古今数学思想.第4册. 邓东皋等译. 上海:上海科学技术出版社. 2002
[4] 韩雪涛. 从惊讶到思考:数学悖论奇景. 长沙:湖南科学技术出版社. 2007
[5] 陈天权. 数学分析讲义·第一册. 北京:北京大学出版社. 2009
[6]【美】R·柯朗,H·罗宾. 什么是数学:对思想和方法的基本研究. I·斯图尔特修订. 左平,张饴慈译. 上海:复旦大学出版社. 2011


(部分图片来自网络)



  1. 这些主要是给知识水平在高中以下的读者参考的:
    集合 : 朴素地, 集合 就是一些东西的总体(这些东西中不应有重复( 内涵外延 都相同),比如: {1,1}\{1,1\} 这种记法是错误的,但 {(1,0),1}\{(1,0),1\} 是合法的)。总体中的东西被称为这个集合的 元素 (如:“xx 是集合 AA 中的元素”,记作“xAx\in A”)。若两个集合的每个元素都相同,则这两个集合 相等 。如果一个集合的全部元素都属于另一个集合,则该集合称之为这另一个集合的 子集 (如:集 AA 是集 BB 的子集,记作“ABA\subseteq B”)。两个集合的 交集 ,即两个集合公共元素组成的集合(如:集 AA 与集 BB 的交集,记作“ABA\cap B”)。两个集合的 并集 ,即这两个集合所有元素组成的集合(如:集 AA 与集 BB 的并集,记作“ABA\cup B”)。元素都是数的集合叫 数集 ,本文中出现的集合都是数集。本文出现了的几个数集符号:自然数集 N\mathbb{N}、正整数集 N+\mathbb{N}_{+}、实数集 R\mathbb{R}
    区间 :集合的一种表现形式,都是实数集 R\mathbb{R} 的子集。(a,b)(a,b) 表示满足 a<x<ba< x< b 的所有 xx 组成的集合;[a,b)[a,b) 表示满足 ax<ba≤ x< b的所有 xx 组成的集合;(a,b](a,b] 表示满足 a<xba< x≤ b 的所有 xx 组成的集合;[a,b][a,b] 表示满足 axba≤ x≤ b 的所有 xx 组成的集合。
    函数 :在本文中是指两个 数集 之间的对应关系,它使得其中一个数集的任何一个元素在另一个数集中都有 唯一确定 的一个元素与之对应。比如一个集 AA 到集 BB 的函数 f:ABf:A\to B 是使得任何 xAx\in A,都存在 yBy\in B,满足 y=f(x)y=f(x) 的对应关系,这里,我们称集 AA定义域 ,集 BB值域xx自变量yy因变量
    分析:与几何、代数等并列的数学主要分支之一。微积分是其基础。
    矢量:区别于标量(数量),它既有大小,又有方向,加减运算遵循平行四边形定则。 ↩︎

  2. 芝诺原始的悖论讲的是阿喀琉斯追龟(阿喀琉斯是古希腊善跑的勇士),但问题的实质是一样的。另外,实际生活中的兔子要更快,乌龟要更慢。 ↩︎

  3. 这个问题的数学解答:
    按芝诺的分法,记第 nn 次兔子走过的路程为 ana_{n} (m),所花的时间为 tnt_{n} (s),同时乌龟走过的路程为 bnb_{n} (m),并记nn次兔子走过的总距离 An=k=1nakA_{n}=\sum_{k=1}^{n} a_{k} (m),所花的总时间 Tn=k=1ntkT_{n}=\sum_{k=1}^{n} t_{k} ,这段时间乌龟走过的总路程 Bn=k=1nbkB_{n}=\sum_{k=1}^{n} b_{k}
    由题设, a1=92a_{1}=\dfrac{9}{2}tn=an10t_{n}=\frac{a_{n}}{10}bn=tnb_{n}=t_{n} ,即bn=an10b_{n}=\frac{a_{n}}{10}
    并且, an+1=BnAn+92a_{n+1}=\frac{B_{n}-A_{n}+9}{2}
    bn=an10b_{n}=\frac{a_{n}}{10} ,故Bn=An10B_{n}=\frac{A_{n}}{10} ,因而, an+1=929An20a_{n+1}=\frac{9}{2}-\frac{9 A_{n}}{20} ……①
    同理, an+2=929An+120a_{n+2}=\frac{9}{2}-\frac{9 A_{n+1}}{20} ……②
    ②-①,得 an+2=1120an+1,(n1)a_{n+2}=\frac{11}{20}a_{n+1} ,(n\ge 1)
    又由①, a2=929a120=921120a_{2}=\frac{9}{2}-\frac{9 a_{1}}{20}=\frac{9}{2}\cdot\frac{11}{20}
    an=92(1120)n1a_{n}=\frac{9}{2}(\frac{11}{20})^{n-1}bn=920(1120)n1b_{n}=\frac{9}{20}(\frac{11}{20})^{n-1}tn=920(1120)n1t_{n}=\frac{9}{20}(\frac{11}{20})^{n-1}
    An=10(1(1120)n)A_{n}=10(1-(\frac{11}{20})^{n})Bn=1(1120)nB_{n}=1-(\frac{11}{20})^{n}Tn=1(1120)nT_{n}=1-(\frac{11}{20})^{n}
    龟兔间距离 dn=BnAn+9=(1120)nd_{n}=B_{n}-A_{n}+9=(\frac{11}{20})^{n} ,当nn\to \inftydn0d_{n}\to 0
    故追击时间 T=limnTn=1T=\lim_{n\to \infty}{T_{n}}=1 ↩︎

  4. 这种说法并不准确。事实上,目前的量子力学、量子宇宙学都并没有否认时空的连续性,只是认为小于一定尺度(普朗克长度/普朗克时间)内发生的物理过程 没有意义↩︎ ↩︎

  5. 后文中我们会知道,无限在分析中并不是一个 实在 的量,定义上无限即 不可达到 ,这大概就是芝诺认为追及是不可能的的原因。(可参见[25:1]。) ↩︎

  6. 事实上,这个问题更准确的认识应当是芝诺 人为划分芝诺时 与我们实际中的 固有时 之间转化的差异。在这里,芝诺时的全部只对应于固有时的[0,1)[0,1)(单位:秒)这个区间。因此,芝诺所说的“不可达到”,实际上是芝诺时的 划分意义 上的不可达到,因为他的时间“永远”也走不到1秒。 ↩︎ ↩︎ ↩︎ ↩︎

  7. 这个问题实际上是芝诺的另一个经典悖论——“二分法悖论”。但两者的解决办法相同。 ↩︎

  8. 直接这样处理并不严谨,因为在各种级数中,只有绝对收敛的级数才满足加法结合律。 ↩︎

  9. “没有剩下”即默认了乌龟能够抵达目的地,这可能是有违芝诺本意的。 ↩︎

  10. 这个问题也可以套用[6:1]中的解决办法,即“超级计算机”的输出也是按芝诺时来度量的,电脑的输出规则实际是一个关于时间的函数,但它的定义域只在 [0,1)[0,1) (单位:秒)这个区间内, t=1st=1s 时的情况对它来说是 未定义的↩︎ ↩︎ ↩︎

  11. “反常识现象”是指超穷基数的大小比较。详情见下一篇《“潜无限”与“实无限”》。 ↩︎

  12. “无效”的原因如[6:2][10:1]中所述。 ↩︎

  13. 巴门尼德的学说认为存在是永恒的,是一,连续不可分,可以被思想,以及感性世界的具体事物是非存在,是假象,等等。 ↩︎

  14. 现在,物理学界更多认为有运动(尤其是周期运动)才有时间(或者时间的度量),完全静态的宇宙中不存在时间。 ↩︎

  15. “几乎完全”是因为瞬时速度为零时,如果加速度不为零,物体也不处于静止状态。 ↩︎

  16. 严格来说,这是当时一些数学家的做法,牛顿的方法形式上更复杂,但并没有本质的差别。 ↩︎

  17. “瞬”是牛顿早期使用的不可分增量,而“流数”则是在处理连续变量时使用的。 ↩︎

  18. “初生量”的概念确实不清不楚,大概是自变量与因变量的增量 Δt\Delta t 以及 Δs\Delta s;而“消失量”是指它们两个正在“消失”时的量(牛顿的解释)。 ↩︎

  19. 这个定义最早是由柯西与1820年左右提出的,但准确的数学符号表示还是由魏尔斯特拉斯给出的。 ↩︎

  20. 任意地 给定误差,范围内总有点与 aa 的距离小于该误差。 ↩︎

  21. 从整体上看,如果 α\alpha 是极限的话,应当有一个适当的函数 g(x)g(x) 使得 δ\delta 最大不超过 g(ε)g(\varepsilon) 即可,就像例函数中的 δ=ε\delta =\sqrt{\varepsilon} 一样。从这个意义上讲, δ\delta 也算是“确定”的。 ↩︎

  22. 极限概念的一个关键点是,我们是靠控制因变量的范围来控制自变量的。这和我们平时的认知可能有些不一样。而且,误差 ε\varepsilon 虽然是任意给定的,但给定多少是没有先后的,既不是从大到小,也不是从小到大,甚至没有任何顺序可言。给定 ε\varepsilon 的值这一步是非时间的,我们可以想象成有无数个并列的进程,所有进程的第一步都给定了一个正数,每个进程给出的正数各不相同,且所有进程给出的正数将每一个正数都覆盖到了,然后,它们各自再走向下一步。这一点与我们直观上的“趋于”确实相差很大。 ↩︎

  23. 没有大小的点、没有宽度的线、无限延伸的直线……这些概念在现实中都是不存在的,是从现实事物中抽象出的理想元素,但对于我们研究现实确实起到了很大的作用。 ↩︎

  24. 尽管如此,在勒贝格积分中我们引入了包含无穷大元素 ±{\pm\infty } 的扩张了的实数集 R\overline{\mathbb{R}},在非标准分析中我们引入了含有无穷小数和无穷大数的超实数系 R\mathbb{R}*,在集论中我们甚至有可以比较大小的“无限”——超穷基数。它们都是有明确数学意义的概念。 ↩︎ ↩︎

  25. 事实上,极限也不能直接帮我们解决这个问题。虽然,无穷级数 k=112k=1\sum_{k=1}^{\infty}\frac{1}{2^{k}}=1 。但根据极限的定义,这个级数的真正含义应当是 ε>0,NN+,nN,k=1n12k1<ε\forall \varepsilon>0, \exists N \in \mathbb{N}_{+}, \forall n\ge N, \vert \sum _{k=1}^{n} \frac{1}{2^{k}} -1 \vert < \varepsilon ,并不允许“真正的”无限出现。这似乎让我们第一节中的解决办法难以在逻辑上站住脚。另一方面,这解释了[6:3][10:2]中的全部“芝诺时”只对应与我们固有时的[0,1)[0,1) (单位:秒)的原因。 ↩︎ ↩︎

  26. 在边界时,我们有左连续与右连续,分别对应于左极限与右极限的情况。 ↩︎

  27. 这个条件简单的说就是函数的定义域应该可以表示成一个区间。连通性,比较形象的说法是集合中的任何两点可以用一条每一点都属于该集合的线连接起来(这实际上是道路连通,在这里没有太多差别)。 ↩︎

  28. 事实上,这只是延拓的一种方法,只适用于有限个可去间断点的情况。更复杂的情况我们需要限制更多条件(可微、光滑之类的),而且延拓的结果可能不止一种。 ↩︎

  29. [24:1]所述,于1960年左右发展起来的非标准分析用完美的逻辑使曾经不光彩“无穷小”重新焕发生机。唯一的缺陷是它所使用的数理逻辑方法太过艰深,以致难以普及。 ↩︎

  30. 在现代分析中,导数(微分)不再是一个数,而是一个线性映射,是对原有函数的线性近似。 ↩︎

  31. [4:1]↩︎

评论