初学高等数学时, 级数在课本中出现的时候不免让人觉得突兀。早在小学, 课本会以”根据前5个数, 小朋友们来猜猜下一个是什么数”的形式让人接触数列, 而大学课程中则将级数作为无限项数列的方式引入高等数学概念, 为什么它会和实分析、微分方程等内容被一起塞进《高等数学》中呢?
级数定义
众所周知, 无限数列 \(\{u\}=u_1,u_2,u_3,…,u_n,…\) 中各项的累加和 \(\sum_{i=1}^{\infty}{u_i}=u_1+u_2+u_3+…+u_n+…\) 被称为常数项级数, 其中\(u_n\)被称为一般项, 前\(n\)项和 \(s_n=\sum_{i=1}^{n}{u_i}\)为部分和。而在区间\(I\)上函数列 \(\{f_n(x)\}=f_1(x),f_2(x),f_3(x),…,f_n(x),…\) 其累计和 \(\sum_{i=1}^{\infty}{f_i(x)}=f_1(x)+f_2(x)+f_3(x)+…+f_n(x)+…\) 则是函数项级数。
函数项级数的每一项所在的项数唯一地决定了其解析式, 当函数值确定, 函数项级数就退化为了常数项级数。因此只要给出项数, 就能根据通项唯一地确定这一项的解析式。常见的几种常数项级数如下:
- 算数级数(又称等差级数): 每一项都是由前一项加上一个常数\(d\)构成的序列, 即: $$ \sum_{n=1}^{\infty}{u_1+(n-1)d}=u_1+u_1+d+u_1+2d+…+u_1+(n-1)d+…$$
- 几何级数(又称等比级数): 每一项都是由前一项乘以一个常数\(q\)构成的序列, 即: $$ \sum_{n=0}^{\infty}{u_1q^n}=u_1+u_1q+u_1q^2+…+u_1q^n+…$$
- p-级数: 各项以项数\(n\)为底, 指数为\(-p\)的指数构成的序列, 即: $$\sum_{n=1}^{\infty}{\frac{1}{n^p}}=\frac{1}{1^p}+\frac{1}{2^p}+…+\frac{1}{n^p}+… $$
- 调和级数(Harmonic series): 它是\(p=1\)时的p-级数: $$\sum_{n=1}^{\infty}{\frac{1}{n}}=\frac{1}{1}+\frac{1}{2}+…+\frac{1}{n}+… $$
- 交错调和级数: 符号交错变化的调和级数, 其条件收敛于\(ln2\): $$\sum_{n=1}^{\infty}{\frac{{(-1)}^{n+1}}{n}}=\frac{1}{1}-\frac{1}{2}+\frac{1}{3}…+\frac{{(-1)}^{n+1}}{n}+… $$
- 格兰迪级数(Grandi’s series): $$\sum_{n=0}^{\infty}{{(-1)}^n}=1+(-1)+1+… $$
- 莱布尼兹级数(Leibniz series): $$\frac{\pi}{4} = \sum_{n=0}^{\infty}{\frac{{(-1)}^n}{2n+1}} $$
级数主要关注的是级数的敛散性问题与求和——即求极限问题, 由于整个微积分或者说实分析的根本目的就是通过直接研究函数, 来研究函数的行为; 但级数则使用逼近的方法来研究函数, 但纯粹数值逼近, 得到的只是数值结果, 对于要求了解函数的解析性质这一目的并没有直接的帮助, 而级数可以做到用解析的形式来逼近函数, 即利用比较简单的函数形式逼近比较复杂的函数。而通过加法运算来控制逼近的过程, 就是无穷级数思想的出发点。如果级数\(\sum_{n=1}^{\infty}{u_n}\)中的通项为任意实数, 那么级数\(\sum_{n=1}^{\infty}{u_n}\)就可称为任意项级数。 将任意项级数通项\(u_n\)取绝对值, 则会得到正项级数 \(\sum_{n=1}^{\infty}{|u_n|} =|u_1|+|u_2|+|u_3|+…+|u_n|+… \)。而交错级数也是一种任意项级数: \(\sum_{n=0}^{\infty}{{(-1)}^n a_n}\), 其中所有的\(a_n\)非负, 格兰迪级数是\(a_n=1\)时的交错级数特例。当通项均为复数时的无穷级数, 则是复数项级数, 其本质是数项级数在复数中的推广。由于幂函数可视为最为简单的初等函数, 它能够轻松构建出我们需要的多项式, 考虑到研究级数的最终目的, 就是希望运用级数这种无穷和式的形式来逼近更为复杂的函数, 因此幂级数——即幂函数的函数项级数就成为了研究级数的一个强力的基本工具, 其形式为 \(\sum_{n=0}^{\infty}{a_n x^n} =a_0+a_1 x+a_2 x^2+…+a_n x^n+… \), 式中的常数\(a_0, a_1,…,a_n,…\)被称为幂级数的系数。同样的, 有着形式为\( \frac{a_0}{2}+ \sum_{n=1}^{\infty} (a_n cosnx+ b_n sinnx) \)的级数则被称为三角级数, 可利用三角函数系的正交性消去级数的交叉项来简化形式。
严格的级数定义
\((A, \circ)\)是个交换群, 对于定义在\(A\)上的序列 \({\{a_i \in A\}}_{i \in \mathbb{N}}\), 存在唯一的序列 \({\{s_n \in A\}}_{n \in \mathbb{N}}\), 满足:
- \(s_1=a_1\)
- 对所有正整数\(n \in \mathbb{N}\), \(s_{n+1}=s_n \circ a_{n+1}\)
则这个唯一存在的序列被称为\({\{a_i \in A\}}_{i \in \mathbb{N}}\)的级数(series)。其中的交换群即是常常提到的阿贝尔群, 它表示群中的二元运算满足交换律。具体来说, 集合\(G\)和二元运算\(\circ\)满足了以下四个性质便可称为交换群\((G, \circ)\):
- 结合律: 对 \(g_1, g_2, g_3 \in G\), 有: \((g_1 \circ g_2) \circ g_3 = g_1 \circ (g_2 \circ g_3) \)
- 交换律: 对 \(g_1, g_2 \in G\), 有: \(g_1 \circ g_2 = g_2 \circ g_1 \)
- 存在左单位元: 存在 \(e \in G\), 对所有\(g \in G\), 有: \(e \circ g= g\)
- 存在左逆元: 存在 \(e \in G\) 和 \(\gamma \in G\), 对所有\(g \in G\), 有: \(\gamma \circ g= e\)
级数审敛法
研究级数时, 首先会考虑的其实时级数和是否存在的问题, 然后才会去考虑困难得多的级数求和问题。而研究级数是否收敛的办法便被称为级数审敛法。对于常数项级数, 如果\(n \rightarrow \infty\)时, 部分和数列\(\{S_n\}\)极限存在, 即 $$ \lim_{n \to \infty}S_n =c , c \text{为常数}$$, 则称级数收敛, 反之则称该级数发散。若对于固定的\(x_0 \in I\), 常数项级数\(\sum_{n=1}^{\infty}{u_n(x_0)}\)收敛, 则\(x_0\)为\(\sum_{n=1}^{\infty}{u_n(x_0)}\)的收敛点, 反之则为发散点, 收敛点全体构成的集合\(D\)称为\(\sum_{n=1}^{\infty}{u_n(x_0)}\)的收敛域。在收敛域\(D\)上的每个\(x\), 均有对应的数项级数\(\sum_{n=1}^{\infty}{u_n(x)}\), 记其和为\(S(x)\), 将该函数 $$S(x) = \sum_{n=1}^{\infty}{u_n(x)}, x \in D $$ 称为\(\sum_{n=1}^{\infty}{u_n(x)}\)的和函数。其和函数也可以定义为部分和函数序列的极限, 部分和函数即: $$S_n(x) = \sum_{k=1}^{n}{u_k(x)}, x \in I, n=1,2,… $$。\(S(x)\)和\(S_n(x)\)的差被称为在收敛域上函数项级数的余项, 记为\(r_n(x) = S(x) – S_n(x) = \sum_{k=n+1}^{\infty}{u_k (x)}\), 且有\( \lim_{n \to \infty} r_n(x) = 0\)。而判定级数收敛的基本定理是柯西收敛原理:
柯西收敛原理
对于数项级数来说, 级数 \(\sum_{n=1}^{\infty}{u_n}\) 收敛的充要条件是, 对任意的 \(\varepsilon > 0\), 存在正整数 \(N\), 使得当 \(n>N\) 时, 对任意的正整数 \(p \in \mathbb{N}^+\), 总有$$ \left| \sum_{k=n+1}^{n+p}{u_k} \right| <\varepsilon $$, 即是对 \(\forall \varepsilon > 0\), 存在正整数 \(N\), 使得对任意两个 \(m>n>N\)总是有: $$ \left| S_m-S_n \right| < \varepsilon $$
收敛的级数有如下几条基本性质:
- 级数乘以不为零的常数后敛散性不变: 如果级数\(\sum_{n=1}^{\infty}{u_n}\)收敛于和\(s\), 则级数\(\sum_{n=1}^{\infty}{ku_n}\)收敛于和\(ks\)。
- 两个收敛级数和逐项相加或相减: 如果\(\sum_{n=1}^{\infty}{u_n}\)和\(\sum_{n=1}^{\infty}{v_n}\)收敛于\(s\)和\(\sigma\), 级数\(\sum_{n=1}^{\infty}{(u_n \pm v_n)}\)收敛于和\(s \pm \sigma \)。
- 在级数中删减或者改变有限项, 不会改变级数的敛散性。
- 如果\(\sum_{n=1}^{\infty}{u_n}\)收敛, 则对级数项任意加括号后的级数仍收敛且收敛和不变。如果加括号后的级数发散则原级数也发散。
- 如果\(\sum_{n=1}^{\infty}{u_n}\)收敛, 则其一般项\(u_n\)趋于零, 即\(\lim_{n \to \infty}{u_n} =0 \), 该性质为级数收敛的必要条件。
此外, 收敛的正项级数其幂平均也是收敛的:
幂平均收敛
若正项级数 \(\sum_{n=1}^{\infty}{u_n}\)和 \(\sum_{n=1}^{\infty}{v_n}\)收敛, 则其任意幂平均: $${(\frac{u_n^p+v_n^p}{2})}^{\frac{1}{p}}, \forall p \in \bar{\mathbb{R}}$$ 都收敛, 进而 $$\sum_{n=1}^{\infty}{\sqrt[p]{u_n^p+v_n^p}}$$ 收敛, 因为: $$ min\{u_n,v_n \} \leq M_p(u_n,v_n) = {(\frac{u_n^p+v_n^p}{2})}^{\frac{1}{p}} \leq max\{u_n,v_n \} $$, 而其中 $$min\{u_n,v_n \}=\frac{u_n+v_n}{2} – \frac{|u_n-v_n|}{2} ,max\{u_n,v_n \}=\frac{u_n+v_n}{2} + \frac{|u_n-v_n|}{2}$$, 两侧的 \(min\{u_n,v_n \}\)和\(max\{u_n,v_n \}\) 显然收敛, 于是两级数的任意幂平均收敛。
一般的幂级数则因为收敛域是一个区间, 因此针对这个区间有个著名的阿贝尔定理:
阿贝尔定理(Abel定理)
\(\sum_{n=0}^{\infty}{a_n {x_0}^n} \) 收敛且 \( x_0 \neq 0 \)时, \( \exists x \in \{ x| |x|<|x_0|\} \), 使得 \(\sum_{n=0}^{\infty}{a_n {x_0}^n} \) 绝对收敛。可以推知:
- 若 \(\sum_{n=0}^{\infty}{a_n x^n}\) 在 \(x=x_1 \neq 0 \) 处收敛, 则对于 \(|x| < |x_1| \), \(\sum_{n=0}^{\infty}{a_n x^n}\) 绝对收敛。
- 若 \(\sum_{n=0}^{\infty}{a_n x^n}\) 在 \(x=x_1 \neq 0 \) 处发散, 则对于 \(|x| > |x_1| \), \(\sum_{n=0}^{\infty}{a_n x^n}\) 发散。
(可展开)定理可以这样证明
由于级数\(\sum_{n=0}^{\infty}{a_n x^n}\)收敛必有界, 因此\( \exists M \in \mathbb{N}^+ \), 使得\(|a_n {x_0}^n| < M\), 于是有$$|a_n {x_0}^n| \leq \left| a_n {x_0}^n \frac{x^n}{{x_0}^n} \right| \leq |a_n {x_0}^n| \left| \frac{x^n}{{x_0}^n} \right| \leq |a_n {x_0}^n| {\left| \frac{x}{x_0} \right|}^n \leq M {\left| \frac{x}{x_0} \right|}^n $$, 注意到\(\sum_{n=0}^{\infty}{M {\left| \frac{x}{x_0} \right|}^n}\)收敛, 易推知\(\sum_{n=0}^{\infty}{|a_n x^n|}\)收敛, 定理得证。
因此如果幂级数 \(\sum_{n=0}^{\infty}{a_n x^n}\) 不仅收敛于0点或整个数轴, 那么必存在一个数\(R, R>0\), 使得:
- 当 \(|x|< R\) 时, 幂级数绝对收敛。
- 当 \(|x|>R\) 时, 幂级数发散。
这个 \(R\) 被称为幂级数 \(\sum_{n=0}^{\infty}{a_n x^n}\) 的收敛半径, 其开区间 \((-R, R)\) 是幂级数的收敛区间, 当确定了收敛区间端点的收敛性后, 包含端点的收敛区间就是幂级数的收敛域。同时有定理:
柯西-阿达马(Cauchy-Hadamard)定理
幂级数 \(\sum_{n=0}^{\infty}{a_n x^n}\) 的系数满足 \(\lim_{n \to \infty}{\sqrt[n]{|a_n|}} =A\), 且有: $$ R=\begin{cases} +\infty, A=0 \\ \frac{1}{A}, A \in (0, +\infty) \\ 0, A=+\infty \end{cases}$$, 则幂级数 \(\sum_{n=0}^{\infty}{a_n x^n}\) 在 \(|x| > R\) 时绝对收敛, 在 \(|x| < R\) 时发散, 且收敛半径为 \(R\)。
幂级数的和函数有如下三条性质:
- 和函数连续性: 幂级数 \(\sum_{n=0}^{\infty}{a_n x^n}\) 的和函数 \(s(x)\) 在其收敛域 \(I\) 上连续。
- 逐项可积性: 幂级数 \(\sum_{n=0}^{\infty}{a_n x^n}\) 的和函数 \(s(x)\) 在其收敛域 \(I\) 上可积, 且有逐项积分公式: $$ \begin{aligned} \int_{0}^{x} s(x) dx = \int_{0}^{x} \left[ \sum_{n=0}^{\infty} a_n x^n \right] dx = \sum_{n=0}^{\infty} \int_{0}^{x} a_n x^n dx = \sum_{n=0}^{\infty} \frac{a_n}{n+1} x^{n+1}, x \in I \end{aligned}$$, 积分后幂级数收敛半径不变。
- 逐项可导性: 幂级数 \(\sum_{n=0}^{\infty}{a_n x^n}\) 的和函数 \(s(x)\) 其收敛区间 \((-R,R)\) 内可导, 且有逐项求导公式: $$ \begin{aligned} s'(x) dx = ( \sum_{n=0}^{\infty} a_n x^n )’ = \sum_{n=0}^{\infty}(a_n x^n )’ = \sum_{n=0}^{\infty}n a_n x^{n-1}, |x| < R \end{aligned}$$, 求导后幂级数收敛半径不变。
正项级数的判别法
正项级数 \(\sum_{n=1}^{\infty}{a_n}\) 收敛的充要条件是其部分和数列\(\{s_n\}\)有界。基于收敛的充要条件和基本概念, 正项级数拥有如下集中的审敛法:
比较判别法
比较判别法主要还是在利用p-级数或几何级数的收敛性等常用级数的敛散性结论来判断未知级数的敛散性。一般用:
- 级数 \(\sum_{n=1}^{\infty}{\frac{1}{n^p}}\) 在 \(p>1\) 时级数收敛, 在 \(p \leq 1\) 时级数发散。
- 级数 \(\sum_{n=0}^{\infty}{a{q^n}}, a \neq 0 \) 在 \(|q|<1\) 时级数收敛, 在 \(|q| \geq 1\) 时级数发散。
- 级数 \(\sum_{n=0}^{\infty}{n^\alpha} \) 在 \(|\alpha|<1\) 时级数收敛, 在 \(|\alpha| \geq 1\) 时级数发散。
已知以上结论后, 对于正项级数 \(\sum_{n=1}^{\infty}{u_n}\)和 \(\sum_{n=1}^{\infty}{v_n}\), 如果存在\(N \in \mathbb{N}^+\), 使得当\(n > N\)时有\(u_n \geq v_n\), 则:
- 若\(\sum_{n=1}^{\infty}{v_n}\)收敛, 那么\(\sum_{n=1}^{\infty}{u_n}\)也收敛。
- 若\(\sum_{n=1}^{\infty}{u_n}\)发散, 那么\(\sum_{n=1}^{\infty}{v_n}\)也发散。
这是比较判别法的直接形式, 而其极限形式为: 对于正项级数 \(\sum_{n=1}^{\infty}{u_n}\)和通项非零的正项级数 \(\sum_{n=1}^{\infty}{v_n}\), 如果有$$\lim_{n \to \infty}{\frac{u_n}{v_n}=k}$$, 则在 \(0 < k <+\infty \) 时, \(\sum_{n=1}^{\infty}{v_n}\)和\(\sum_{n=1}^{\infty}{u_n}\)同敛散。
其比值形式为: 对于正项级数 \(\sum_{n=1}^{\infty}{u_n}\)和 \(\sum_{n=1}^{\infty}{v_n}\), 如果存在\(N \in \mathbb{N}^+\), 使得当\(n > N\)时有$$\frac{u_{n+1}}{u_n} \leq \frac{v_{n+1}}{v_n} $$, 则
- 若\(\sum_{n=1}^{\infty}{v_n}\)收敛, 那么\(\sum_{n=1}^{\infty}{u_n}\)也收敛。
- 若\(\sum_{n=1}^{\infty}{u_n}\)发散, 那么\(\sum_{n=1}^{\infty}{v_n}\)也发散。
根值判别法
又称柯西(Cauchy)判别法, 其内容为: 对于正项级数 \(\sum_{n=1}^{\infty}{u_n}\) , 考察其$$\limsup_{n \to \infty}{\sqrt[n]{u_n}} = l $$
- 在\(0 \leq l < 1\) 时级数收敛。
- 在 \(1 < l \leq +\infty\) 时级数发散。
比值判别法
比值判别法又称检比法, 它会把正项级数敛散性判别问题转换成求极限的问题, 利用\(\frac{a_n}{a_{n+1}}\)的极限行为来判断级数收敛或发散。使用比值判别法要求当\(n\)增大时通项\(a_n\)要有单调性, 否则极限就不会存在, 此时判别法便会失效:
- 拉贝(Raabe)判别法: $$\lim_{n \to \infty}{n(\left| \frac{a_n}{a_{n+1}} \right| -1)} =k$$, 当\(k>1\), 级数绝对收敛; \(k<1\), 级数\(\sum_{n=1}^{\infty}{ | a_n | }\)发散。
- 达朗贝尔(d’ Alembert)判别法: $$\lim_{n \to \infty}{\left| \frac{a_n}{a_{n+1}} \right|} =k$$, 当\(k>1\), 级数绝对收敛; \(k<1\), 级数发散。
- 贝特朗(Bertrand)判别法: $$\lim_{n \to \infty}{ln(n)[n(\frac{a_n}{a_{n+1}} -1)-1]} =k$$, 当\(k>1\), 级数收敛; \(k<1\), 级数发散。
- 高斯(Gauss)判别法: $$\frac{a_n}{a_{n+1}} = \lambda+\frac{k}{n}+ o(\frac{1}{n^{1+\varepsilon}}), \varepsilon > 0$$, 当\(\lambda>1\), 级数收敛; 当\(0 \leq \lambda < 1\), 级数发散; 当\(\lambda =1, k>1\), 级数收敛; 而\(\lambda=1 , k < 1\), 则级数发散。
对数判别法
仍旧考虑正项级数 \( \sum_{n=1}^{\infty}{a_n} \):
- 第一形式: $$\limsup_{n \to \infty} \frac{ln(a_n)}{ln(n)} = -k$$, 当\(k>1\), 级数收敛; \(k \leq 1\), 级数发散。
- 第二形式: $$\limsup_{n \to \infty} \frac{ln(na_n)}{ln[ln(n)]} = -k$$, 当\(k>1\), 级数收敛; \(k \leq 1\), 级数发散。
积分判别法
该判别法利用从1到\(\infty\)的一个无穷积分来代替级数敛散性判断。其内容为: 若\(f(x)\)为区间\([1, \infty)\)上的一个连续非负单调递减函数, 且\(f(n) =a_n\), 则对正项级数 \( \sum_{n=1}^{\infty}{a_n} \), 有\( \sum_{n=1}^{\infty}{a_n} \)与第一类反常积分\(\int_{1}^{\infty} f(x) dx\)同敛散。
库默尔(Kummer)判别法
正项级数\(\sum_{n=1}^{\infty}{a_n}\)收敛的充要条件是, 存在正数数列\(\{b_n\}_{n=1}^{\infty}\)和正数\(\delta\), 当\(n\)充分大时有$$b_n \frac{a_n}{a_{n+1}}-b_{n+1} \geq \delta>0$$。正项级数\(\sum_{n=1}^{\infty}{a_n}\)发散的充要条件是, 存在发散的正项级数\(\sum_{n=1}^{\infty}{\frac{1}{b_n}}\), 当\(n\)充分大时有$$b_n \frac{a_n}{a_{n+1}}-b_{n+1} \leq 0$$。
叶尔马科夫(Ermakof)判别法
设函数\(f(x)\)在区间\([a,+\infty)\)上单调递减且恒正, 且有极限$$\lim_{x \to + \infty}{\frac{e^x f(e^x)}{f(x)}}=p$$, 则正项级数\(\sum_{n=1}^{\infty}{f(n)}\)在\(p<1\)时收敛, \(p>1\)时发散。
弗林克(Frink)判别法
若正项级数\(\sum_{n=1}^{\infty}{a_n}\)存在极限$$\lim_{n \to \infty}{{\left( \frac{a_{n+1}}{a_n} \right)}^n=\lambda}$$, 那么当\(\lambda < e^{-1}\)时级数收敛, 当\(\lambda > e^{-1}\)时级数发散。
罗巴切夫斯基(Lobatchevski)判别法
若数列\(\{a_n\}\)通项单调趋近于零, 则正项级数\(\sum_{n=1}^{\infty}{a_n}\)与级数\(\sum_{n=1}^{\infty}{\frac{b_n}{2^n}}\)同敛散, 其中\(b_n=max\{k:a_k \leq 2^{-n}\}\)。
柯西(Cauchy)凝聚判别法
若数列\(\{a_n\}\)为单调递减的正数列, 则正项级数\(\sum_{n=1}^{\infty}{a_n}\)与\(\sum_{k=1}^{\infty}{2^k a_{2^k}}\)同敛散。
萨帕戈夫(Sapagof)判别法
揭示了正项级数收敛与其通项数列趋近于零之间的关系。若数列\(\{a_n\}_{n=1}^\infty\)单调递减, 则\(\lim_{n \to \infty}{a_n}=0\)的充要条件是\(\sum_{n=1}^{\infty}{1-\frac{a_{n+1}}{a_n}}\)发散。即单调递增数列\(\{a_n\}_{n=1}^\infty\)与\(\sum_{n=1}^{\infty}{1-\frac{a_n}{a_{n+1}}}\)同敛散。同时可推知, 若正项级数\(\sum_{n=1}^{\infty}{a_n}\)的前\(\ n \)项部分和为\(\ S_n \), 那么级数\(\sum_{n=1}^{\infty}{a_n}\)和\(\sum_{n=1}^{\infty}{\frac{a_n}{S_n}}\)同敛散。
任意项级数收敛判别法
对于任意构造的无穷级数, 肯定能够给出加法运算结果的, 只能是有限的和式, 即部分和。部分和总是在考察整个无穷级数之前用以探测级数性质的对象。而考察一个无穷级数的另一个角度, 就是考虑由一个无穷级数的所以部分和所组成的数列, 或者是函数列。最终目的是希望级数逼近某个确定的函数, 或者说是以某个函数作为极限, 因此, 对于给出的无穷级数, 最为关键的问题就是它是否收敛, 然后考察收敛函数的性质, 这就是研究无穷级数的中心课题。
条件收敛和绝对收敛
如果级数\(\sum_{n=1}^{\infty}{\left| u_n \right| }\)收敛, 可以推知级数\(\sum_{n=1}^{\infty}{u_n}\)收敛, 此时称\(\sum_{n=1}^{\infty}{u_n}\)绝对收敛; 而若原级数\(\sum_{n=1}^{\infty}{u_n}\)收敛, 但\(\sum_{n=1}^{\infty}{\left| u_n \right| }\)其正项级数发散, 那么称\(\sum_{n=1}^{\infty}{u_n}\)条件收敛。
绝对收敛和条件收敛的级数所含有的几个基本性质是:
- 若级数绝对收敛,那么原级数必定收敛。
- 绝对收敛级数的可交换性: 绝对收敛级数改变项的位置后构成的级数也收敛, 且与原级数的和相同。
- 绝对收敛级数的可乘性: 如果级数 \(\sum_{n=0}^{\infty}{u_n}\)与\(\sum_{n=0}^{\infty}{v_n}\) 分别收敛为 \(s\)和\(\delta\),则他们的柯西乘积: $$(\sum_{n=0}^{\infty}{u_n})(\sum_{n=0}^{\infty}{v_n}) = \sum_{n=0}^{\infty} \sum_{k=0}^{n}{(u_k v_{n-k})}$$ 绝对收敛于 \(s \delta \)。
- 若级数收敛, 则对级数的项添加括号, 而不改变顺序, 得到的新级数依然收敛于原级数的收敛和。
- 若级数绝对收敛,则任意调整级数各项的顺序,则新级数会收敛到原来的和。
- 若级数条件收敛,则任意调整级数各项的顺序,则新级数可以收敛到任意的一个值。
常用的几种任意项级数审敛法是:
比较判别法
该判别法类似于级数版的夹逼准则, 是从正项级数中的比较判别法直接推广过来的。其表述为: 若级数 \(\sum_{n=1}^{\infty}{u_n}\) 和 \(\sum_{n=1}^{\infty}{v_n}\) 收敛, 当 \(n\) 充分大时有 \(u_n \leq w_n \leq v_n\), 那么 \(\sum_{n=1}^{\infty}{w_n}\) 也收敛。
莱布尼茨(Leibniz)判别法
即交错级数判别法, 它断言: 有非负数列 \(\{u_n\}\), 若交错级数 \(\sum_{n=1}^{\infty}{{(-1)}^{n+1}u_n}\) 满足 \(\{u_n\}\) 单调递减趋于0, 则级数 \(\sum_{n=1}^{\infty}{{(-1)}^{n+1}u_n}\) 收敛。
狄利克雷(Dirichlet) 判别法
类似于反常积分中的 Dirichlet 判别法, 但在历史上先有无穷级数的理论而后有反常积分的理论, 所以反常积分的迪利克雷判别法(以及阿贝尔判别法)其实是无穷级数中相应判别法的推广。狄利克雷判别法内容是:若数列\(\{u_n\}\)单调趋于零且级数 \(\sum_{n=1}^{\infty}{v_n}\) 的部分和 \(s_n\) 有界, 则任意项级数 \(\sum_{n=1}^{\infty}{u_n v_n}\) 收敛。
阿贝尔(Abel)判别法
阿贝尔判别法是将狄利克雷判别法的第一个条件减弱, 第二个条件加强得到的, 其叙述为: 若数列 \(\{u_n\}\) 单调有界, 且级数 \(\sum_{n=1}^{\infty}{v_n}\) 收敛, 则任意项级数 \(\sum_{n=1}^{\infty}{u_n v_n}\) 收敛。
然而有的级数其通项在其区间上连续且级数在该区间上收敛, 然而它的和函数却不在该区间上连续。教科书用了\([0,1]\)上的级数 \((\sum_{n=1}^{\infty}{x^n-x^{n-1}} )-1\) 作为例子展示这种现象。因此为了给出一种与\(x\)取值无关的收敛定义, 就有了一致收敛的概念: 有函数项级数 \(\sum_{n=1}^{\infty}{u_n(x)}\) , 若对于任意给定正数 \( \varepsilon\), 均存在一个只依赖于 \( \varepsilon\) 的正整数 \(N\), 使得当 \(n>N\) 时对区间 \(I\) 上的一切 \(x\) 都有不等式$$ |r_n(x)|=|s(x)-s_n(x)|< \varepsilon $$成立, 则称函数项级数 \(\sum_{n=1}^{\infty}{u_n(x)}\) 在区间 \(I\) 上一致收敛于和 \(s(x)\), 也即数列在区间 \(I\) 上一致收敛于\(s(x)\)。一致收敛和一致连续的思路是相似的, 即使用\(\varepsilon-\delta\)语言描述与取值无关的接近程度。由此, 引出了判断一致收敛的方法:
魏尔施特拉斯(Weierstrass)判别法
若函数项级数 \(\sum_{n=1}^{\infty}{u_n(x)}\) 在区间 \(I\) 上满足:
- \( |u_n(x)| \leq a_n, n=1,2,3,…\)
- 正项级数 \( \sum_{n=1}^{\infty}{a_n}\) 收敛。
那么函数项级数 \(\sum_{n=1}^{\infty}{u_n(x)}\) 在区间 \(I\) 上一致收敛。
和正项级数相似地, 一致收敛的级数也有几个基本性质:
- 若级数 \(\sum_{n=1}^{\infty}{u_n(x)}\) 的各项 \(u_n(x)\) 在区间 \([a,b]\) 上均连续, 且 \(\sum_{n=1}^{\infty}{u_n(x)}\) 在区间 \([a,b]\) 上一致收敛于 \(s(x)\), 则 \(s(x)\) 在区间 \([a,b]\) 上亦连续。
- 若级数 \(\sum_{n=1}^{\infty}{u_n(x)}\) 的各项 \(u_n(x)\) 在区间 \([a,b]\) 上均连续, 且 \(\sum_{n=1}^{\infty}{u_n(x)}\) 在区间 \([a,b]\) 上一致收敛于 \(s(x)\), 则 \(s(x)\) 在区间 \([a,b]\) 上可逐项积分, 且逐项积分形成的新级数也在区间 \([a,b]\) 上一致收敛。
- 若级数 \(\sum_{n=1}^{\infty}{u_n(x)}\) 在区间 \([a,b]\) 上收敛于 \(s(x)\), 且各项 \(u_n(x)\) 有连续导数 \(u_n'(x)\), 且级数 \(\sum_{n=1}^{\infty}{u_n'(x)}\) 在 \([a,b]\) 上一致收敛, 则级数 \(\sum_{n=1}^{\infty}{u_n(x)}\) 在区间 \([a,b]\) 上一致连续并可逐项求导。
- 若幂级数 \(\sum_{n=1}^{\infty}{a_n x^n}\) 的收敛半径为 \(R>0\), 则该级数在 \((-R,R)\) 内的任意闭区间 \([a,b]\) 上一致收敛。
- 若幂级数 \(\sum_{n=1}^{\infty}{a_n x^n}\) 的收敛半径为 \(R>0\), 则其和函数 \(s(x)\) 在 \((-R,R)\) 内可导, 且有逐项求导公式: $$s'(x) = \left( \sum_{n=0}^{\infty}{a_n x^n} \right)’ = \sum_{n=0}^{\infty}{n a_n x^{n-1}} $$, 那么逐项求导后所得的幂级数于原级数收敛半径相同。
函数的幂级数展开
给定了一个函数, 如何找到一个幂级数来逼近它, 这就是幂级数展开的问题。若函数 \(f(x)\) 在点 \(x_0\) 附近可以展开成幂级数, 即: $$ f(x)=a_0+a_1(x-x_0)+…+a_n {(x-x_0)}^n+…$$, 则\(f(x)\)点\(x_0\)必有任意阶导数, 且$$ f^{(k)}(x)=k!a_k+…+n(n-1)…(n-k+1)a_n {(x-x_0)}^{n-k}+… $$, 因此在 \(x=x_0\) 时, \(f(x_0)=a_0, …,f^{(k)}(x_0)=k! a_k,…\), 即 \( a_k = \frac{f^{(k)}(x_0)}{k!} \)。由此, 若 \(f(x)\) 在点 \(x_0\) 处有任意阶导数, 便将幂级数: $$ \sum_{n=0}^{\infty}{\frac{f^{(n)}(x_0)}{n!} {(x-x_0)}^n} $$称为 \(f(x)\) 在点 \(x_0\) 处的泰勒(Taylor)级数, 当 \(x_0=0\) 时的泰勒级数: $$ \sum_{n=0}^{\infty}{\frac{f^{(n)}(x_0)}{n!} x^n} $$称为麦克劳林(Maclaurin)级数。同时, 若函数 \(f(x)\) 在区间 \((x_0-R,x_0+R)\) 上有任意阶导数, 且其各阶导数在区间 \((x_0-R,x_0+R)\) 上一致有界, 则和函数函数 \(f(x)\) 可以展开为泰勒级数。 函数通过泰勒公式展开后被称为函数的泰勒展开式, 根据余项的定义, 泰勒展开式的余项有两种写法:
- 泰勒公式的皮亚诺余项: \(R_n(x)=o[{(x−x_0)}^n]\), 即: $$ \begin{aligned}f(x) &= \sum_{n=0}^{\infty}{\frac{f^{(n)}(x_0)}{n!} {(x-x_0)}^n} \\ &=
f(x_0)+f′(x_0)(x−x0)+\frac{1}{2!} f′′(x_0){(x−x_0)}^2+…+\frac{1}{n!} f^{(n)}(x_0){(x−x_0)}^n+o[{(x−x_0)}^n] \end{aligned}$$ - 泰勒公式的拉格朗日余项: \(R_n(x)=\frac{f^{(n+1)}(\xi)}{(n+1)!}{(x-x_0)}^{(n+1)}\), 即: $$ \begin{aligned}f(x) &= \sum_{n=0}^{\infty}{\frac{f^{(n)}(x_0)}{n!} {(x-x_0)}^n} \\ &=f(x_0)+f′(x_0)(x−x0)+\frac{1}{2!} f′′(x_0){(x−x_0)}^2+…+\frac{1}{n!} f^{(n)}(x_0){(x−x_0)}^n+\frac{f^{(n+1)}(\xi)}{(n+1)!}{(x-x_0)}^{(n+1)} \end{aligned}$$, 其中\(\xi \)介于\(x\)和\(x_0\)之间, 故存在正数\(\theta \in (0,1)\)使得\(\xi = x_0+\theta (x-x_0)\), 因此\(R_n(x) \)也可记为:$$R_n(x) = \frac{f^{(n+1)(x_0+\theta(x-x_0))}}{(n+1)!} {(x-x_0)}^{n+1}$$。拉格朗日余项定量地给出了级数与展开式之间的误差, 通过余项估计定理(又称拉格朗日余项定理)来估计余项的上界, 由此确定误差范围。拉格朗日余项中的\(\xi \)事实上来源于证明该余项时对中值定理的使用。
同时, 如果函数 \(f(x)\) 在点 \(x_0\) 的邻域\(U(x_0)\)内任意阶可导, 那么 \(f(x)\) 在\(U(x_0)\)内能展开为泰勒级数的充分必要条件正是泰勒公式的余项\(R_n(x)\)在\(n \to \infty\)时极限为0, 即\(\lim_{n \to \infty}{R_n(x)}=0, x \in U(x_0) \)。
(可展开)拉格朗日余项定理
若存在正数\( M \), 使得对任意\(\xi \), 若满足\(x_0 \leq \xi \leq x\)或\(x \leq \xi \leq x_0\), 均有\(|f^{(n+1)}(\xi)| \leq M \), 则:$$ |R_n(x)| =\left| \frac{f^{(n+1)}(\xi)}{(n+1)!}{(x-x_0)}^{(n+1)}\right| \leq \frac{M}{(n+1)!} |{(x-x_0)}^{(n+1)}|$$, 也即\( M \)的取值范围由\(|f^{(n+1)}(\xi)| \)唯一给定, 该不等式亦称泰勒不等式。
于是可以得到常见初等函数的麦克劳林级数展开:
$$\begin{aligned} e^x &=\sum_{n=0}^{\infty}{\frac{x^n}{n!}}, x \in (-\infty, \infty) \\ sin(x)&= \sum_{n=0}^{\infty}{\frac{(-1)^n}{(2n+1)!} x^{2n+1}}, x \in (-\infty, \infty) \\ cos(x) &=\sum_{n=0}^{\infty}{\frac{(-1)^n}{(2n)!} x^{2n}}, x \in (-\infty, \infty) \\ arctan(x)&= \sum_{n=0}^{\infty}{\frac{(-1)^n}{2n+1}x^{2n+1}}, x \in (-1, 1)\\ arcsin(x)&= \sum_{n=0}^{\infty}{\frac{(2n)!}{4^n (n!)^2 (2n+1)} x^{2n+1}}, x \in (-1, 1) \\ ln(1+x) &= \sum_{n=0}^{\infty}{\frac{(-1)^{n+1}}{n}x^n}, x \in (-1, \infty) \\ \frac{1}{1-x}&=\sum_{n=0}^{\infty}{x^n}, x \in (-1, 1) \\ (y+x)^\alpha &= \sum_{n=0}^{\alpha}{{ \alpha \choose n }y^{\alpha-n} x^n}, x \in (-1, 1) 且 \alpha \in \mathbb{R}, 其中{ \alpha \choose n }=C_{\alpha}^{n}=\prod_{k=1}^{n}{\frac{\alpha-k+1}{k}}= \frac{\alpha!}{n!(\alpha-n)!}, { \alpha \choose 0 }=1 \end{aligned}$$
由此便能通过展开式推知当\(x \rightarrow 0\)时, 常见的一些等价无穷小:
$$\begin{aligned} & x \sim sin(x) \sim tan(x) \sim arcsin(x) \sim arctan(x) \sim e^x-1 \sim ln(1+x)\\ & x^2+x \sim \sqrt{1+x}-\sqrt{1-x} \sim x \\ & 1-cos(x) \sim \frac{1}{2}x^2 \\ &x-sin(x) \sim arcsin(x) -x \sim \frac{1}{6}x^3 \\ &tan(x)-x \sim x-arctan(x) \sim \frac{1}{3}x^3 \\ &tan(x)-sin(x) \sim \frac{1}{2}x^3 \\ &a^x-1 \sim xln(a), (a > 0, a \neq 1) \\ & (1+bx)^a-1 \sim abx, (a,b \neq 0) \\ & log_a(1+x) \sim \frac{1}{ln(a)}x, (a \neq 1) \end{aligned}$$
显然它们是在展开中用到了\(n\)阶求导得到的, 那么为什么\(sin(x)\)的泰勒展开式中却没有出现三角函数? \(sin(x)\)的任意阶导数必然会存在三角函数才对, 同理, \(e^x\) 的展开式中也不包含\(e^x\), 按理说求导过程是无法消去\(e^x\)的, 那这是为什么呢?
首先, 考虑三角函数\(sin(x)\)的\(n\)阶导数\(sin^{(n)}(x)\), 有:
$$\begin{aligned}sin'(x) &= cos(x) = sin(x+\frac{\pi}{2}) \\ sin′′(x) &= sin'(x+\frac{\pi}{2}) = cos(x+\frac{\pi}{2})=sin(x+\frac{\pi}{2}+\frac{\pi}{2})\end{aligned}$$
由此猜想, 每次求导可能只是导致在\(x\)上增加一个\(\frac{\pi}{2}\), 不妨使用数学归纳法尝试证明:
假设\(sin^{(n)}(x)=sin(x+\frac{n\pi}{2})\), 于是:
- 当\(n=0\)时, \(sin^{(0)}(x)=sin(x)=sin(x+\frac{0\pi}{2})\), 假设成立;
- 当\(n=i\)时, \(sin^{(i)}(x)=sin(x+\frac{i\pi}{2})\), 假设成立;
- 当\(n=i+1\)时, 此时$$\begin{aligned} sin^{(i+1)}(x)&=\frac{d(sin^{(i)}(x))}{dx} =\frac{d(sin(x+\frac{i\pi}{2}))}{dx} \\ &=cos(x+\frac{i\pi}{2}) \\ &=sin(x+\frac{(i+1)\pi}{2}) \end{aligned} $$
由数学归纳法原理, 对于 \(\forall n \in \mathbb{N}\), 均有\(sin^{(n)}(x)=sin(x+\frac{n\pi}{2})\), 假设成立。由此, \(sin(x)\)的麦克劳林级数, 即在\(x_0=0\)处的泰勒展开式便可通过\(sin^{(n)}(x)=sin(x+\frac{n\pi}{2})\)来化简:
$$\begin{aligned}sin(x) &= \sum_{n=0}^{\infty}{\frac{sin^{(n)}(x_0)}{n!} {(x-x_0)}^n} = \sum_{n=0}^{\infty}{\frac{sin^{(n)}(0)}{n!} x^n} \\ &= \sum_{n=0}^{\infty}{\frac{sin^{(2n)}(0)}{(2n)!} x^{(2n)}}+\sum_{n=0}^{\infty}{\frac{sin^{(2n+1)}(0)}{(2n+1)!} x^{(2n+1)}} \\ &=0+\sum_{n=0}^{\infty}{\frac{{(-1)}^n}{(2n+1)!} x^{(2n+1)}} \end{aligned}$$
由此便消去了展开式中的三角函数, 由此结论易知\(cos(x)\)情况类似, 故略去证明。类似地, 易知\(e^x\)的麦克劳林展开中有\((e^x)^{(n)}=e^x\), 在\(x_0=0\)处\((e^x)^{(n)}|_{x_0=0}=1\), 于是:
$$\begin{aligned}e^x &= \sum_{n=0}^{\infty}{\frac{(e^{x_0})^{(n)}}{n!} {(x-x_0)}^n} = \sum_{n=0}^{\infty}{\frac{1}{n!} x^n} \end{aligned}$$
这时令\(x=i\theta\), \(e^x\)的麦克劳林展开式将变为:
$$\begin{aligned}e^{i\theta} &= 1+i\theta-\frac{1}{2!} \theta^2 -\frac{1}{3!} \theta^3 +\frac{1}{4!} \theta^4 +\frac{1}{5!} \theta^5 -\frac{1}{6!} \theta^6 -\frac{1}{7!} \theta^7 +\frac{1}{8!} \theta^8 +… \\ &= (1+i\theta-\frac{1}{2!} \theta^2 +\frac{1}{4!} \theta^4 -\frac{1}{6!} \theta^6 +…)+i(\theta-\frac{1}{3!} \theta^3 +\frac{1}{5!} \theta^5 -\frac{1}{7!} \theta^7 +…)\\ &= cos(\theta)+isin(\theta) \end{aligned}$$
就得到了欧拉公式。特别地, 在 \(\theta=\pi\) 时, 上式便化为简洁版欧拉公式: \(e^{i\pi}+1=0\)。
函数的三角级数展开
用类似的方法, 找到一个三角级数来逼近函数, 这就是傅里叶级数展开的问题。如果函数 \(f(x)\) 是周期为 \(2l\) 的周期函数, 且能展开为三角级数: \(f(x) = \frac{a_0}{2}+ \sum_{n=1}^{\infty} (a_n cos \frac{n \pi x}{l} + b_n sin \frac{n\pi x}{l})\), 且其中的傅里叶系数 \(\{a_n\}, \{b_n\}\) 为: $$\begin{cases} a_n = \frac{1}{l} \int_{-l}^{l} f(x) cos\frac{n\pi x}{l} dx , n=0,1,2,… \\ b_n = \frac{1}{l} \int_{-l}^{l} f(x) sin\frac{n\pi x}{l} dx , n=1,2,3,… \end{cases}$$, 则该三角级数就是函数 \(f(x)\) 的傅里叶级数。对于傅里叶级数的敛散性, 有狄利克雷(Dirichlet)充分条件即狄利克雷收敛定理: 若函数 \(f(x)\) 是周期为 \(2l\) 的周期函数且满足:
- 函数 \(f(x)\) 在一个周期内连续或者只有有限个第一类间断点
- 函数 \(f(x)\) 在一个周期内至多只有有限个极值点
则函数 \(f(x)\) 的傅里叶级数收敛, 且当 \(x\) 是 \(f(x)\) 的连续点时, 级数收敛于 \(f(x)\) ;当 \(x\) 是 \(f(x)\) 的间断点时, 级数收敛于 \(\frac{1}{2} [ f(x^-)+f(x^+) ] \)。
如果考虑在傅里叶展开过程中函数 \(f(x)\) 的奇偶性, 会发现奇函数的傅里叶系数中 \(a_n =0\) 而 \(b_n\)为2倍, 偶函数的傅里叶系数中 \(b_n =0\) 而 \(a_n\)为2倍, 于是将只含有正弦项的奇函数的傅里叶级数称为正弦级数, 而只含常数项和余弦项的偶函数的傅里叶级数被称为余弦级数。
使用级数获得对 \(\pi\) 的逼近
正由于研究级数的动机是为了对函数逼近, 而在过去, 获得一个更高精度的 \(\pi\) 值一直是个刚需。莱布尼兹给出过一个计算 \(\pi\) 的级数, 即的 \(\pi\) 莱布尼兹公式: $$\frac{\pi}{4} = \sum_{n=0}^{\infty}{\frac{{(-1)}^n}{2n+1}}= \frac{1}{1}-\frac{1}{3}+\frac{1}{5}-\frac{1}{1}+…$$, 其证明正是通过对\(arctan(x)\)的麦克劳林展开得到的。由于我们知道\(arctan'(x)=\frac{1}{1+x^2}\), 不难知道$$ arctan^{(n)}(x)= \begin{cases} 0 &,\text{n 为偶数} \\ (-1)^{\frac{n-1}{2}}(n-1)! &,\text{n 为奇数} \end{cases}$$。于是其麦克劳林展开式便为 $$\begin{aligned} f(x) = arctan(x) &= f(0)+f′(0)x+f′′(0) \frac{x^2}{2!}+f′′′(0)\frac{x^3}{3!}+… \\&=x-\frac{x^3}{3}+ \frac{x^5}{5}+… \end{aligned}$$, 再代入\(f(1)=arctan (1) = \frac{\pi}{4}\), 就能得到含有 \(\pi\) 的常数项级数——莱布尼兹级数。还有一个方法就是做题时常遇到的沃利斯公式, 其内容为: $$\begin{aligned} \prod \limits_{n=1}^\infty{\frac{2n}{2n-1} \frac{2n}{2n+1}} &=(\frac{2}{1} · \frac{2}{3})·(\frac{4}{3}·\frac{4}{5})·(\frac{6}{5}·\frac{6}{7})·… \\ & = \frac{\pi}{2}\end{aligned}$$, 其严格证明可见参考资料中的沃利斯乘积(Wallis product, 又称点火公式)或者CangLan 的博客。此外还有诸如对\(p=2\)时的p级数求和来得出\(\pi\)值的巴塞尔问题以及结合整体代换和极坐标积分的高斯积分, 当然还有睡梦求解器拉马努金的著名公式: $$\frac{1}{\pi} = \sum_{n=0}^{\infty}{\frac{(4n)(1103+26390n)}{{(n!)}^4 396^{4n}} }$$, 更多算法请见维基百科中的”圆周率近似值”一页。
定积分的定义和更严格的定积分定义
为了回答文章开头提出疑问: 即为何级数和微积分一起放在高等数学教科书中这一问题, 可以来回顾下高等数学教课书中是如何定义积分的。教科书中的黎曼积分是一个建立在取样分割操作基础上的概念。在闭区间 \([a,b]\) 上的一个分割是指在此区间中取一个有穷点列 \(a=x_0<x_1<x_2<…<x_n=b\), 每个更小的闭区间 \([x_i,x_{i+1}]\) 就是一个子区间。定义 \(\lambda\) 为这些子区间长度的最大值: \(\lambda = max(x_{i+1}−x_i)\), 其中\(0 \leq i \leq n−1\)。而闭区间 \([a,b]\) 上的一个取样分割则是在分割 \(a=x_0<x_1<x_2<…<x_n=b\) 后, 于每一个子区间 \([x_i,x_{i+1}]\) 中取出一点 \(x_i \leq t_i \leq x_{i+1}\)。如此, 若在闭区间 \([a,b]\) 上的一个实值函数 \(f\) 有定义, 则 \(f\) 关于取样分割 \(x_0,…,x_n, t_0,…,t_{n-1}\) 的黎曼和为: $$\sum_{i=0}^{n-1} f(t_i)(x_{i+1}-x_i) $$, 其中每一项都是区间长度 \(x_{i+1}-x_i\)于取样值 \(t_i\) 的函数值 \(f(t_i)\) 的乘积, 即一个分割区间上的矩形面积, 前者为矩形的宽(由分割宽度决定), 而后者是矩形的高(由子区间中取样值对应的函数值决定)。显然不同的取样分割方式得到的黎曼和各不相同, 然而如果 \(\lambda\) 足够小, 所有的黎曼和都趋于某个极限(此处忽略了达布上和与达布下和的概念, 若有兴趣请您自行查阅), 那么这个极限就叫做函数\(f\)在闭区间 \([a,b]\) 上的黎曼积分。综上有: \(S\)为函数\(f\)在闭区间 \([a,b]\) 上的黎曼积分当且仅当对任意的\( \varepsilon > 0\), 都存在 \( \delta > 0\) 使得取样分割 \(a=x_0<x_1<x_2<…<x_n=b\), 其子区间最大长度 \(\lambda = max(x_{i+1}−x_i) < \delta \), 即: $$ \left| \sum_{i=0}^{n-1} f(t_i)(x_{i+1}-x_i) -S \right| < \varepsilon $$, 该极限被记作:$$ S= \int_a^b f(x) dx$$
可见黎曼和的形式和级数部分和的概念和解析形式都十分接近, 而当引入极限后, 级数便成为了积分的工具, 所以级数和积分本质上关系是极为密切的。不过黎曼积分要求被积函数有界, 且在其定义域上的不连续点是较少的, 即不连续点的集合的测度为零(例如康托尔集(Cantor 集)), 该定理被称为黎曼积分的勒贝格定理。这一事实将黎曼积分限制在连续函数或者间断点数量有限的函数上, 导致一些较为复杂的函数无法用黎曼积分处理(例如狄利克雷函数), 从前文中也能看到积分和极限的互相交换顺序需要满足一个较强的条件——一致收敛性, 这也正是因为黎曼可积的函数序列的极限未必黎曼可积导致的。为了解决这个问题就引入了测度的概念: 测度函数是一个映射 \(\mu\), 在给定的集合 \(X\) 上, \(\mu\) 可以将 \(X\) 的子集映射为非负实数, 且映射 \(\mu\) 满足:
- 非负性: 对于任意集合 \(A\), 有 \(\mu(A) \geq 0\)。
- 空集赋零: 即空集测度为0, \(\mu(\phi) = 0\)。
- 可数可加性: 如果\(A_1, A_2,… \) 是各不相交的集合, 有 \(\mu(\bigcup_{i=1}^{\infty}A_i) = \sum_{i=1}^{\infty} \mu(A_i)\)。
而勒贝格测度, 便是定义在 \(\mathbb{R}\) 上, \(\mu(X) = \lim \left\{ \sum_{n=1}^{\infty} \iota(I_n):\{I_n\}为开区间序列, X \subset \bigcup_{n=1}^{\infty}I_n \right\}\)。因此, 仿照黎曼积分的方式, 可以得到勒贝格积分的思路:
- 将函数的值域划分为若干个区间。
- 对于每个值域区间 \([a_i, b_i)\), 计算函数值落在该区间的点集的勒贝格测度。
- 用函数值 \(y_i\) 乘以点集的测度 \(\mu(f^{-1}([a_i, b_i)))\)。
- 对上一步的乘积求和得到勒贝格积分。
勒贝格积分对于函数和其值域也并非没有要求, 它需要被积函数为可测函数, 而函数值的每个分割对应的点集为可测集。我们知道子集族是一个集合的子集的集合, 那么满足以下条件的集合\(X\) 的子集族 \(\mathcal{A}\) 就是一个 \(X\) 上的 \(\sigma-\)代数:
- \(X \in \mathcal{A}\)
- 若 \(\mathcal{A} \in \mathcal{A}\), 则 \(\mathcal{A}^c \in \mathcal{A}\)
- 若 \(\{\mathcal{A}_i\} \subset \mathcal{A}\) 为可数集合, 则 \(\bigcup_{i}\mathcal{A}_i \subset \mathcal{A}\)
于是在测度空间 \((X, \mathcal{F})\) 上, 其中 \(X\) 是集合, \(\mathcal{A}\) 是 \(X\) 的一个 \(\sigma-\)代数。如果 \(\mathcal{A}\) 属于 \(\mathcal{F}\),则称 \(\mathcal{A}\) 为 \(X\) 上的一个可测集, 即所有在 \(\mathcal{F}\) 中的子集 \(\mathcal{A}\) 均为可测集; 如果加上一个测度空间 \((Y, \mathcal{G})\), 若映射 \(f:X \to Y, x \mapsto f(x)\) 满足: 对任意 \(b \in \mathcal{G}\), 其逆像 \(f^{-1}(b) \in \mathcal{A}\), 那么 \(f\) 就是这两个可测空间间的一个可测映射(可测函数)。此时勒贝格积分的严格定义便呼之欲出:
在给定的测度空间 \(X, \mathcal{A},\mu\) 上, \(\mathcal{A}\) 是集合 \(X\) 的一个 \(\sigma-\)代数, \(\mu\)是一个测度。那么对于可测函数\(f:X \to R\):
- 简单函数(我寻思它就是阶梯函数): \(f\) 可表示为 \(f=\sum_{i=1}^{n}a_i \chi_{\mathcal{A}_i}\), 其勒贝格积分为: $$\int_{X} f du = \sum_{i=1}^{n} a_i \mu(\mathcal{A}_i)$$, 其中 \(a_i\) 为常数, \(\chi_{\mathcal{A}_i}\) 为指示函数。指示函数用于指示某个元素是否属于该集合, 即对于集合 \(P\), 有: $$ \chi_{\mathcal{P}}(x) =\begin{cases} 1, x \in P \\ 0, x \notin P \end{cases}$$
- 非负可测函数: 对非负可测函数 \(f\) 有: $$\int_{X} f du = sup\left\{\int_{X} s du | s为非负简单函数, s \leq f\right\}$$
- 一般可测函数: $$\int_{X} f du = \int_{X} f^+ du – \int_{X} f^- du $$, 其中 \(f^+\) 和 \(f^-\) 分别为正部函数和负部函数:
- \(f^+\) : 若 \(f(x) \geq 0\), 则 \(f^+(x) = f(x)\), 否则 \(f^+(x) = 0\)。
- \(f^-\) : 若 \(f(x) \leq 0\), 则 \(f^-(x) = -f(x)\), 否则 \(f^-(x) = 0\)。
- \(\int_{X} f^+ du\) 和 \(\int_{X} f^- du\) 中任一个的值有限, 则 \(f\) 的勒贝格积分存在; 若两部分的值均有限, 则称 \(f\) 的勒贝格可积。
勒贝格可积带来的直观优势是对于函数列求和, 放松了极限与积分交换顺序的条件, 因为有如下两个收敛定理:
- 勒贝格单调收敛定理: 函数列 \(\{f_n\}\) 单调递增且函数通项极限 \( \lim f_n =f\), 则有 \( \lim \int f_n du =\int f du\)。
- 勒贝格控制收敛定理: 函数列 \(\{f_n\}\) 和勒贝格可积函数 \(g\) 满足 \( |f_n| \leq g\) 且 \( \lim f_n =f\), 则有 \( \lim \int f_n du =\int f du\)。
最后给出一个通过测度求积分的简单示例: 用测度计算阶梯函数: $$ f(x) = \begin{cases} 10, x \in [0,1) \\ 1, x \in [1,100) \end{cases}$$ 在其定义域上的勒贝格积分。可解为: $$ \int_0^{100} f(x)dx = 10 \times \mu(\{x \in [0,1]:f(x)=10\}) + 1\times \mu(\{x \in [1,100]:f(x)=1\})$$, 其中 \(\mu(\{x \in [0,1]:f(x)=10\})\) 表示满足条件 \(f(x)=10\) 的点集的测度, 即区间 \([0,1)\) 的测度, 因此有 \(\mu(\{x \in [0,1]:f(x)=10\}) = \mu([0,1))=1-0 =1)\)。同理可得 \(\mu(\{x \in [1,100]:f(x)=1\}) = 100-1=99\), 于是得出原积分: $$ \int_0^{100} f(x)dx =10 \times 1+1 \times 99= 109 $$, 这里利用了实数集上的勒贝格测度中, 区间测度就等于区间长度。
参考资料
- 《高等数学》(第六版) (PDF)
- 《托马斯微积分》, Joel Hass, Maurice Weir, Christopher Heil (PDF)
- 《实分析》, H.L.Royden (PDF)
- 《实分析》, Elias M. Stein, Rami Shakarchi (PDF)
- 《实变函数与泛函分析基础》,程其襄, 张奠宙, 胡善文, 薛以锋 (PDF)
- 《陶哲轩实分析》, 陶哲轩 (PDF)
- Real Analysis-Modern Techniques and Their Applications, Gerald B. Folland
- 格兰迪级数(Grandi’s series) – 维基百科
- 巴塞尔问题(Basel problem) – 维基百科
- 柯西-阿达马公式(Cauchy–Hadamard theorem) – 维基百科
- 阿贝尔定理 (PDF)
- 优级数判别法 – 维基百科
- 欧拉公式(Euler’s formula) – 维基百科
- 沃利斯乘积(Wallis product) – 维基百科
- 解析延拓 – 维基百科
- 圆周率近似值 – 维基百科
- 隐藏在素数规律中的π – 3Blue1Brown
- CangLan 的博客 – π
- 一致收敛 – 中文数学Wiki
- 确界定理 – 中文数学Wiki
- Lebesgue 积分 – 香蕉空间
- 法图引理 – 维基百科
- Lebesgue Theory: A Brief Overview, Ralf Pihlström (PDF)
- An Intuitive Guide to Lebesgue Measure, Keith, Michael (PDF)
- The Lebesgue Integral, Luciano Pandolfi (PDF)
Published by