线性代数漫谈(五):向量的坐标与内积空间

May 15, 2018 at 9:20 am

在上一篇中,我们引入了线性空间基的概念,基于它,我们可以使用“坐标”来简洁、统一地表示线性空间中的向量。在此之上,我们将一个更强大的功能引入线性空间:内积运算,从而可以度量向量的长度和向量之间的夹角。

向量的坐标

在之前的讨论中,我们并没有讨论基的序的问题,仅将它看作是普通的集合,而在进行坐标的讨论的时候,通常我们需要指定这些这些元素的“序”。(这里的“序”实际上指的是序上的不同,而不是大小,这里我们不引入偏序关系来讨论它。)

定义5.1 有序基(ordered basis)
n维线性空间V(F)的所有基构成的集合为S,设B = \{\beta_1,...,\beta_n\} \in S,我们定义从V^nS^n的一个映射\sigma,使得\sigma((((\beta_1,\beta_2),\beta_3),...,\beta_n)) = \{\beta_1,...,\beta_n\},(其中括号表示定义1.1所定义的有序对),则对于每一个在\sigma下的象为B的元素,称为线性空间V(F)对于基B的一组有序基。
在不会引起歧义的情况下,我们仍将有序基(((\beta_1,\beta_2),\beta_3),...,\beta_n)记为{\beta_1,\beta_2,...,\beta_n},并简称为基。需要注意的是,虽然表示法一致,原来的基是无序的,是V的一个子集,而现在它实际上是V^n的一个子集。

定义5.2 向量的坐标(coordinate)
B = \{\beta_1,...,\beta_n\}n维线性空间V(F)的一组有序基,如果V中元素\alpha表示为\alpha = a_1\beta_1 + a_2\beta_2 +...+ a_n\beta_n,则其系数组a_1,a_2,...,a_n构成的有序对((a_1,a_2),a_3)...,a_n)叫做\alpha在有序基B下的坐标(coordinate with respect to the basis),记作\alpha_B = (a_1,a_2,...,a_n)

由定义可见,V中元素的坐标是由所选的基决定的,同一元素在不同的基下一般有不同的坐标。坐标\alpha_BF^n的一个元素,也称为\alpha关于基B的坐标向量。

由定理4.3可知,有限维线性空间V(F)中每一个元素在给定的基B下的坐标是唯一确定的,因此,给定了V(F)的一个基BV中元素与F^n中的向量一一对应;而且保持元素间的线性运算关系不变,即如果
\alpha_B = (a_1,a_2,...,a_n),\beta_B = (b_1,b_2,...,b_n),则有
{(\alpha_+\alpha_B)}_B = (a_1 + b_1,a_2 + b_2,..., a_n + b_n),记为\alpha_B + \beta_B
{(\lambda\alpha_)}_B = (\lambda a_1,\lambda a_2,..., \lambda a_n),记为\lambda\alpha_B

例5.1 R^n中的向量\alpha = (a_1,a_2,...,a_n)在自然基(e_1,e_2,...,e_n)下的坐标也是(a_1,a_2,...,a_n)R[x]_3中的p(x) = a_0 + a_1x + a_2x^2在自然基B = (1,x,x^2)下的坐标(p(x))_B = (a_0,a_1,a_2)

例5.2R[x]_3的基B = (1,x-1,(x-1)^2),则容易证明:p(x) = a_0 + a_1x + a_2x^2在基B下的坐标为:(p(x))_B = (a_0 + a_1 + a_2,a_1 + 2a_2,a_2)

内积空间

线性空间中的线性运算不能描述向量的度量性质,如向量的长度、夹角等,而向量的度量性质在分析、几何问题中是不可缺少的,所以我们必须引入度量的概念。
我们只在实数域上定义内积空间,这也是我们重点讨论的对象。

定义5.3 实数域上的内积空间(inner product space over real numbers)
在实空间V(R)上定义一个二元运算,使V中元素\alpha,\beta与一个实数相对应,记作(\alpha,\beta),如果\forall \alpha,\beta \in V, \lambda \in R,满足:
(1)(\alpha, \beta) = (\beta, \alpha)
(2)(\alpha + \beta, \gamma) = (\alpha, \gamma) + (\beta, \gamma)
(3)(\lambda \alpha, \beta) = \lambda (\alpha, \beta)
(4)(\alpha, \alpha) \geq 0,等号成立当且仅当\alpha = \textbf{0}
则称实数(\alpha,\beta)为向量\alpha,\beta的内积(inner product),定义了内积的V(R)称为实内积空间,有限维实内积空间叫做欧氏空间(Euclidean space)

条件(4)被称为正定[1]条件(positive-definite condition)。我们之所以只在实数域上定义内积空间,就是由于正定条件实际上要求域有某种序性质(之间可以相互比大小),而这个序性质我们不打算深入讨论。而之所以我们要条件(4),是因为它为我们定义向量长度提供了条件。(注1:内积空间上的序性质实际上比较复杂,对于复数域上的内积空间,复数域本身是无序的,但它的实部是有序的;所以对所有域定义内积空间实际上比较困难)(注2:在一些其它版本的内积空间定义中,并不要求条件(4),这使得内积空间可以很容易定义在所有域上,关于这一点的讨论已经超过了本系列讨论的范围,本篇的后续讨论依然以定义5.3为主)

定义6.4 实内积空间中向量的长度(length,也称为大小,magnitude,或称范数,norm)
实内积空间V(R)中向量\alpha的长度定义为|\alpha| = \sqrt{(\alpha,\alpha)}

例6.3 \forall \alpha = (a_1,a_2,...,a_n),\beta = (b_1,b_2,...,b_n) \in R^n,定义(\alpha,\beta) = a_1b_1+a_2b_2+...+a_nb_n,容易验证它是R^n的一个内积,并称之为R^n的标准内积。此时向量\alpha的长度|\alpha| = \sqrt{{a_1}^2+{a_2}^2+...+{a_n}^2}

R^n中定义内积的方法不是唯一的。例6.4给出了一个示例。

例6.4 \forall \alpha = (a_1,a_2),\beta = (b_1,b_2) \in R^2,定义(\alpha,\beta) = a_1b_1-a_2b_1-a_1b_2+3a_2b_2,它也是R^2的一个内积。我们验证它满足内积的正定条件:
(\alpha,\alpha) = a_1a_1 - 2a_1a_2 + 3a_2a_2 = {(a_1-a_2)}^2+2{a_2}^2 \geq 0。其等号成立当且仅当a_1 = a_2 = 0,即\alpha = \textbf{0}。此时向量\alpha的长度|\alpha| = \sqrt{{(a_1-a_2)}^2+2{a_2}^2}

例6.5R[x]_3中,对任意的f(x) = a_0 + a_1x+a_2x^2, g(x) = b_0 + b_1x + b_2x^2,定义(f(x),g(x)) = a_0b_0+a_1b_1+a_2b_2,容易验证它是R[x]_3中的一个内积。

定理6.1V(R)是一个内积空间,则\forall \alpha, \beta \in V,和\lambda \in R,有
(1)|\lambda\alpha| = |\lambda||\alpha|
(2)|(\alpha,\beta)| \leq |\alpha||\beta|
(3)|\alpha + \beta| \leq |\alpha| + |\beta|
其中(2)称为柯西-施瓦茨不等式(Cauchy–Schwarz inequality),(3)称为三角不等式。

证明
(1)|\lambda\alpha| = \sqrt{(\lambda\alpha,\lambda\alpha)} = \sqrt{\lambda(\alpha,\lambda\alpha)} = \sqrt{\lambda(\lambda\alpha,\alpha)} = \sqrt{{\lambda}^2(\alpha,\alpha)} = |\lambda|\sqrt{(\alpha,\alpha)} = |\lambda||\alpha|
(2)这个不等式的证明比较难,需要一些技巧。首先容易验证当\beta = \textbf{0}时,
|(\alpha,\beta)|=|(\alpha,0\beta)|=|0(\alpha,\beta)|=0 \leq |\alpha|0
即此时等式成立。若\beta \ne 0,则由正定条件可知|\beta|>0。记\lambda = \frac{(\alpha,\beta)}{|\beta|^2}
(\alpha - \lambda \beta, \alpha - \lambda \beta) = (\alpha,\alpha)-2(\alpha,\lambda \beta)+(-\lambda \beta,-\lambda \beta)=|\alpha|^2-2\lambda (\alpha,\beta)+{\lambda}^2 |\beta|^2=|\alpha|^2-2 \frac{{(\alpha,\beta)}^2}{|\beta|^2} + \frac{{(\alpha,\beta)}^2}{|\beta|^2} =|\alpha|^2-\frac{{(\alpha,\beta)}^2}{|\beta|^2} \geq 0
|\alpha|^2 |\beta|^2 \geq {(\alpha,\beta)}^2,两边开根号,即得|(\alpha,\beta)| \leq |\alpha||\beta|
(3) |\alpha + \beta|^2 = (\alpha + \beta, \alpha + \beta) = |\alpha|^2 + 2(\alpha,\beta) + |\beta|^2 \leq |\alpha|^2 + 2|\alpha||\beta| + |\beta|^2 = {(|\alpha| + |\beta|)}^2,所以两边开根号,得到|\alpha + \beta| \leq |\alpha| + |\beta|,这里的不等号使用了(2)的结论。

另外我们有一个简单的推论
推论6.1 定理6.1(2)的等号成立当且仅当\alpha,\beta线性相关。
证明 由定理6.1(2)的证明过程和正定条件,若\beta = \textbf{0},则等号成立为0,且此时\beta = 0\alpha,即\alpha,\beta线性相关。否则等号成立当且仅当\alpha - \lambda \beta = \textbf{0},即\alpha = \lambda\beta,若\lambda \ne 0,则定理得证。如果\lambda = 0,则\alpha = \textbf{0},同样可得\alpha,\beta线性相关。

有了柯西-施瓦茨不等式,我们便可以利用内积定义向量的夹角。

定义6.5 对任意非零向量\alpha,\beta \in V(R),定义其夹角<\alpha,\beta> = arccos \frac{(\alpha,\beta)}{|\alpha||\beta|}。我们称非零向量正交(orthogonal),如果(\alpha,\beta) = 0,记为\alpha \perp \beta。此外,由于零向量与任何向量的内积等于零,所以也说零向量和任何向量正交。即一般说\alpha,\beta正交当且仅当(\alpha,\beta) = 0

定理6.2 勾股定理\alpha \perp \beta,则|\alpha+\beta|^2 = |\alpha|^2+|\beta|^2
证明 由定理6.1(3)的推导过程即可得到。

例6.6 在R^n,对标准内积,有e_i \perp e_j, i \ne j, i,j = 1,2,...,n

例6.7 对于例6.4定义的内积,与e_1 = (1,0)正交的向量为(b,b),其中b为任意实数。

我们最后再给出一个定理,它描述了正交和线性相关性的关系。

定理6.3 在内积空间V(R)中两两正交的非零向量组S = \{\alpha_1,\alpha_2,...,\alpha_m\}是线性无关的。
证明 使用反证法。如果向量组S线性相关,不妨设\alpha_1 = \lambda_2\alpha_2+...+\lambda_m\alpha_m,则(\alpha_1,\alpha_2) = (\lambda_2\alpha_2+...+\lambda_m\alpha_m,\alpha_2) = \lambda_2(\alpha_2,\alpha_2) = 0,而由于\lambda_2是非零向量,所以\lambda_2 = 0,同理可得i = 2,...,m,\lambda_i = 0,所以\alpha_1是零向量,和假设矛盾,定理得证。

在本篇中,我们首先给出了坐标的相关概念,它极大简化了线性空间中向量的表示;此外,为了度量向量的长度和夹角,我们在实数域上引入了内积空间。在下一篇中,我们将会将两者结合,使用正交基和对应的坐标来表示向量,这样,向量的度量便可以通过坐标非常简单地计算得到。下一篇也将对目前这几篇的主要内容进行简单的回顾和总结,以方便我们向线性代数的另一重要基础内容,“线性映射”,迈进。

[1]正定这个翻译其实并不是特别好,它实际上是“确定为正值”的意思,即这个值对于非零向量,一定是正的。在日语中,这个性质称为「定値性」(definiteness),正定称为「正定値」,中文中则使用正定、负定、非负定、非正定等名词。