Skip to content

Latest commit

 

History

History
518 lines (421 loc) · 13.5 KB

高等代数 5 二次型.md

File metadata and controls

518 lines (421 loc) · 13.5 KB

高等代数 5 二次型

二次型


[TOC]


二次型及其矩阵表示

  • 设$P$是一数域,一个系数在数域$P$中的$x_1,x_2,\cdots,x_n$的二次齐次多项式

$$ f(x_1,x_2,\cdots,x_n)= a_{11}x_1^2+2a_{12}x_1x_2+\cdots+2a_{1n}x_1x_n\\ +a_{22}x_2^2+\cdots+2a_{2n}x_2x_n+\cdots \\ +a_{nn}x_n^2 $$

称为数域$P$上一个$n$元二次型,或简称为二次型

  • 把(1)的系数排成一个$n \times n$矩阵

$$ A= \left ( \begin{matrix} a_{11} & a_{12} & \cdots & a_{1n} \ a_{21} & a_{22} & \cdots & a_{2n} \ \vdots & \vdots & & \vdots \ a_{n1} & a_{n2} & \cdots & a_{nn} \

\end{matrix} \right ) a_{ij}=a_{ji},i,j=1,\cdots,n $$

它就称为二次型(1)的矩阵

​ 因为$a_{ij}=a_{ji},i,j=1,\cdots,n$,所以,$A'=A$。因此二次型的矩阵都是对称的

  • 令 $$ X=\left ( \begin{matrix} x_1 \ x_2 \ \vdots \ x_n \ \end{matrix} \right ) $$ 于是二次型可以用矩阵的乘积表示出来 $$ X'AX=(x_1,x_2,\cdots,x_n)\left ( \begin{matrix} a_{11} & a_{12} & \cdots & a_{1n} \ a_{21} & a_{22} & \cdots & a_{2n} \ \vdots & \vdots & & \vdots \ a_{n1} & a_{n2} & \cdots & a_{nn} \

    \end{matrix} \right )\left ( \begin{matrix} x_1 \ x_2 \ \vdots \ x_n \ \end{matrix} \right )=f(x_1,x_2,\cdots,x_n) $$

二次型和它的矩阵是相互唯一决定的

线性替换及其矩阵表示

  • 线性替换 设$x_1,\cdots,x_n;y_1,\cdots,y_n$是两组文字,系数在数域$P$中的一组关系式 $$ \begin{cases} x_1=c_{11}y_1 +c_{12}y_2+\cdots +c_{1n}y_n \ x_2=c_{21}y_1 +c_{22}y_2+\cdots +c_{2n}y_n\ \ \ \ \cdots \cdots \ x_n=c_{n1}y_1 +c_{n2}y_2+\cdots +c_{nn}y_n \ \end{cases} $$ 称为由$x_1,\cdots,x_n$到$y_1,\cdots,y_n$的一个线性替换

    如果系数行列式$|c_{ij}|\neq 0$,那么线性替换(5)就称为非退化的

    线性替换把二次型变成二次型。

  • 令 $$ C=\left ( \begin{matrix} c_{11} & c_{12} & \cdots & c_{1n} \ c_{21} & c_{22} & \cdots & c_{2n} \ \vdots & \vdots & & \vdots \ c_{n1} & c_{n2} & \cdots & c_{nn} \

    \end{matrix} \right ), Y= \left ( \begin{matrix} y_1 \ y_2 \ \vdots \ y_n \ \end{matrix} \right ) $$ 线性替换可以写成 $$ \left ( \begin{matrix} x_1 \ x_2 \ \vdots \ x_n \ \end{matrix} \right )

    \left ( \begin{matrix} c_{11} & c_{12} & \cdots & c_{1n} \ c_{21} & c_{22} & \cdots & c_{2n} \ \vdots & \vdots & & \vdots \ c_{n1} & c_{n2} & \cdots & c_{nn} \

    \end{matrix} \right ) \left ( \begin{matrix} y_1 \ y_2 \ \vdots \ y_n \ \end{matrix} \right ) $$ 或者 $X=CY$

  • 替换后的二次型的矩阵与原二次型的矩阵之间的关系 $$ f(x_1,x_2,\cdots,x_n)=X'AX=(CY)'A(CY)=Y'(C'AC)Y=Y'BY $$ 因此 $B=C'AC$

合同变换

  • 定义 数域$P$上$n \times n$矩阵$A,B$称为合同的,如果有数域$P$上可逆的$n \times n$矩阵$C$,使 $B=C'AC$

    合同是矩阵之间的一个关系。合同关系具有

    1. 自反性 $A=E'AE$
    2. 对称性 由 $B=C'AC$可以得到$A=(C^{-1})'BC^{-1}$
    3. 传递性 由$A_1=C_1'AC_1,A_2=C_2’AC_2$即得$A_2=(C_1C_2)'A(C_1C_2)$

    因此,经过非退化的线性替换,新的二次型的矩阵与二次型的矩阵是合同的

标准形

  • 数域$P$上任意一个二次型都可以经过非退化的线性替换变为平方和$d_1x_1^2+d_2x_2^2+\cdots+d_nx_n^2$的形式.

二次型$f(x_1,x_2,\cdots,x_n)$经过非退化线性替换所变成的平方和称为$f(x_1,x_2,\cdots,x_n)$的一个标准形

对应的矩阵是对角矩阵 $$ d_1x_1^2+d_2x_2^2+\cdots+d_nx_n^2\

(x_1,x_2,\cdots,x_n)\left ( \begin{matrix} d_1 & 0 & \cdots & 0 \ 0 & d_2 & \cdots & 0 \ \vdots & \vdots & & \vdots \ 0 & 0 & \cdots & d_n \

\end{matrix} \right )\left ( \begin{matrix} x_1 \ x_2 \ \vdots \ x_n \ \end{matrix} \right ) $$

  • 在数域$P$上,任意一个对称矩阵都合同于一对角矩阵。

  • 在一个二次型的标准形中,系数不为零的平方项的个数是唯一确定的,与所做的非退化线性替换无关,二次型矩阵的秩有时就称为二次型的秩

  • 在一般的数域中,二次型的标准形不是唯一的而与所作的非退化的线性替换有关。

  • 配方法

    • $a_{ii}(i=1,2,\cdots,n)$中至少有一个不为零,不妨设$a_{11}\neq 0$,这时 $$ f(x_1,x_2,\cdots,x_n)=a_{11}x_1^2+\sum_{j=2}^n{a_{1j}x_1x_j}+\sum_{i=2}^n{a_{i1}x_ix_1}+\sum_{i=2}^n\sum_{j=2}^{n}{a_{ij}x_ix_j} \ =a_{11}x_1^2+2\sum_{j=2}^n{a_{1j}x_1x_j}+\sum_{i=2}^n\sum_{j=2}^{n}{a_{ij}x_ix_j} \ (合并x_1出现的交叉项)\ =a_{11}(x_1+\sum_{j=2}^n{a_{11}^{-1}a_{1j}x_j})^2-a_{11}^{-1}(\sum_{j=2}^n{a_{1j}x_j})^2+\sum_{i=2}^n\sum_{j=2}^{n}{a_{ij}x_ix_j} \ (把x_1凑成平方和) \ =a_{11}(x_1+\sum_{j=2}^n{a_{11}^{-1}a_{1j}x_j})^2+\sum_{i=2}^n\sum_{j=2}^{n}{b_{ij}x_ix_j} \ 这里\sum_{i=2}^n\sum_{j=2}^{n}{b_{ij}x_ix_j}=-a_{11}^{-1}(\sum_{j=2}^n{a_{1j}x_j})^2+\sum_{i=2}^n\sum_{j=2}^{n}{a_{ij}x_ix_j}是一个x_2,x_3,\cdots,x_n的二次型 $$ 令 $$ \begin{cases} y_1=x_1+\sum_{j=2}^{n}{a_{11}^{-1}a_{1j}x_j} \ y_2=x_2\ \ \ \ \cdots \cdots \ y_n=x_n \ \end{cases} $$ 即 $$ \begin{cases} x_1=y_1-\sum_{j=2}^{n}{a_{11}^{-1}a_{1j}y_j} \ x_2=y_2\ \ \ \ \cdots \cdots \ x_n=y_n \ \end{cases} $$ 这是一个非退化线性替换,它使 $$ f(x_1,x_2,\cdots,x_n)=a_{11}y_1^2+\sum_{i=2}^n\sum_{j=2}^{n}{b_{ij}y_iy_j} $$

    • 所有$a_{ii}=0$,但至少有一$a_{qj}\neq 0(j>1)$,不妨设$a_{12}\neq 0$

    ​ 令 $$ \begin{cases} x_1=z_1+z_2 \ x_2=z_1-z_2\ x_3=z_3\ \ \ \ \cdots \cdots \ x_n=z_n \ \end{cases} $$ ​ 它是非线性替换,且使 $$ f(x_1,x_2,\cdots,x_n)=2a_{12}x_1x_2+\cdots \ =2a_{12}(z_1+z_2)(z_1-z_2)+\cdots \ =2a_{12}z_1^2-2a_{12}z_2^2 $$ ​ 这时上式右端是$z_1,z_2,\cdots,z_n$的二次型,且$z_1^2$的系数不为零。

  • 合同变换法

    • $a_{11}\neq 0$.这时的变数替换为 $$ \begin{cases} x_1=y_1-\sum_{j=2}^{n}{a_{11}^{-1}a_{1j}y_j} \ x_2=y_2\ \ \ \ \cdots \cdots \ x_n=y_n \ \end{cases} $$ 令 $$ C_1= \left ( \begin{matrix} 1 & -a_{11}^{-1}a_{12} & \cdots & -a_{11}^{-1}a_{1n} \ 0 & 1 & \cdots & 0 \ \vdots & \vdots & & \vdots \ 0 & 0 & \cdots & 1 \

      \end{matrix} \right ) $$ 则上述变数替换相应于合同变换 $$ A \rightarrow C_1^{'}AC_1= \left ( \begin{matrix} a_{11} & O \ O &A_1-a_{11}^{-1}a'a\ \end{matrix} \right )\ 这里 a=(a_{12},\cdots,a_{1n}),A_1=\left ( \begin{matrix} a_{22} & \cdots & a_{2n} \ \vdots & & \vdots \ a_{n2} & \cdots & a_{nn} \ \end{matrix} \right ) $$

    • $a_{ii}=0,i=1,\cdots,n$但有一$a_{ij}\neq0,j\neq1$

      作合同变换$P(2,j)'AP(2,j)$ 可以把$a_{1j}$搬到第一行第二列的位置,这样就变成了配方法中第二种情况。

      与第二种情形的变数替换相对应,取 $$ C_1=

      \left ( \begin{matrix} 1 & 1 &0& \cdots & 0 \ 1 & -1 &0& \cdots & 0 \ 1 & 1 &1& \cdots & 0 \ \vdots & \vdots & \vdots& \cdots & 0 \ 0 & 0 &0& \cdots & 1 \end{matrix} \right ) $$ 于是$C_1'AC_1$的左上角就是 $$ \left ( \begin{matrix} a_{12} & 0 \ 0 & -2a_{12} \ \end{matrix} \right ) $$ 可以归结到第一种情形

规范形

  • 复二次型的规范形

    设$f(x_1,x_2,\cdots,x_n)$是一个复系数的二次型,经过一系列适当的非退化线性替换后,$f(x_1,x_2,\cdots,x_n)$变成标准形。

    不妨假定它的标准形是$d_1y_1^2+d_2y_2^2+\cdots+d_ry_r^2,d_i\neq 0,i=1,2,\cdots,r$,易知$r$就是$f(x_1,x_2,\cdots,x_n)$的秩。

    因为复数总是可以开平方的,我们再做一个非退化的线性替换 $$ \begin{cases} y_1=\frac{1}{\sqrt{d_1}}z_1 \ \ \ \ \cdots \cdots \ y_r=\frac{1}{\sqrt{d_r}}z_r\ \ \ \ \cdots \cdots \ y_{r+1}=z_{r+1}\ \ \ \ \cdots \cdots \ y_n=z_n \ \end{cases} $$ 就变成 $$ z_1^2+z_2^2+\cdots+z_r^2 $$ 上式称为复二次型的规范形

  • 定理 任意一个复系数的二次型,经过一个适当的非退化线性替换可以变成规范形,并且规范形是唯一的

  • 定理 任一复数的对称矩阵都合同于一个形式为 $$ \left ( \begin{matrix} 1 & & & & & &\ &\ddots & & & & & \ & & 1 & & & & \ & & & 0& & & \ & & & &\ddots & & \ & & & & & & 0 \ \end{matrix} \right ) $$ 的对角矩阵,其中对角线上1的个数$r$等于$A$的秩。

    两个复数对称矩阵合同的充分必要条件是它们的秩相等。

  • 实二次型的规范形

    设$f(x_1,x_2,\cdots,x_n)$是一个实系数的二次型,经过一系列适当的非退化线性替换后,再适当排列文字的次序,可使$f(x_1,x_2,\cdots,x_n)$变成标准形 $$ d_1y_1^2+\cdots+d_py_p^2-d_{p+1}y_{p+1}^2-\cdots-d_ry_r^2,d_i>0,i=1,\cdots,r;r是二次型的秩 $$ 因为在实数域中,正实数总是可以开平方的,我们再做一个非退化的线性替换

$$ \begin{cases} y_1=\frac{1}{\sqrt{d_1}}z_1 \\ \ \ \ \cdots \cdots \\ y_r=\frac{1}{\sqrt{d_r}}z_r\\ y_{r+1}=z_{r+1}\\ \ \ \ \cdots \cdots \\ y_n=z_n \\ \end{cases} $$

​ 就变成 $$ z_1^2+\cdots+z_p^2-z_{p+1}^2-\cdots-z_{r}^2 $$ ​ 上式称为实二次型的规范形,显然,规范形完全被$r,p$这两个数所决定。

  • 定理 任意一个实系数的二次型,经过一个适当的非退化线性替换可以变成规范形,并且规范形是唯一的。

  • 任一复数的对称矩阵都合同于一个形式为 $$ \left ( \begin{matrix} 1 & & & & & &\ &\ddots & & & & & \ & & 1 & & & & \ & & & -1& & & \ & & & &\ddots & & \ & & & & & & -1 \ & & & & & & &0 \ & & & & & & & &\ddots \ & & & & & & & & &0 \ \end{matrix} \right ) $$ 的对角矩阵,其中对角线上1的个数$p$及-1的个数$r-p$($r$是矩阵$A$的秩)都是唯一确定的,分别称为$A$的正、负惯性指数,它们的差$2p-r$称为$A$的符号差

两个复数对称矩阵合同的充分必要条件是它们的秩相等。

正定二次型

正定二次型

  • 定义 正定二次型 实二次型$f(x_1,x_2,\cdots,x_n)$称为正定的,如果对于任意一组不全为零的实数$c_1,c_2,\cdots,c_n$都有$f(c_1,c_2,\cdots,c_n)$>0。
  • 定理 $n$元实二次型$f(x_1,x_2,\cdots,x_n)$是正定的的充分必要条件是它的正惯性指数等于$n$。

正定矩阵

  • 定义 正定矩阵 实对称矩阵$A$称为正定的,如果二次型$X'AX$正定。
  • 一个实对称矩阵是正定的当且仅当它与单位矩阵合同。
    • 正定矩阵的行列式大于零。

顺序主子式

  • 定义 顺序主子式

    子式 $$ H_i=\left | \begin{matrix} a_{11} & a_{12} & \cdots & a_{1i} \ a_{21} & a_{22} & \cdots & a_{2i} \ \vdots & \vdots & & \vdots \ a_{i1} & a_{i2} & \cdots & a_{ii} \ \end{matrix} \right | (i=1,2,\cdots,n) $$ 称为矩阵$A=(a_{ij})_{nn}$的顺序主子式。

  • 定理 实二次型 $$ f(x_1,x_2,\cdots,x_n)=\sum_{i=1}^n\sum_{j=1}^n{a_{ij}x_ix_j}=X'AX $$ 是正定的充分必要条件为矩阵$A$的顺序主子式全大于零。

  • 定义 设$f(x_1,x_2,\cdots,x_n)$是一实二次型,对于任意一组不全为零的实数$c_1,c_2,\cdots,c_n$

    • 如果都有$f(c_1,c_2,\cdots,c_n)<0$,那么$f(x_1,x_2,\cdots,x_n)$ 称为负定的
    • 如果都有$f(c_1,c_2,\cdots,c_n)\geq0$,那么$f(x_1,x_2,\cdots,x_n)$ 称为半正定的
    • 如果都有$f(c_1,c_2,\cdots,c_n)\leq0$,那么$f(x_1,x_2,\cdots,x_n)$ 称为半负定的
    • 如果它既不是半正定又不是半负定,那么$f(x_1,x_2,\cdots,x_n)$ 称为不定的

半正定性

  • 定理 对于实二次型$f(x_1,x_2,\cdots,x_n)=X'AX$,其中$A$是实对称的,下列条件等价:

    1. $f(x_1,x_2,\cdots,x_n)$是半正定的;

    2. 它的正惯性指数和秩相同;

    3. 有可逆实矩阵$C$,使 $$ C'AC= \left ( \begin{matrix} d_1 & & \ &d_2 & & \ & &\ddots & \ & & & d_n \

      \end{matrix} \right ) ,d_i\geq0.i=1,2,\cdots,n; $$

  1. 有实矩阵$C$使 $A=C'C$

  2. $A$的所有主子式(行指标与列指标相同的子式)皆大于或等于零。