previous contents next

16 Квадратичные формы.

16.1 Многочлены от нескольких переменных.

Определение 16.1:
Пусть $R$ - кольцо с единицей, тогда кольцом многочленов от двух переменных над кольцом $R$ называется кольцо многочленов над кольцом $R[x]$.
Кольцо многочленов от двух переменных над кольцом $R$ обозначают $R[x,y]$.

Элементом кольца многочленов от двух переменных является последовательность вида $a(x,y)=(a_0(x),a_1(x),\ldots,a_k(x),...)$, где для любого $i\in\mathbb{N}_0$ $a_i(x)\in{R}[x]$ и существует $n\in\mathbb{N}$ такое, что для любого $i>n$ $a_i(x)=\overline{0}$. Если обозначить $$x:=\bigl((0,e,0,\ldots),(0,\ldots),\ldots\bigr)\in{R}[x,y],$$ $$y:=\bigl((0,\ldots),(0,e,0,\ldots),(0,\ldots),\ldots\bigr)\in{R}[x,y],$$ $$\forall{a}\in\mathbb{R}(\overline{a}:=\bigl((a,0,\ldots),(0,\ldots),\ldots)\bigr)\in{R}[x,y]).$$ тогда если $m=\max{\{\deg{a_j(x)}\mid{i}\in\overline{1,n}\}}$, то многочлен $a(x,y)$ можно записать в виде $a(x,y):=a_0(x)+a_1(x)y+\cdots+a_n(x)y^n$, где для любого $j\in\overline{1,n}$ $a_i(x)=\overline{a}_{0,j}+\overline{a}_{1,j}x+\cdots+\overline{a}_{m,j}x^m\in{R}[x,y]$. Так же как и в случае записи многочлена от одной переменной (раздел 7.1) черточки над $a_{i,j}$ опускают, отождествляя $\overline{a}_{i,j}$ с элементом $a_{i,j}\in{R}$ стоящим на $i$-том месте в $j$-той последовательности многочлена $a(x,y)$. Тогда можно записать $$a(x,y)=\sum_{j\geq0}\left(\sum_{i\geq0}a_{i,j}x^i\right)y^j=\sum_{j\geq0}\sum_{i\geq0}a_{i,j}x^iy^j.$$ Последнее выражение называется канонической записью многочлена $a(x,y)$. Поскольку для любого $i,j\in\mathbb{N}_0$ элемент $a_{i,j}\in{R}$ - это элемент стоящий на $i$-том месте в $j$ - той последовательности многочлена $a(x,y)$, а многочлнены $x,y\in{R}[x,y]$ - суть константы от $a(x,y)$ не зависящие, то каноническая форма записи многочлена от двух переменных определена однозначно.
В силу сказанного выше можно ввести операцию умножения многочлена $a(x)\in{R}[x,y]$ на элемент кольца $a\in{R}$ такую, что $aa(x):=\overline{a}a(x)$, тогда, очевидно, что для любого $a\in{R}$ $ax=xa$, $ay=ya$, $xy=yx$. При этом для любых многочленов $a(x,y)=\sum_{i\geq0}\sum_{j\geq0}a_{i,j}x^iy^j$, $b(x,y)=\sum_{i\geq0}\sum_{j\geq0}b_{i,j}x^iy^j$ $$a(x,y)+b(x,y)=\sum_{i\geq0}\sum_{j\geq0}(a_{i,j}+b_{i,j})x^iy^j,$$ $$ a(x,y)b(x,y)=\left(\sum_{i_1\geq0}\sum_{j_1\geq0}a_{i_1,j_1}x^{i_1}y^{j_1}\right)\left(\sum_{i_2\geq0}\sum_{j_2\geq0}b_{i_2,j_2}x^{i_2}y^{j_2}\right)= \sum_{i_1,i_2,j_1,j_2\geq0}a_{i_1,j_1}b_{i_2,j_2}x^{i_1+i_2}y^{j_1+j_2}=\sum_{i,j\geq0}\left(\sum_{r=0}^i\sum_{s=0}^ja_{r,s}b_{i-r,j-s}\right)x^iy^j $$ Аналогично, индуктивным методом, строится кольцо многочленов от произвольного числа переменных.

Определение 16.2:
Если $R[x_1,\ldots,x_{n-1}]$ кольцо многочленов от $n-1$ переменных над кольцом $R$ с единицей, то кольцо $$R[x_1,\ldots,x_{n-1},x_n]:=R[x_1,\ldots,x_{n-1}][x_n]$$ называется кольцом многочленов от $n$ переменных над кольцом $R$.

Аналогичным образом определяется каноническая форма записи многочлена от $n$ переменных.
Для любых двух многочленов от $n$ переменных $$a(x_1,\ldots,x_n)=\sum_{(i_1,\ldots,i_n)\in\mathbb{N}_0^n}a_{i_1,\ldots,i_n}x_1^{i_1}\cdots{x}_n^{i_n},$$ $$b(x_1,\ldots,x_n)=\sum_{(i_1,\ldots,i_n)\in\mathbb{N}_0^n}b_{i_1,\ldots,i_n}x_1^{i_1}\cdots{x}_n^{i_n}$$ $$a(x_1,\ldots,x_n)+b(x_1,\ldots,x_n)=\sum_{(i_1,\ldots,i_n)\in\mathbb{N}_0^n}(a_{i_1,\ldots,i_n}+b_{i_1,\ldots,i_n})x_1^{i_1}\cdots{x}_n^{i_n},$$ $$ a(x_1,\ldots,x_n)b(x_1,\ldots,x_n)=\\=\sum_{(i_1,\ldots,i_n)\in\mathbb{N}_0^n}\left(\sum_{r_1=0}^{i_1}\ldots \sum_{r_n=0}^{i_n}a_{r_1,\ldots,r_n}b_{i_1-r_1,\ldots,i_n-r_n}\right)x_1^{i_1}\cdots{x}_n^{i_n}. $$

Определение 16.3:
Если каноническая запись многочлена $a(x_1,\ldots,x_n)$ содержит одно слагаемое, то есть $a(x_1,\ldots,x_n)=ax_1^{i_1}\cdots{x}_n^{i_n}$, $a\neq0$ то степенью многочлена называется число $\deg(ax_1^{i_1}\cdots{x}_n^{i_n}):=i_1+\cdots+i_n$.
Степенью ненулевого многочлена $a(x_1,\ldots,x_n)$ называется число $\deg{a(x_1,\ldots,x_n)}$ равное максимальной из степеней его одночленов.
Степенью нулевого многочлена от $n$ переменных называют минус бесконечность ($\deg{\overline{0}}=-\infty$)

Утверждение 16.1:

  1. кольцо $R[x_1,\ldots,x_n]$ коммутативно тогда и только тогда, когда кольцо $R$ коммутативно,
  2. кольцо $R[x_1,\ldots,x_n]$ с делителями нуля тогда и только тогда, когда кольцо $R$ с делителями нуля.

Доказательство:

  1. Доказывается аналогично теореме 7.1.
  2. Доказывается аналогично п. 2 следствия 7.1.

Определение 16.4:
Пусть $a(x)\in{R}[x_1,\ldots,x_n]$, $\vec{b}:=(b_1,\ldots,b_n)\in{R}^n$, тогда элемент кольца $R$ $$a(b_1,\ldots,b_n):=a(\vec{b}):=\sum_{(i_1,\ldots,i_n)\in\mathbb{N}_0^n}a_{i_1,\ldots,i_n}b_1^{i_1}\cdots{b}_{n}^{i_n}$$ называется значением многочлена $a(x_1,\ldots,x_n)$ на наборе $\overline{b}$.

Если кольцо $R$ коммутативно, то аналогично лемме 7.1 показывается, что значение суммы многочленов на наборе $\vec{b}$ равно сумме значений многочленов на наборе $\overline{b}$ и значение произведение многочленов равно произведению значений многочленов.

16.2 Общие свойства квадратичной формы.

Определение 16.5:
Квадратичной формой над полем $P$ называется многочлен $f(x_1,\ldots,x_n):=f(\vec{x})\in{P}[x_1,\ldots,x_n]$ вида $$ f(\vec{x})=a_{1,1}x_1^2+a_{1,2}x_1x_2+\cdots+a_{1,n}x_1x_n+x_{2,2}x_2^2+\cdots+a_{n,n}x_n^2= \sum_{i=1}^n\sum_{j=1}^na_{i,j}x_ix_j=\sum_{i,j=1:i<j}^n(a_{i,j}+a_{j,i})x_ix_j+\sum_{i=1}^na_{i,i}x_i^2. $$
Далее везде будем рассматривать квадратичные формы только над полями таким, что $e+e\neq0$. Тогда для любых $i,j\in\overline{1,n}$ можно положить $b_{i,j}=(a_{i,j}+a_{j,i})(2e)^{-1}$. Тогда для любых $i,j\in\overline{1,n}$ $a_{i,j}+a_{j,i}=b_{i,j}+b_{j,i}$, следовательно, квадратичная форма $f(\vec{x})$ может быть записана в виде $$f(\vec{x})=\sum_{i,j=1}^nb_{i,j}x_ix_j=\sum_{i,j=1}^na_{i,j}x_ix_j.$$ Тогда матрица $B_f:=(b_{i,j})_{n,n}$ называется матрицей квадратичной формы $f(\vec{x})$.

Замечание 16.1:

  1. Так как для любых $i,j\in\overline{1,n}$ $b_{i,j}=b_{j,i}$ то $B_f=B_f^T$.
  2. Для любых квадратичных форм $f(x_1,\ldots,x_n)$, $g(x_1,\ldots,x_n)$ $$f(\vec{x})=g(\vec{x})\Leftrightarrow{B}_f=B_g.$$
  3. Для любой квадратичной формы $f(\vec{x})$ $$f(\vec{x})=\vec{x}B_f\vec{x}^T.$$
  4. Таким образом, матрица квадратичной формы это матрица, которая удовлетворяет двум условиям $f(\vec{x})=\vec{x}A\vec{x}^T$ и $A=A^T$. Несложно видеть, что такая матрица единственна.

Определение 16.6:
Говоря, что квадратичная форма $g(\vec{y})\in{P}[y_1,\ldots,y_n]$ получена из квадратичной формы $f(\vec{x})\in{P}[x_1,\ldots,x_n]$ невырожденной заменой переменных $x^{\downarrow}=Cy^{\downarrow}$, если $C\in(P_{n,n})^*$ и $$\forall\vec{y}\in{P}^n\left(f(\vec{C}_1\vec{y}^T,\ldots,\vec{C}_n\vec{y}^T)=g(\vec{y})\right).$$

Утверждение 16.2:
Пусть $C\in(P_{n,n})^*$, тогда квадратичная форма $g(\vec{y})$ получена из квадратичной формы $f(\vec{x})$ невырожденной заменой переменных $x^{\downarrow}=Cy^{\downarrow}$ тогда и только тогда, когда $B_g=C^TB_fC$.

Доказательство:

$\Rightarrow)$ Фиксируем $\vec{y}\in{P}^n$, тогда $$ \forall\vec{x}\in{P}^n(f(\vec{x})=\vec{x}B_f\vec{x}^T)\Rightarrow {g}(y)=f\left(\vec{C}_1y_1^{\downarrow},\ldots,\vec{C}_ny^{\downarrow}\right)=(Cy^{\downarrow})^TB_f(Cy^{\downarrow})=\vec{y}(C^TB_fC)y^{\downarrow}. $$ При этом, так как $B_f$ - матрица квадратичной формы, то $$B_f=B_f^T\Rightarrow(C^TB_fC)^T=C^TB_f^T(C^T)^T=C^TB_fC,$$ то есть матрица $C^TB_fC$ симметрична. Таким обрзом, матрица $C^TB_fC$ являтеся матрицой квадратичной формы $g(\vec{y})$.
$\Leftarrow)$ Фиксируем $\vec{y}\in{P}^n$, тогда $$ g(\vec{y})=\vec{y}B_fy^{\downarrow}=\vec{y}(C^TB_fC)y^{\downarrow}=(Cy^{\downarrow})^TB_f(Cy^{\downarrow})= f\left(\vec{C}_1y^{\downarrow},\ldots,\vec{C}_ny^{\downarrow}\right). $$

Определение 16.7:
Две квадратичные формы называются эквивалентными, если одна может быть получена из другой невырожденной заменой переменных.
Если квадратичаные формы $f(x_1,\ldots,x_n)$ и $g(y_1,\ldots,y_n)$ эквивалентны, то обозначают $f(\vec{x})\sim{g}(\vec{y})$.

Утверждение 16.3:
Отношение эквивалентности квадратичных форм являтеся отношением эквивалентности.

Доказательство:

Определение 16.8:
Квадратичную форму вида $$f(x_1,\ldots,x_n)=b_{1,1}x_1^2+b_{2,2}x_2^2+\cdots+b_{n,n}x_n^2$$ назовем канонической.

Теорема 16.1:
Любая квадратичная форма над полем харктеристики больше 2 (т. е. $2e\neq0$) эквивалентна некоторой канонической.

Доказательство:

Докажем индукцией по $n$.

  1. При $n=1$ любая квадратичная форма имеет вид $a_{1,1}x_1^2$.
  2. Для любого $n\geq1$ докажем, что если утверждение верно при $n\in\overline{1,m}$, то оно верно при $n=m+1$.
    Если $f(\vec{x})=0$, то $f(\vec{x})=0x_1^2+\cdots+0x_n^2$, то есть $f(\vec{x})$ каноническая.
    Пусть $f(\vec{x})\neq0$, то есть существуют $i,j\in\overline{1,n}$ такие, что $b_{i,j}\neq0$.
    1. Пусть $i=j$, б. о. о. будем считать, что $b_{1,1}\neq0$, тогда $$ f(x_1,\ldots,x_n)=b_{1,1}x_1^2+2b_{1,2}x_1x_2+\cdots+2b_{1,n}x_1x_n+f_1(x_2,\ldots,x_n)= b_{1,1}^{-1}(b_{1,1}^2x_1^2+2b_{1,2}b_{1,1}x_1x_2+\cdots+2b_{1,n}b_{1,1}x_1x_n)+f_1(x_2,\ldots,x_n)=\\= b_{1,1}^{-1}(b_{1,1}x_1^2+b_{1,2}x_2+\cdots+b_{1,n}x_n)^2+f_2(x_1,\ldots,x_n) $$ Рассмотрим квадратичную форму $g(\vec{y}):=b_{1,1}^{-1}y_1^2+f_2(y_2,\ldots,y_n)$. Квадратичная форма $f(\vec{x})$ получается из $g(\vec{y})$ заменой переменных $$ y^{\downarrow}=\begin{pmatrix}b_{1,1} & b_{1,2} & \cdots & b_{1,n} \\ 0 & e & \cdots & 0 \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \cdots & 0\end{pmatrix}x^{\downarrow}, $$ так как определитель матрицы перехода равен $b_{1,1}\neq0$, то она обратима, то есть $f(\vec{x})\sim{g}(\vec{y})$.
      По предположению индукции существует каноническая квадратичная форма $$h(z_2,\ldots,z_n):=c_2z_2^2+\cdots+{c}_nz_n^2$$ такая, что $f_2(x_2,\ldots,x_n)\sim{h}(z_2,\ldots,z_n)$ при замене переменных $$\begin{pmatrix}y_2 \\ \vdots \\ y_n\end{pmatrix}=D\begin{pmatrix}z_2 \\ \vdots \\ z_n\end{pmatrix},$$ где $D\in(P_{n-1,n-1})^*$. Следовательно, каноническая квадратичная форма $t(z_1,\ldots,z_n):=b_{1,1}^{-1}z_1^2+c_2z_2^2+\cdots+c_nz_n^2$ получается их квадратичной формы $g(\vec{y})$ заменой переменных $$y^{\downarrow}=\begin{pmatrix}e & 0 & \cdots & 0 \\ 0 & & \\ \vdots & & D & \\ 0 & &\end{pmatrix}z^{\downarrow},$$ то есть $f(\vec{x})\sim{g}(\vec{y})\sim{h}(\vec{z})$.
    2. Пусть $i\neq{j}$, б. о. о. будем считать, что $b_{1,2}\neq0$ и для любого $k\in\overline{1,n}$ $b_{k,k}=0$ тогда $$f(x_1,\ldots,x_n)=2b_{1,2}x_1x_2+f_1(x_1,\ldots,x_n)$$ где квадратичная форма $f_1(x_1,\ldots,x_n)$ такая, что у неё коэффициенты при $x_1x_2$, $x_2x_1$ и $x_{k,k}$ для любого $k\in\overline{1,n}$ равны 0. Произведем замену переменных $x^{\downarrow}=Cy^{\downarrow}$ такую, что $x_1=y_1+y_2$, $x_2=y_1-y_2$ и для любого $i\in\overline{3,n}$ $x_i=y_i$. Тогда $$C= \begin{pmatrix} e & e & 0 & \cdots & 0 \\ e & -e & 0 & \cdots & 0 \\ 0 & 0 & e & & 0 \\ \vdots & \vdots & & \ddots & \vdots \\ 0 & 0 & \cdots & \cdots & e \\ \end{pmatrix} $$ Так как $|C|=2e\neq0$, то $C\in(P_{n,n})^*$, то есть замена переменных не вырождена и $$f(\vec{x})\sim{g}(\vec{y})=2b_{1,2}y_1^2-2b_{1,2}y_2^2+g_1(y_1,\ldots,y_n),$$ где квадратичная форма $g_1(y_1,\ldots,y_n)$ такая, что коэффициент при $y_1^2$ равен 0. Так как $b_{1,2}\neq0$, то по пункту (a) квадратичная форма $g(\vec{y})$ эквивалентна некоторой канонической.

Замечание 16.2:
Условие $2e\neq0$ существенно, например, квадратичная форма $f(x_1,x_2)=x_1x_2$ над полем $GF(2)$ не эквивалентна никакой какнонической.

Определение 16.9:
Рангом квадратичной формы будем называть ранг матрицы этой формы.

Утверждение 16.4:
Ранги эквивалентных квадратичных форм равны.

Доказательство:

Пусть $f(\vec{x})\sim{g}(\vec{y})$ и $x^{\downarrow}=Cy^{\downarrow}$. Так как $C\in(P_{n,n})^*$, то $$\rang{g}=\rang{B_g}=\rang{C^TB_fC}=\rang{B_f}=\rang{f}.$$

previous contents next