20.09.2019

Виды матриц. Ступенчатый вид матрицы. Приведение матрицы к ступенчатому и треугольному виду. Многочленные матрицы


1. Выясним сначала, к какому сравнительно простому виду можно привести прямоугольную многочленную матрицу путем применения одних только левых элементарных операций.

Допустим, что в первом столбце матрицы имеются элементы, не равные тождественно нулю. Возьмем среди них многочлен наименьшей степени и путем перестановки строк сделаем его элементом . После этого разделим многочлен на ; частное и остаток обозначим через и

Вычтем теперь из -й строки первую строку, предварительно умноженную на . Если при этом не все остатки равны тождественно нулю, то тот из них, который не равен нулю и имеет наименьшую степень, может быть перестановкой строк поставлен на место . В результате всех этих операций степень многочлена понизится.

Теперь мы снова повторим этот процесс и т. д. Так как степень многочлена конечна, то на некотором этапе этот процесс уже нельзя будет продолжить, т. е. на этом этапе все элементы окажутся равными тождественно нулю.

После этого возьмем элемент и применим ту же процедуру к строкам с номерами . Тогда добьемся того, что и . Продолжая так далее, мы в конце концов приведем матрицу к следующему виду:

(5)

Если многочлен не равен тождественно нулю, то, применяя левую элементарную операцию второго типа, мы сделаем степень элемента меньшей, нежели степень (если имеет нулевую степень, то станет тождественно равен нулю). Точно так же, если , то при помощи левых элементарных операций второго типа мы сделаем степени элементов меньшими, нежели степень , не изменив при этом элемента , и т. д.

Мы установили следующую теорему:

Теорема 1. Произвольная прямоугольная многочленная матрица с размерами при помощи левых элементарных операций всегда может быть приведена к виду (5), где многочлены имеют меньшую степень, нежели , если только , и все равны тождественно нулю, если .

Совершенно аналогично доказывается

Теорема 2. Произвольная прямоугольная многоценная матрица с размерами при помощи правых элементарных операций всегда может быть приведена к виду

(6)

где многочлены имеют меньшую степень, нежели , если только , и все равны тождественно нулю, если .

2. Из теорем 1 и 2 вытекает следующее

Следствие. Если определитель квадратной многоценной матрицы не зависит от и отличен от нуля, то эту матрицу можно представить в виде произведения конечного числа элементарных матриц.

Действительно, согласно теореме 1 матрицу при помощи левых элементарных операций можно привести к виду

(7)

где – порядок матрицы . Так как при применении элементарных операций к квадратной многочленной матрице определитель этой матрицы умножается лишь на постоянный отличный от нуля множитель, то определитель матрицы (7), как и определитель , не зависит от и отличен от нуля, т. е.

.

Но тогда в силу той же теоремы 1 матрица (7) имеет диагональный вид и потому может быть приведена при помощи левых элементарных операций типа 1 к единичной матрице . Тогда и обратно, единичную матрицу можно привести к при помощи левых элементарных операций с матрицами . Следовательно,

Из доказанного следствия получаем (см. стр. 137 – 138) равносильность двух определений 2 и 2" эквивалентности многочленных матриц.

3. Вернемся к нашему примеру системы дифференциальных уравнений (4). Применим теорему 1 к матрице операторных коэффициентов . Тогда, как было указано на стр. 138, система (4) заменится равносильной системой

(4")

где . В этой системе мы функции можем выбрать произвольно, после чего последовательно определятся функции , причем на каждом этапе этого определения приходится интегрировать одно дифференциальное уравнение с одной неизвестной функцией.

4. Перейдем теперь к установлению «канонического» вида, к которому можно привести прямоугольную многочленную матрицу , применяя к ней как левые, так и правые элементарные операции.

Среди всех не равных тождественно нулю элементов матрицы возьмем тот элемент, который имеет наименьшую степень относительно , и путем соответствующей перестановки строк и столбцов сделаем его элементом . После этого найдем частные и остатки от деления многочленов и на :

Если хотя бы один из остатков , например , не равен тождественно нулю, то, вычитая из -го столбца первый столбец, предварительно помноженный на , мы заменим элемент остатком , который имеет меньшую степень, нежели . Тогда мы имеем возможность снова уменьшить степень элемента, стоящего в левом верхнем углу матрицы, поместив на это место элемент с наименьшей степенью относительно .

Если же все остатки ; равны тождественно нулю, то, вычитая из -й строки первую, помноженную предварительно на , а из -го столбца – первый, предварительно помноженный на , мы приведем нашу многочленную матрицу к виду

Если при этом хотя бы один из элементов не делится без остатка на , то, прибавляя к первому столбцу тот столбец, который содержит этот элемент, мы придем к предыдущему случаю и, следовательно, снова сможем заменить элемент многочленом меньшей степени., мы матрицу (8) приведем к виду строк на соответствующие отличные от нуля числовые множители, мы сможем добиться того, чтобы старшие коэффициенты многочленов, и установим формулы, связывающие эти многочлены с элементами матрицы .

Любая квадратичная форма с помощью невырожденного линейного преобразования может быть приведена к каноническому виду , определенному формулой

где форма f ранга от n неизвестных; числа, , считаются положительными, но часть слагаемых формулы (VII.5) могут быть отрицательными.

При таком условии заменой , ; и , невырожденное линейное преобразование приводит квадратичную форму к нормальному виду, то есть

Общее число квадратов равно рангу квадратичной формы.

Существует много линейных преобразований, приводящих квадратичную форму к нормальному виду (VII.6), но с точностью до расположения знаков такое приведение единственное .

Для квадратичных действительных форм выполняется закон инерции . Число положительных и отрицательных квадратов в нормальном виде, к которому приводится данная квадратичная форма с действительными коэффициентами действительным линейным преобразованием, не зависит от выбора этого преобразования.

Число положительных (отрицательных) квадратов в нормальной форме формы f называется положительным (отрицательным) индексом инерции (в формуле (VII.6) это k ), разница между положительными и отрицательными индексами инерции называется сигнатурой формы f (в формуле (VII.6) она равна r -k ).

Пусть дана квадратная матрица размерности n квадратичной формы f . Миноры, расположенные по главной диагонали этой матрицы, порядков 1, 2, …, n , последний из них совпадает с определителем матрицы , , то есть

называются главными минорами формы f .

Теорема VII.1. Квадратичная форма f от n неизвестных с действительными коэффициентами тогда и только тогда будет состоять из положительных членов, когда все главные миноры положительны.

Пример VII.3. Квадратичная форма

положительно определена, так как все главные миноры матрицы положительны:

, , .

Приводить квадратичную форму к каноническому виду можно, как уже отмечалось, многими способами, но нормальный вид один. Покажем это на примере.

Пример VII.4. Привести к каноническому виду квадратичную форму .

Решение . Зададим линейное преобразование:

1) тогда получим .

Для другого преобразования имеем

2) тогда получим .

Нормальный вид квадратичной формы, которому соответствуют оба канонических вида, .

Упражнение. Проверить справедливость полученных формул непосредственной подстановкой преобразований 1) и 2) в исходную квадратичную форму.

Вполне естественно возникает вопрос: «Как найти матрицу линейного преобразования (оператора)?»

Прежде чем перейти к рассмотрению следующего примера, дадим некоторые пояснения. Не нарушая сущности общего подхода, ограничимся уравнением

где правая часть есть квадратичная форма, заданная в декартовой системе координат . С другой стороны, это выражение определяет линию второго порядка. Ясно что если правая часть последнего равенства представлена суммой квадратов переменных

,

то имеем канонический вид квадратичной формы.

Оба уравнения будут описывать одну и ту же линию второго порядка, если в форме h сохранен прежний масштаб. Для получения канонического вида H обычно используют характеристическое уравнение. Недостаток такого подхода состоит в том, что неизвестна связь между системами координат и . Образно говоря, мы не знаем расположение линии L в системе координат , если она записана в каноническом виде h . Такой переход можно осуществить поворотом осей системы координат на угол j (рис. VII.1), то есть перейти от координат x , y к x 1 , y 1 по формулам

Для обратного преобразования необходимо заменить угол j
на -j .

Чтобы узнать расположение линии, мы должны найти преобразование координат, приводящее равенство H к виду h . Заметим, что для сохранения масштаба следует перейти к ортонормированной системе координат.

Пример VII.5. Задана квадратичная форма в декартовой системе координат

Требуется привести ее к каноническому виду, то есть записать ее вид в системе и найти линейное преобразование. Получить нормальный вид квадратичной формы.

Решение . Составим симметричную матрицу линейного преобразования (оператора) A

.

Построим характеристический многочлен и найдем собственные числа и собственные векторы. Затем будем последовательно выполнять задания примера. Имеем

Характеристическое уравнение представляется равенством

.

Вычислив определитель матрицы, получим многочлен , корни которого , являются собственными числами. Запишем канонический вид формы (VII.7):

Найдем линейное преобразование, то есть установим связь между системами и . Так как корни действительные и различные и нет нулей, то преобразование невырожденное. Найдем собственные векторы в базисе (векторы будем представлять столбцами). Для этого решим систему уравнений

определенную для каждого из собственных чисел.

При , из (VII.8) имеем матричное уравнение

.

Полагая, с необходимостью, , получим

при , имеем . Первый собственный вектор найден , его длина .

При имеем

или

Прибавляя к первому уравнению второе и, замечая, что если полученное уравнение решать как систему с третьим, то с необходимостью перейдем к первому собственному вектору. Остается составить систему уравнений из суммы двух первых и второго уравнения, тогда получим

Полагая , после упрощений получим систему

Т" = с (i), Т" = 1………….(i), Т"" = 0…1……….(i) b(λ)……….(j) 1…0……….(j) .

В результате применения правой элементарной операции матрица А(λ) умножается справа на соответствующую матрицу Т.

Заметим, что матрица Т" совпадает с матрицей S", а матрицы Т", Т"" совпадают с матрицами S", S"", если в последних поменять местами индексы i и j. Матрицы типа S", S", S"" (или, что то же, типа Т", Т", Т"") называются элементарными.

Две λ-матрицы А(λ) и B(λ) одинаковых размеров m x n называются эквивалентными, А(λ) ~ B(λ), если от матрицы А(λ) к B(λ) можно перейти при помощи цепочки из конечного числа элементарных преобразований. Отношение эквивалентности обладает тремя основными свойствами:

1) рефлексивность: каждая матрица эквивалентна сама себе А(λ) ~ B(λ);

2) симметрия: если А(λ) ~ B(λ), то B(λ) ~ А(λ);

3) транзитивность: если А(λ) ~ B(λ), и B(λ) ~ С(λ), то А(λ) ~ С(λ).

§2. Канонический вид λ-матрицы

Выше было показано, что отношение эквивалентности транзитивно, симметрично и рефлексивно. Отсюда следует, что совокупность всех λ-матриц данных размеров m x n разбивается на непересекающиеся классы эквивалентных матриц, т.е. на такие классы, что любые две матрицы из одного класса эквивалентны, а из разных классов - не эквивалентны между собой. Возникает вопрос о канонической форме λ-матрицы, характеризующей данный класс эквивалентных λ-матриц.

Канонической диагональной λ-матрицей размеров m x n называется λ-матрица, у которой на главной диагонали стоят многочлены Е1(λ), Е2(λ), …, Ер(λ), где р - меньшее из чисел m и n, причем не равные нулю среди этих многочленов имеют старшие коэффициенты, равные единице, и каждый следующий многочлен делится на предыдущий, все же элементы вне главной диагонали равны нулю.

Т е о р е м а 1. Всякая λ-матрица конечным числом элементарных преобразований может быть приведена к канонической диагональной форме.

Доказательство. Пусть А(λ) - прямоугольная многочленная матрица. Применяя к А(λ) как левые, так и правые элементарные операции приведем к канонической диагональной форме.

Среди всех не равных нулю элементов аіј(λ) матрицы А(λ) возьмем тот элемент, который имеет наименьшую степень относительно λ, и путем соответствующей перестановки строк и столбцов сделаем его элементом а11(λ). После этого найдем частные и остатки от деления многочленов аі1(λ) и а1ј(λ) на а11(λ):

аі1(λ) = а11(λ) qі1(λ) + rі1 (λ), а1ј(λ) = а11(λ) q1ј(λ) + r1ј(λ)

(i = 2, 3, …, m; j = 2, 3, …, n).

Если хотя бы один из остатков rі1(λ), r1ј(λ) (i = 2, …, m; j = 2, …, n), например r1ј (λ), не равен тождественно нулю, то, вычитая из j-го столбца первый столбец, предварительно помноженный на q1ј(λ), мы заменим элемент а1ј(λ) остатком r1ј(λ), который имеет меньшую степень, нежели а11(λ). Тогда мы имеем возможность снова уменьшить степень элемента, стоящего в левом верхнем углу матрицы, поместив на это место элемент с наименьшей степенью относительно λ.

Если же все остатки r21(λ), … rm1(λ); r12(λ), …, r1n(λ) равны тождественно нулю, то, вычитая из i-ой строки первую, помноженную предварительно на qі1(λ) (i = 2, …, m), а из j-го столбца - первый, предварительно помноженный на q1ј(λ) (j = 2, …, n), мы приведем нашу матрицу к виду

а11(λ) 0 … 0

0 а22(λ) … а2n(λ)

….…………………… .

0 аm2(λ) … аmn(λ)

Если при этом хотя бы один из элементов аіј(λ) (i = 2, …, m; j = 2, …, n) не делится без остатка на а11(λ), то, прибавляя к первому столбцу тот столбец, который содержит этот элемент, мы придем к предыдущему случаю и, следовательно, снова сможем заменить элемент а11(λ) многочленом меньшей степени.

Поскольку первоначальный элемент а11(λ) имел определенную степень и процесс уменьшения этой степени не может неограниченно продолжаться, то после конечного числа элементарных операций мы должны получить матрицу вида

(*) 0 b22(λ) … b 2n(λ)

….…………………… ,

0 bm2 (λ) …bmn (λ)

в которой все элементы bіј(λ) делятся без остатка на а1(λ). Если среди этих элементов bіј(λ) имеются не равные тождественно нулю, то продолжая тот же процесс приведения для строк с номерами 2, …, m и столбцов с номерами 2, …, n, мы матрицу (*) приведем к виду

Таким образом мы доказали, что произвольная прямоугольная многочленная матрица А(λ) эквивалентна некоторой канонической диагональной.

Матрицы - удобный инструмент для решения самых различных алгебраических задач. Знание некоторых простых правил для оперирования с ними позволяет приводить матрицы к любым удобным и необходимым в данный момент формам. Часто полезным является использование канонической формы матрицы.

Инструкция

  • Запомните, что канонический вид матрицы не требует, чтобы на всей главной диагонали стояли единицы. Суть определения заключается в том, что единственные ненулевые элементы матрицы в ее каноническом виде – это единицы. Если они присутствуют, то располагаются на главной диагонали. При этом их количество может варьироваться от нуля до количества строчек в матрице.
  • Не забывайте, что элементарные преобразования позволяют любую матрицу привести к каноническому виду . Самая большая сложность – интуитивно найти наиболее простую последовательность цепочек действий и не ошибиться в вычислениях.
  • Выучите основные свойства операций со строчками и столбцами в матрице. К элементарным преобразованиям относят три стандартных преобразования. Это умножение строчки матрицы на любое ненулевое число, суммирование строк (в том числе прибавление к одной другой, умноженной на какое-то число) и их перестановка. Подобные действия позволяют получить матрицу эквивалентную данной. Соответственно, вы можете выполнить такие операции и со столбцами без потери эквивалентности.
  • Старайтесь не выполнять одновременно сразу несколько элементарных преобразований: продвигайтесь от этапа к этапу, чтобы не допустить случайной ошибки.
  • Найдите ранг матрицы, чтобы определить количество единиц на главной диагонали: это подскажет вам, какой окончательный вид будет иметь искомая каноническая форма, и избавит от необходимости выполнять преобразования, если требуется просто использовать ее для решения.
  • Воспользуйтесь методом окаймляющих миноров для того, чтобы выполнить предыдушую рекомендацию. Вычислите минор к-ого порядка, а также все окаймляющие его миноры степени (к+1). Если они равны нулю, то ранг матрицы есть число к. Не забывайте, что минор Мij – это определитель матрицы, получаемой при вычеркивании строки i и столбца j из исходной.

Говорят, что матрица размерности имеет канонический вид, если её можно разбить на четыре блока (некоторые из них могут оказаться пустыми), каждый из которых представляет собой подматрицуопределённого типа (подматрицей называется матрица, являющаяся частью исходной матрицы). Левый верхний блок – единичная матрица k -го порядка, два нижних блока – матрицы размерностей и , состоящие из нулей (на схеме эти матрицы обозначены большими жирными нулями). Правый верхний блок – произвольная матрица размерности . Число k > 0 и не превосходит чисел m и n .

Если , правые блоки отсутствуют, если , отсутствуют нижние (нулевые) блоки. Если , матрица состоит из одного (единичного) блока.

Приведём конкретные примеры матриц, имеющих канонический вид (точками обозначены те элементы матриц, конкретные значения которых роли не играют):

а) , б) , в) , г) .

В примере а) , (k совпадает с количеством строк), обе нулевые подматрицы отсутствуют; в примере б) (k совпадает с количеством столбцов), , оба правых блока отсутствуют, нулевая подматрица является матрицей-строкой; в примере в) , первая нулевая подматрица является матрицей-строкой, вторая нулевая подматрица состоит из одного элемента; в примере г) , , .

Часто в определении матрицы канонического вида вместо единичной подматрицы фигурирует треугольная подматрица. В этом случае говорят о матрице почти канонического вида. Поскольку единичная матрица – частный случай треугольной, матрицы канонического вида – частный случай матриц почти канонического вида. Если в схематическом изображении матрицы канонического вида единичную матрицу в левом верхнем блоке заменить треугольной, получится схемаматрицыпочти канонического вида.

Приведём примеры матриц, имеющих почти канонический вид:

а) , б) , в) , г) .

Следующие преобразования матриц называются допустимыми : перестановка строк; перестановка столбцов; умножение элементов строки матрицы на одно и то же число, отличное от нуля; прибавление к одной из строк матрицы другой строки, предварительно умноженной на некоторое число (в частности, вычитание одной строки из другой и прибавление одной строки к другой). Как будет показано далее, допустимые преобразования матриц отвечают тем действиям с системами линейных уравнений, которые не нарушают равносильности.

При помощи допустимых преобразований любую матрицу A можно привести к матрице , имеющей канонический вид .

Приведение матрицы к каноническому виду можно разбить на этапы, каждый из которых состоит из двух шагов – получения очередной единицы на главной диагонали и превращения соответствующего столбца в единичный столбец, то есть такой, у которого все элементы, за исключением диагонального, равны нулю.

Первый шаг осуществляется следующим образом. Если рассматриваемый диагональный элемент равен единице, переходим ко второму шагу. Если диагональный элемент не равен единице, но отличен от нуля, поделим на него все элементы его строки. Если диагональный элемент равен нулю, то поищем ненулевой элемент, расположенный либо в его (диагонального элемента) столбце, но ниже, либо в его строке, но правее, либо ниже и правее одновременно. Если такой элемент найдётся, сделаем его диагональным, переставив соответствующие строки (в первом случае), или столбцы (во втором), или строки и столбцы по очереди (в третьем). Если же такого элемента не найдётся, это будет означать, что процесс закончен.

Если первый шаг выполнен, а столбец, в котором стоит новый единичный диагональный элемент, содержит другой ненулевой элемент, прибавим к его строке строку диагонального элемента, умноженную на подлежащий уничтожению элемент, взятый с противоположным знаком.

Рассмотрим пример приведения матрицы к каноническому виду.

~ ~ ~

Первый диагональный Первый диагональный

элемент равен нулю. элемент отличен от нуля.

~ ~ ~ ~

Первый диагональный

элемент стал равным единице

~ ~ ~ ~