русс | укр

Языки программирования

ПаскальСиАссемблерJavaMatlabPhpHtmlJavaScriptCSSC#DelphiТурбо Пролог

Компьютерные сетиСистемное программное обеспечениеИнформационные технологииПрограммирование

Все о программировании


Linux Unix Алгоритмические языки Аналоговые и гибридные вычислительные устройства Архитектура микроконтроллеров Введение в разработку распределенных информационных систем Введение в численные методы Дискретная математика Информационное обслуживание пользователей Информация и моделирование в управлении производством Компьютерная графика Математическое и компьютерное моделирование Моделирование Нейрокомпьютеры Проектирование программ диагностики компьютерных систем и сетей Проектирование системных программ Системы счисления Теория статистики Теория оптимизации Уроки AutoCAD 3D Уроки базы данных Access Уроки Orcad Цифровые автоматы Шпаргалки по компьютеру Шпаргалки по программированию Экспертные системы Элементы теории информации

Приближённое решение алгебраических и трансцендентных уравнений


Дата добавления: 2013-12-23; просмотров: 3370; Нарушение авторских прав


Точность рассмотренных нами квадратурных формул существенно зависит от выбора узлов . Если подынтегральная функция сильно извилиста, то есть имеет много нулей и много экстремумов, то в этом случае шаг интегрирования надо выбирать намного меньше расстояний между соседними нулями и экстремумами функции.

Квадратурные формулы наивысшей алгебраической степени точности (н.а.с.т.)

 

Ранее было получено, что интерполяционные квадратурные формулы построенные по узлам имеют алгебраическую степень точности по меньшей мере . Возникает вопрос существуют ли более точные квадратурные формулы более высокой степени точности и какова наивысшая степень точности квадратурных формул.

(1).

Формула (1) имеет неизвестных параметра: , - узлы квадратурной формулы, , - коэффициенты квадратурной формулы. Поэтому можно потребовать, чтоб квадратурная формула (1) была точной для любого алгебраического многочлена степени или что то же самое, чтоб она была точной для всех элементарных алгебраических многочленов (функции). В формуле (1) в качестве функции возьмём и потребуем, чтоб для таких функций формула (1) была точной ():

(2).

Система равенств (2) представляет собой систему нелинейных алгебраических уравнений относительно неизвестных и , . Решение этой системы на практике затруднительно в силу её нелинейности, особенно, если порядок системы большой (велико), поэтому будем строить квадратурные формулы алгебраической степени точности исходя из других соображений.

Теорема 1.Для того чтоб квадратурная формула (1) была точной для любого алгебраического многочлена степени не обходимо и достаточно:

1) чтоб она была интерполяционной: - узлы квадратурной формулы,

, (3).

2) чтобы многочлен был ортогонален с весом на отрезке интегрирования любому алгебраическому многочлену степени , то есть (4).



Заметим, что из теоремы 1 вытекают следующие правила построения квадратурной формулы н.а.с.т.:

1) Построить алгебраический многочлен степени вида: (5) ортогональный с весом на отрезке любому алгебраическому многочлену степени .

2) найти корни многочлена и взять их в качестве узлов квадратурной формулы (1) (- корень).

3) коэффициенты , формулы (1) вычислить по формуле (3).

Понятно, что самым сложным является реализация пункта 1, то есть построение многочлена .

Возможность построения многочлена с указанными свойствами даёт следующая теорема.

Теорема 2.Если весовая функция не меняет знак на отрезке интегрирования (для определённости ), то существует единственный многочлен вида (5) ортогональный с весом на отрезке любому алгебраическому многочлену степени .

Замечание. Доказательствотеоремы 2 является конструктивным и содержит способ построения многочлена , то есть способ отыскания его коэффициентов (смотри доказательство в текстах лекций Балашова С.Д.).

Теорема 3.Если весовая функция сохраняет свой знак на отрезке интегрирования и это многочлен ортогональный с весом на отрезке любому алгебраическому многочлену степени , тога его корни вещественны, различны и лежат внутри отрезка .

Из теорем 1–3 таким образом следует, что если весовая функция сохраняет свой знак на отрезке интегрирования (для определённости ), то квадратурная формула алгебраической степени точности существует и единственна для любого значения - целое, положительное.

Теорема 4.Если весовая функция сохраняет свой знак на отрезке интегрирования , то ни при каком выборе узлов и коэффициентов квадратурная формула (1) не может иметь алгебраическую степень точности .

Доказательство.Возьмём , и в качестве - степень многочлена . Рассмотрим . Так как сохраняет свой знак на отрезке интегрирования и знакопостоянная, то знакопостоянная на и не равна нулю.

Если , то интеграл от знакопостоянной функции равен нулю в том случае, если подынтегральная функция , тогда . С другой стороны рассмотрим квадратурную сумму: , следовательно , то есть квадратурная формула (1) для указанного многочлена степени не является точной. Следовательно н.а.с.т. квадратурной формулы равна .

Теорема 5 (о погрешности квадратурных формул н.а.с.т.).Если весовая функция сохраняет свой знак на отрезке интегрирования (для определённости ), а подынтегральная функция непрерывна на вмести со своими производными до -го порядка включительно, то такая, что погрешность квадратурной формулы н.а.с.т. имеет вид: (6).

Рассмотрим вопрос о сходимости квадратурного процесса н.а.с.т. Из приведенных выше теорем вытекает, что если весовая функция (знакопостоянная) на , то квадратурную формулу н.а.с.т. можно построить единственным образом для любого значения при этом соответствующие узлы и коэффициенты будут принимать свои зависимые от значения: .

Квадратурная формула (1) будет иметь вид: (7).

Определение.Говорят, что квадратурный процесс н.а.с.т. (7) сходится, если .

Теорема 6 (о сходимости).Если весовая функция на , непрерывна на и сам конечный, то квадратурный процесс н.а.с.т. (7) сходится.

Квадратурная формула Гаусса (частный случай квадратурной формулы н.а.с.т. при)

 

Не ограничивая общности, будем считать, что отрезок интегрирования , , , . Будем строить квадратурную формулу вида: (8).

Квадратурную формулу Гаусса будем строить исходя из алгоритма, вытекающего из теорем 1 – 3. В соответствии с первым пунктом надо построить алгебраический многочлен ортогональный с весом на многочлену степени .

Условие (4) .

С этой целью введём обозначение:

(9).

 

Сразу заметим, что (10).

(11).

Если мы построим и продифференцируем её раз, то получим .

Будем вычислять с помощью формулы интегрирования по частям: .

(12).

Потребуем, чтоб выполнялось условие ортогональности (4), то есть правая часть равенства (12) обращалась в ноль. Заметим, что при правая часть равна нулю в силу равенства (10). В силу произвольности многочлена , правая часть равенства (12) при обязана быть равна нулю. То есть (13).

Определение.Точка называется корнем функции кратности , если сама функция в этой точке равна нулю , а так же и , а . Поэтому, из этого определения из формул (10), (11) и (13) следует, что в точках и функция , обладает корнями кратности .

Поскольку сама функция является алгебраическим многочленом степени , его можно представить в виде: , где подлежащая определению.

Из формулы (11) следует, что (14).

Константу найдём из требования, чтоб коэффициент при старшей степени многочлена был равен единице (смотри формулу (5)). Коэффициент при старшей степени в правой части формулы (14) равен: , подставляя в (14) находим:

(15).

Искомый многочлен носит название многочлена Лежандра -й степени на отрезке .

Корни этого многочлена на основании теоремы 3. В силу того, что весовая функция , то все корни многочлена Лежандра (15) вещественны, различны и лежат внутри отрезка , поэтому найденные любыми известными методами, например, методом половинного деления, МПИ, методом хорд, методом касательных, эти корни могут быть взяты в качестве узлов квадратурной формулы (8).

Коэффициенты квадратурной формулы (8) по известным узлам можно вычислить с помощью формулы (3): , (16).

Таким образом имеем: (17) – квадратурная формула Гаусса на , где вычисляются по формуле (16), а - корни многочлена Лежандра. Алгебраическая степень точности данной квадратурной формулы равна . Остаточный член формулы (17) получается как частный случай формулы (6), в которой в качестве веса , а и в качестве многочлена выступает многочлен Лежандра.

Замечание 1.Из формул для нахождения узлов и коэффициентов формулы Гаусса видно, что они не зависят от подынтегральной функции и от отрезка интегрирования. То есть узлы и коэффициенты квадратурной формулы Гаусса заранее вычислены и при небольших приведены в специальной литературе.

Замечание 2.Квадратурная формула Гаусса на произвольном отрезке имеет вид:

(18), где

, вычисляются по формуле (16), а - корни многочлена Лежандра -й степени на отрезке .

Смысл введения весовой функции

 

Пусть требуется вычислить (1).

при численном интегрировании чаще всего подынтегральная функция заменяется алгебраическим многочленом (в частности интерполяционным). Для того чтоб такая замена имела хорошую точность, функция должна обладать высокой степенью гладкости (должна обладать достаточным количеством непрерывных производных), если же имеет особенности на (разрывы, обращается в бесконечность в одной или нескольких точках отрезка), то применение квадратурной формулы вида будет давать большую погрешность, поскольку такие функции плохо приближаются алгебраическими многочленами.

Для избегания больших погрешностей исходную функцию представляют в виде: , где содержит все особенности функции , называется весовой функцией, а является гладкой. И тогда применение к интегралу (1) квадратурной формулы не даёт такую большую погрешность.

Описанный метод называется методом выделения особенностей.

Пример.Пусть надо вычислить интеграл , где имеет особенности в точках и . Представим в следующем виде: , где - весовая функция, . Тогда .

{ Самостоятельно законспектировать тему: «Приближённое вычисление кратных интегралов»}

 

 

Постановка задачи

Пусть задано нелинейное уравнение (1), где - функция определённая и непрерывная на некотором конечном или бесконечном интервале . Если , где - комплексные коэффициенты, причём , то уравнение (1) называется алгебраическим уравнением -й степени.

Во всех остальных случаях, когда не полином, уравнение (1) называется трансцендентным.

Определение. Всякое значение обращающее функцию в ноль, то есть такое, что называется нулём функции или корнем уравнения (1).

Корень называется изолированным корнем уравнения (1), если существует окрестность корня не содержащая других корней уравнения (1).

В дальнейшем будем считать все корни уравнения (1) изолированными.

Если уравнение (1) алгебраическое или трансцендентное имеет достаточно сложный вид, то его сравнительно редко удаётся решить точно, поэтому важное значение принимают приближённые методы решения уравнения (1), а также оценка степени их точности.

Приближенное нахождение корней нелинейного уравнения (1) разбивается на два этапа:

1) отделение корней, то есть установление по возможности тесных промежутков содержащих один и только один корень уравнения (1);

2) уточнение корней – доведение их до нужной степени точности.

Методы отделения корней

Методы отделения корней делятся на две группы:

1) аналитические;

2) графические.

 

Графические методы отделения корней

1) Известно, что действительные корни уравнения геометрически являются абсциссой точек пересечения графика функций с осью , то есть те значения при которых обращается в ноль.

Если уравнение (1) не содержит близких между собой корней, то таким образом они легко отделяются.

2) Если функция сложная, но представима в виде разности: , где и более простые, чем , то тогда на практике бывает выгодно уравнение заменить на эквивалентное (два уравнения называются эквивалентными, если имеют одинаковые корни). Тогда корни уравнения получаются как абсциссы точек пересечения графиков функций и .

Заметим, что, несмотря на свою простоту, графические методы пригодны лишь для грубого отделения корней.

 

Аналитические методы отделения корней

1) Первый из методов основан на применении известной теоремы математического анализа, теоремы Больцано-Коши: если непрерывная функция на концах отрезка принимает значения разных знаков, то есть , то на отрезке содержится по меньшей мере один действительный корень уравнения .

Замечание. Корень уравнения (1) заведомо будет единственным на , если монотонна на этом отрезке, либо же производная существует и сохраняет постоянный знак на .

Если заранее известно количество действительных корней уравнения (1), то на практике часто бывает достаточно провести процесс половинного деления для аналитического отделения корней данного уравнения (1). С этой целью отрезок разбивают последовательно на частей и определяют знаки функции в точках деления. Если для функции будет получено ровно перемен знака, то таким образом все корни будут отделены.

В данном случае получили 7 перемен знака, таким образом все корни отделены.

Пусть уравнение (1) является алгебраическим уравнением -й степени, то есть , (2).

Основная теорема алгебры (теорема Гаусса). Алгебраическое уравнение -й степени имеет ровно корней, действительных или комплексных, причём каждый корень считается столько раз какова его кратность.

Теорема 1. Если все коэффициенты уравнения (2) вещественные числа, то комплексные корни такого уравнения будут попарно комплексно-сопряжённые, то есть если - корень уравнения (2) кратности , то так же является корнем уравнения (2) той же кратности .

Следствие. Алгебраическое уравнение (2) нечётной степени с действительными коэффициентами имеет, по меньшей мере, один действительный корень.

Дадим оценку модулей всех корней уравнения (2), то есть укажем границы нахождения корней этого уравнения.

Теорема 2. Пусть , , где - коэффициенты уравнения (2), тогда для абсолютных значений корней уравнения (2) имеет место следующая оценка: .

Замечание. Из теоремы 2 следует, что все корни уравнения (2) расположены в круге радиуса . Действительные корни расположении на оси абсцисс в интервале .

Если известны границы интервала, содержащие все действительные корни уравнения (2), то естественно возникает вопрос об их количестве. Ответ на этот вопрос даёт теорема Штурма.

 

2) Пусть задано нелинейное алгебраическое уравнение вида (2). Системой Штурма полинома -й степени называется следующая совокупность функций , где сам полином, , представляет собой взятый с обратным знаком остаток от деления на , представляет собой взятый с обратным знаком остаток от деления на и т.д., представляет собой взятый с обратным знаком остаток от деления на .

Замечание. Если полином не имеет кратных корней, то и последняя функция Штурма действительная ненулевая константа, кроме того полиномы из системы Штурма можно находить с точностью до положительного множителя.

Далее обозначим через количество перемен знака в системе многочленов Штурма при , при условии, что нулевые элементы этой системы вычеркнуты.

 

+ - + - +

 

Теорема Штурма. Если полином -й степени, не имеющий кратных корней на интервале и , , то количество действительных корней уравнения в точности равно количеству перемен знаков в системе Штурма полинома при переходе из точки в точку , то есть .

Замечание. При помощи теоремы Штурма можно с успехом отделять действительные корни алгебраического уравнения (2), разбивая исходный интервал на достаточно тесные промежутки такие, что .

 

Методы уточнения корней

Для уточнения корней нелинейного уравнения (1) на интервале, содержащем единственный корень данного уравнения, используются, как правило, итерационные методы:

1) метод половинного деления;

2) метод простой итерации;

3) метод касательных;

4) метод хорд.

Основная идея всех итерационных методов состоит в том, что исходя из некоторого начального приближения строиться последовательность приближений при определённых условиях сходящаяся к корню данного уравнения.

В силу указанной сходимости процесс построения приближения можно прервать на некотором шаге с достаточно большим номером итерации и объявить последнее из построенных приближений приближённым решением данного уравнения.

Определение. Величина называется погрешностью итерационного метода на -й итерации, где

Определение. Величина называется невязкой уравнения (1) на приближенном решении .

 

Понятно, что если итерационный метод сходится, то последовательность погрешностей , а так же и последовательность невязок . Верно и обратное утверждение.

 

Скорость сходимости

 

Говорят, что итерационный метод имеет линейную скорость сходимости (или скорость сходимости геометрической прогрессии со знаменателем ), если, начиная с некоторого номера итерации , выполняется следующее неравенство:

, где . Чем меньше , тем быстрее метод сходится.

Говорят, что итерационный метод имеет сверхлинейную скорость сходимости, если, начиная с некоторого номера итерации , выполняется следующее неравенство: , где , .

Говорят, что итерационный метод имеет квадратичную скорость сходимости, если, начиная с некоторого номера итерации , выполняется следующее неравенство: , где .

Квадратичная скорость сходимости самая быстрая.

Определим понятие критерия окончания итерационного процесса. Обычно на практике требуется найти приближённое решение исходного уравнения (1) с некоторой наперёд заданной точностью . То есть выполнять вычисление приближений итерационным методом до тех пор, пока не выполниться условие: (3) – истинный критерий окончания. Однако на практике точное значение корня , как правило, неизвестно, поэтому пользуются другими критериями близкими к истинному, либо же следующими, вообще говоря, «ложными» критериями: (4) или (5). Однако, из выполнения условий (4) и (5), вообще говоря, не следует выполнение условия (3), то есть выполнение условий (4) и (5) не гарантирует выполнение условия (3) с той же точностью .

 

{ Самостоятельно законспектировать тему: «Метод половинного деления»}

Метод простой итерации (МПИ)

 

Пусть задано нелинейное уравнение (1) на интервале , содержащем один и только один корень данного уравнения.

Предположим, что непрерывная и имеет непрерывную производную на .

С помощью эквивалентных преобразований приведём уравнение (1) к виду удобному для итерирования: (2). Например, домножим обе части уравнения (1) на к обеим частям равенства добавим , тогда .

Выберем на промежутке каким-либо способом, грубо, приближённое значение корня и вычислим по формуле: - первое приближение к решению уравнения (1) (или что то же самое (2));

Исходя из построим по формуле: - второе приближение к решению уравнения (1) (или что то же самое (2)) и т.д. Если известно приближение , то , (3). Формула (3) описывает МПИ для решения уравнения (1) (или что то же самое (2)).

Говорят, что МПИ для уравнения (1) сходится, если предел последовательностей приближений , определяемых формулой (3) существует и равен точному значению корня : .

Выясним условия сходимости МПИ.

Теорема. Пусть функция определена и дифференцируема на и принимает значения в этом промежутке (). Пусть кроме того (4), тогда МПИ (3) сходится независимо от выбора начального приближения к точному значению корня уравнения (1) и справедлива оценка погрешности: (5).

Из этой теоремы следует, что в качестве в частности можно взять максимум по модулю значения функции на : и чем меньше значение , тем выше фактическая скорость сходимости метода. МПИ имеет линейную скорость сходимости (или скорость сходимости геометрической прогрессии с указанным знаменателем ).

Из оценки погрешности (5) следует, что итерации в общем случае следует продолжать до тех пор, пока не выполнится условие: (6).

Условие (6) называется критерием окончания итерационного процесса, близким к истинному, так как его выполнимость гарантирует получение приближённого решения с заданной точностью (по формуле (5)).

Если функция в исходном уравнении (1) достаточно гладкая и не обращается в ноль ни в одной точке отрезка, то можно получить ещё один критерий близкий к истинному. Для этого воспользуемся разложением функции в ряд Тейлора в окрестности точки :

, где , .

. Возьмём , тогда, где , так как точное значение корня.

или . Введём обозначения , тогда и в качестве критерия близкого к истинному получаем: (7).

Кроме критериев (6) и (7) можно так же пользоваться и ложными критериями приведенными ранее.

Если исходное уравнение (1) приведено к следующему эквивалентному виду: , , , , то МПИ (3) для такого уравнения записывается следующим образом: (8). В формуле (8) константу возьмём такую, чтоб последовательность приближений в этой формуле была сходящейся, для этого воспользуемся теоремой о сходимости и потребуем, чтоб :

 

Поскольку на промежутке содержится единственный корень уравнения , то функция на данном промежутке сохраняет свой знак, поэтому возможны 2 случая:

1) функция сохраняет положительный знак на , тогда ;

2) функция сохраняет отрицательный знак на , тогда

Если , то при и при .

Подставляя в формулу (8) будем получать сходящийся итерационный метод.

Замечание. МПИ (8) сходится быстрее всего (знаменатель геометрической прогрессии принимает наименьшее возможное значение), если:

1) , то

2) , то

Рассмотрим геометрический смысл МПИ. , - условие сходимости.

a) сходимость по «лестнице» ,

b) сходимость по «спирали»

c) расходящийся случай

Метод Ньютона (метод касательных)

 

Пусть задано нелинейное уравнение (1) на интервале , содержащем один и только один корень данного уравнения.

Предположим, что непрерывно-дифференцируема на , .

Получим итерационную формулу метода Ньютона аналитически. Пусть нам уже известно -е приближение решения уравнения (1)

Разложим функцию в ряд Тейлора в окрестности точки :

. Возьмём в качестве точное значение корня (), тогда, где , так как точное значение корня.

, . Тогда в качестве следующего приближения к корню уравнения (1) можно взять следующее выражение: , (2) – итерационная формула метода Ньютона.

Теорема (о сходимости). Пусть и , существуют, непрерывны, сохраняют определённые знаки на и не обращаются в ноль, то есть , на , тогда если начальное приближение удовлетворяет условию :(3), то метод Ньютона, определяемый формулой (2),сходится к точному значению корня уравнения (1) и справедлива оценка погрешности: (4), где и .

Следует отметить, что метод Ньютона для уравнения (1) обладает квадратичной скоростью сходимости, более быстрой чем линейная, однако метод сходится лишь в малой окрестности корня , то есть когда начальное приближение выбрано достаточно близко к корню .

Из оценки погрешности (4) можно получить критерий окончания итерационного процесса, близкий к истинному: (5). Можно так же пользоваться полученными ранее критериями : - близкий к истинному, или двумя ложными критериями и .

Геометрический смысл метода Ньютона.

Пусть для определённости , , , , .

В качестве начального приближения точки возьмём , так как . Проведём касательную к графику функции в точке до пересечения с осью . Уравнение касательной имеет вид . Точка пересечения касательной с осью имеет координаты: абсцисса , ордината . Тогда , . Значение абсциссы совпадает с итерационным значением формулы (2) при . Аналогично, из точки находим точку с координатами и через неё проводим касательную , и т.д. Таким образом, в качестве приближения корня выступают абсциссы касательных.

 

Модифицированный метод Ньютона

 

Если на промежутке изменяется несущественно, то в итерационной формуле (2) можно приближённо положить и тогда строить последовательность приближений к решению по формуле: , (6) – итерационная формула модифицированного метода Ньютона.

Достоинствами метода являются облегчение решения, уменьшение количества арифметических действий, однако, такая приближённая замена приводит к замедлению скорости сходимости – она становится линейной.

Геометрически касательные к графику функции в каждой точке заменяются прямыми параллельными касательной в точке .

 

Метод хорд

 

Пусть задано нелинейное уравнение (1) на интервале , содержащем один и только один корень данного уравнения. Предположим, что функция дважды непрерывно-дифференцируема на , причём и сохраняют определённые знаки на .

Получим итерационную формулу метода хорд из геометрических соображений.

Пусть , , , . Запишем уравнение хорды проходящей через точки и : . Найдём точку пересечения хорды с осью : , , тогда . Далее проводим хорду через точки и , получаем: , , , тогда . Продолжая описанный процесс для произвольного номера приближения получаем: (2).

Начальным приближением в формуле (2), очевидно выступает точка . В рассмотренном случае на промежутке приближение к корню осуществляется слева, правый же конец (точка ) является неподвижным.

 

Рассмотрим другой случай: , , , .

Так же как и в первом случае проводим прямую соединяющую точки и и т.д. и , В этом случае процесс приближения к корню осуществляется справа, точка выступает в качестве начального приближения, а левая граница (точка ) является неподвижной. Тогда итерационная формула имеет вид:

, (3).

 

Теорема (о сходимости). Пусть и , существуют, непрерывны, сохраняют определённые знаки на и не обращаются в ноль. Если начальное приближение удовлетворяет условию :(4), то метод хорд (2) или (3) сходится к точному значению корня уравнения (1) и справедлива оценка погрешности: (5), где и .

Из этой теоремы следует, что на отрезке , тот из концов отрезка (или ) на котором знак функции совпадает со знаком является неподвижным и соответственно тот из концов, для которого выполняется условие (4) выступает в качестве начального приближения.

Из оценки погрешности (5) вытекает следующий критерий окончания итерационного процесса, близкий к истинному: (6).

Кроме условия (6) можно использовать полученный ранее критерий близкий к истинному , а так же использовать ложные критерии и .

В теории метода показано, что если начальное приближение выбрано достаточно близко к корню , то метод хорд сходится с линейной скоростью сходимости.

Методы решения систем линейных алгебраических уравнений (СЛАУ)

 

Необходимые вспомогательные сведенья из математического анализа и алгебры

Обозначим через -мерное, вещественное, векторное, линейное пространство. Если , то .

Скалярное произведение векторов вычисляется по формуле: , где и .

 

Определение. Нормой вектора называется вещественное число, условно обозначаемое , удовлетворяющее следующим аксиомам:

1) и ;

2) свойство однородности: ;

3) равенство треугольника: .

Существуют несколько способов вычисления нормы вектора. Наиболее известные следующие:

1) кубическая норма: ;

2) октаэдрическая норма: ;

3) Эвклидова (сферическая) норма: .

Пусть - квадратная матрица -го порядка.

Определение. Нормой матрицы называется вещественное число, условно обозначаемое , удовлетворяющее следующим аксиомам:

1) и ;

2) ;

3) , и имеют одинаковый порядок;

4)

Норма квадратной матрицы называется согласованной с данной нормой вектора , если для выполняется следующее неравенство:

(1).

Определение. Согласованная норма называется подчинённой данной норме вектора, если для в неравенстве (1) достигается знак равенства (подчинённая – наименьшая из всех согласованных норм).

Можно показать, что: (2).

Приведём наиболее распространённые нормы матриц:

1) - подчинена ;

2) - подчинена ;

3) спектральная норма: , где - наибольшее по модулю собственное значение матрицы , где - транспонированная, комплексно-сопряжённая.

Данная норма матрицы подчинена .

4) - согласована с , , ;

5) - норма Шмидта, согласована с .

Замечание. Легко заметить из формулы (2), что подчинённая норма единичной матрицы : , .

Определим понятия сходимости векторных и матричных последовательностей.

Пусть имеется последовательность векторов в , то есть и пусть имеется вектор . Будем говорить, что последовательность векторов сходится к вектору в, если для любого номера координаты имеет место покоординатная сходимость: .

Аналогично, пусть имеется последовательность матриц , то есть и пусть имеется матрица . Будем говорить, что матричная последовательность сходится к матрице , если для любых номеров координат выполняется условие: .

Теорема 1. Для того чтоб последовательность векторов сходилась к вектору в необходимо и достаточно чтоб .

Теорема 2. Для того чтоб матричная последовательность сходилась к матрице необходимо и достаточно чтоб .

Замечание. Формулировка теорем 1 или 2 векторной и матричной нормы произвольны.

 

Пусть задана СЛАУ:

(3).

 

Введём обозначения:

- матрица коэффициентов;

- столбец неизвестных; - столбец свободных членов.

Тогда исходную СЛАУ можно переписать в виде: (3`).

Методы решения СЛАУ делятся на две группы:

1) прямые;

2) итерационные.

Прямые методы решения СЛАУ – это методы, позволяющие отыскать решение системы при помощи конечного числа арифметических действий. Если при этом исходные данные задачи (матрица и вектор ) заданы точно и все арифметические операции выполнены точно, то прямые методы позволяют получить точное решение СЛАУ. Однако на практике решение чаще всего получается приближённое.

К таким методам относится: метод Крамера, метод обратной матрицы, метод Гаусса и др.

Итерационные методы основаны на построении последовательности приближений, при определённых условиях сходящиеся к точному решению СЛАУ.

К таким методам относится: метод простой итерации, метод Зейделя и др.

{ Самостоятельно законспектировать тему: «Сравнение прямых и итерационных методов»}

 

Метод Гаусса – прямой метод решения СЛАУ

Метод основан на последовательном исключении неизвестных, благодаря чему исходная система приводится к треугольному или трапециевидному виду.

{ Самостоятельно законспектировать тему: «Метод Гаусса решения СЛАУ»}

 

Метод квадратного корня – прямой метод решения СЛАУ

 

Пусть задана СЛАУ: (1) с вещественной симметричной матрицей .

Предположим, что все главные миноры матрицы отличны от нуля. В этом случае матрицу можно разложить в произведение двух треугольных матриц: , где - верхняя треугольная матрица .

Потребуем, чтоб все элементы на главной диагонали матрицы были одного знака (для определённости ). С этой целью мы выполняем умножение . Приравниваем элементы полученного произведения соответствующим элементам матрицы .

Так как матрица симметричная, то полученные равенства достаточно рассмотреть лишь для элементов, стоящих выше главной диагонали.

 

Шаг 1. Умножим первую строку матрицы на все столбцы матрицы и приравняем соответствующим элементам матрицы , получим: , , ,…,. Отсюда получим: , (2).

Шаг 2. Умножим вторую строку матрицы на все столбцы матрицы начиная со второго и приравняем соответствующим элементам матрицы , получим: , . Отсюда получим: , .

и т.д. запишем формулы для нахождения элементов произвольной -й строки матрицы .

Шаг i. () Умножим -ю строку матрицы на все столбцы матрицы начиная с -го и приравняем соответствующим элементам матрицы , получим: , . Отсюда получим: , (3).

Таким образом, после шагов, выполненных по данной схеме, мы найдём все элементы матрицы . Тогда исходную систему уравнений можно переписать в виде: . Введём обозначения , где - пока неизвестный вектор. Тогда исходная система уравнений (1) приводится к следующему виду: . То есть исходная система свелась к решению двух систем треугольного вида. Распишем систему уравнений (4) в координатной форме: (4`).

Отсюда получим следующие формулы для нахождения вектора : , (6).

Распишем систему уравнений (5) в координатной форме: (5`).

Отсюда получим следующие формулы для нахождения вектора : , (7).

Формулы (7) определяют искомое решение системы (1).

Замечание. Элементы матрицы :, которые вычисляются по формулам (2), (3) будут вещественными, если исходная матрица является положительно определённой.

Определение. Симметричная, квадратная матрица называется положительно определённой, если для . Согласно критерия Сильвестра для положительной определённости симметричной матрицы необходимо и достаточно чтоб все её главные миноры были >0.

 

Из формул (2) и (3) видно, что -вещественное число, если ; -вещественное число, если и т.д.

Из формул для нахождения видно, что если хотя бы один из главных миноров матрицы равен нулю, то разложение матрицы в произведение невозможно, поскольку в формулах (2), (3), (6) и (7) появляется деление на ноль. Метод квадратного корня в таком случае не применим.

 

Метод ортогонализации – прямой метод решения СЛАУ

 

Пусть задана последовательность векторов .

Последовательность векторов называется ортогональной, если . Последовательность векторов называется ортонормированной, если она ортогональна в и Эвклидова норма каждого вектора .

Другими словами последовательность векторов ортонормированна, если .

Утверждение. По любой линейно независимой системе векторов можно построить ортонормированную систему.

 

Пусть задана СЛАУ: (1) с невырожденной матрицей (- существует единственное решение).

Введём следующие обозначения: для каждой -й строки обозначим через следующий вектор и через вектор размерности , такой что . Тогда исходная СЛАУ (1) перепишется в виде: (1`).

Таким образом, задача решения СЛАУ (1) сводится к нахождению вектора ортогонального всем линейно независимым векторам и последняя координата которого равна 1.

Такой вектор будет единственным в силу единственности решения СЛАУ (1).

введём в рассмотрение ещё один вспомогательный вектор и покажем, что последовательность векторов является линейно независимыми, то есть (2), только тогда, когда . Запишем (2) в развёрнутой покоординатной форме: (2`).

(2`) представляет собой однородную СЛАУ относительно коэффициентов . Определитель системы имеет вид:

.

Так как , то однородная СЛАУ (2`) имеет единственное тривиальное решение: .

Таким образом, система векторов - линейно независимая в пространстве .

Подвергнем систему векторов процессу ортогонализации Шмидта в Эвклидовой метрике. То есть построим на основе этих векторов ортонормированную систему векторов .

Шаг 1. Введём вспомогательный вектор , тогда ,

.

Шаг 2. , где , которую подбираем так, чтоб выполнялось условие : . Очевидно, что так как является линейной комбинацией линейно независимых векторов и с по крайней мере одним коэффициентом не равным нулю при , тогда . Ясно, что и и т.д.

Предположим, что векторы уже построены с такими свойствами, что . Рассмотрим -й шаг:

Шаг к. () Определим вспомогательный вектор (3),

где . Рассмотрим

.

так как является линейной комбинацией линейно независимых векторов . Тогда .

Таким образом, в результате выполнения шагов процесса ортогонализации Шмидта ортонормированная последовательность векторов будет построена. Покажем, что последний вектор этой последовательности ортогонален всем линейно независимым векторам . Для этого для из формулы (3): рассмотрим скалярное произведение . Таким образом, вектор ортогонален всем векторам . Покажем что последняя координата вектора не равна нулю: . Надо показать, что . Предположим иное, пусть . Рассмотрим равенство: ,. Распишем его в координатной форме:

.

Получим однородную СЛАУ относительно первых координат вектора , определитель этой системы совпадает с определителем матрицы : . Следовательно, данная система имеет единственное тривиальное решение , то есть , что невозможно по построению. Тогда и в качестве вектора возьмём . Таким образом, вектор построен.

Метод простой итерации (МПИ) – итерационный метод решения СЛАУ

 

Пусть задана СЛАУ: (1) с невырожденной матрицей (- существует единственное решение).

Пусть вектор - вектор столбец точного решения, - вектор столбец неизвестных, - вектор столбец свободных членов СЛАУ (1).

Каким-либо способом (будут указаны ниже) приведём систему (1) к эквивалентному виду удобному для итерирования: (2), где квадратная матрица, - вектор столбец свободных членов.

Выберем некоторое начальное приближение исходя из которого построим приближение по формуле: . Исходя из построим приближение по формуле:.

Если уже построено, то мы можем построить приближение по формуле: , (3) – формула МПИ для решения СЛАУ (1) (или что то же самое СЛАУ (2)).

В координатной форме МПИ записывается следующим образом:

(3`).

Говорят, что МПИ для СЛАУ (1) сходится, если предел последовательности приближений, определяемый формулой (3) существует и равен : .

При этом вектор называется погрешность итерационного метода на -й итерации, а вектор называется невязкой итерационного метода на -й итерации.

Выясним условие сходимости МПИ.

Теорема 1. Для того чтобы МПИ для СЛАУ (1) сходился независимо от выбора начального приближения необходимо и достаточно, чтоб все собственные значения матрицы были по модулю меньше 1. То есть, чтоб все корни характеристического уравнения .

Лемма 1. Модуль каждого собственного значения матрицы не превосходит любой из её норм: .

Проверка условий теоремы 1 на практике затруднительна, так как связана с нахождением собственных значений матрицы , поэтому часто пользуются следующим условием сходимости (достаточное условие).

Теорема 2. Для того чтобы МПИ для СЛАУ (1) сходился независимо от выбора начального приближения достаточно, чтоб какая-либо норма матрицы была меньше 1: .

Но с другой стороны условие теоремы 2 является более жёстким по сравнению с условием теоремы 1, поскольку в силу леммы 1 нарушение условия теоремы 2 ещё не означает, что метод расходится.

Теорема 3 (об оценке погрешности). Если какая-либо норма матрицы () согласована с данной нормой вектора, то справедлива следующая оценка погрешности МПИ: (4).

Замечание 1. Из доказательства теоремы 3 можно легко получить следующее неравенство: .

Следовательно МПИ обладает линейной скоростью сходимости или скоростью сходимости геометрической прогрессии со знаменателем , . Чем меньше , тем выше фактическая скорость сходимости метода.

Замечание 2. МПИ, как следует из теорем 1-2, сходится независимо от выбора начального приближения . Однако, если выбрано неудачно это может привести к большому количеству итераций. Из произвола в выборе следует важное свойство МПИ – самоисправляемость: отдельные ошибки в вычислениях (погрешность округления) не влияют на факт сходимости, поскольку ошибочное приближение может рассматриваться как новое начальное.

Выясним критерий окончания итерационного процесса. Для получения приближенного решения исходной СЛАУ с точностью , естественно в качестве критерия окончания выбрать тот, который вытекает из формулы (4):

(5) – близкий к истинному критерий окончания.

Можно пользоваться также ложными критериями (их выполнение не гарантирует, что ): (6) или(7).

Отметим, что если , то тогда критерий (6) совпадает с критерием (5), то есть становиться близким к истинному.

 

Рассмотрим способы приведения СЛАУ (1) к виду удобному для итерирования.

Способ 1. Пусть матрица положительно определённая, тогда все её собственные значения . Рассмотрим исходную систему и выполним следующие эквивалентные преобразования: умножим обе части на , получим . Далее перенесём все в правую часть , , .

Таким образом, полученная система уравнений имеет вид (2), где в качестве матрицы выступает матрица , а в качестве вектора свободных членов – вектор .

МПИ в этом случае записывается в виде: , (8).

Значение константы выберем так, чтоб МПИ (8) был сходящимся. Воспользуемся необходимым и достаточным условием МПИ: собственное значение , тогда . Решение этого модульного неравенства имеет вид: , где - наибольшее собственное значение матрицы . Заметим, что МПИ (8) будет сходиться быстрее всего при следующем оптимальном значении параметра , где и соответственно наибольшее и наименьшее собственные значения матрицы .

Поскольку собственные значения матрицы бывают неизвестны, то с учётом леммы 1: .

Замечание. Если исходная матрица не является положительно определённой, тогда исходную систему уравнений домножим слева на матрицу- транспонированная комплексно сопряжённая к матрице . Тогда получим (9) – эквивалентна СЛАУ (1), где матрица является положительно определённой. Затем к полученной системе (9) применяют описанный выше способ сведения к виду удобному для итерирования.

 

Способ 2. Пусть матрица такая, что диагональные элементы в ней доминируют по строкам или по столбцам. Это означает, что (10) – доминирование по строкам или (11) – доминирование по столбцам.

Лемма 1. Если в матрице имеет место диагональное преобладание по строкам или по столбцам, то определитель такой матрицы отличен от нуля, то есть матрица невырождена.

Из диагонального преобладания следует, что . Разрешим каждое из уравнений системы (1) относительно диагонального неизвестного:

(12), где

и .

 

Таким образом, система (1) свелась к эквивалентной системе вида (2).

МПИ для решения системы (12) с учётом формулы (3`) имеет вид:

(13) – метод Якоби.

Выясним условия сходимости метода Якоби. Предположим для определённости, что в матрице диагональные элементы доминируют по строкам (выполняется условие (10)). Рассмотрим . Мы получили, что по теореме 2 выполняется достаточное условие сходимости. Таким образом, метод Якоби сходится.

Аналогично, можно показать, что если выполняется условие (11), то и метод Якоби также сходится.

Замечание. Во многих практических ситуациях произвольную систему с невырожденной матрицей удаётся привести к системе с диагональным преобладанием по строкам или по столбцам с помощью эквивалентных преобразований над уравнениями системы.

 

 

Метод Зейделя – итерационный метод решения СЛАУ

 

Пусть задана СЛАУ: (1) с невырожденной матрицей (- существует единственное решение) и- вектор столбцом свободных членов.

Так же как и раньше приведём систему (1) к виду удобному для итерирования (2), где - квадратная матрица, - вектор столбец неизвестных, - вектор столбец свободных членов.

Пусть вектор - вектор столбец точного решения СЛАУ (1) (или что то же самое СЛАУ (2)).

Напомним формулу МПИ для решения системы (2): , (3). Распишем эту итерационную формулу покоординатно:

(3`).

Метод Зейделя, применяемый к системе уравнений (2), представляет собой модификацию МПИ, которая состоит в том, что при вычислении каждой новой координаты - го приближения используются уже вычисленные ранее координаты этого - го приближения, то есть в координатной форме метод Зейделя имеет вид:

(4).

Перепишем (4) в компактной матричной форме, для этого представим матрицу в виде суммы двух треугольных матриц: , где

и ,

тогда формулы (4) можно записать в следующем виде:

(4`) или .

Рассмотрим матрицу - нижняя треугольная матрица с единицами на главной диагонали: следовательно, существует обратная ей матрица. Тогда (5), так как . Формула (5) представляет собой метод Зейделя для СЛАУ (2). С другой стороны, формула (5) является формулой МПИ для СЛАУ следующего вида: (6). И тогда условие сходимости метода Зейделя можно формулировать на основе условий сходимости МПИ.

 

Замечание. Итерационная формула (5) используется, как правило, для выяснения условий сходимости, то есть имеет теоретическое значение. На практике она не применяется, так как связана с обращением матрицы.

Теорема 1. Для того чтобы метод Зейделя для СЛАУ (2) сходился независимо от выбора начального приближения необходимо и достаточно, чтоб все собственные значения матрицы были по модулю меньше 1. Другими словами, чтоб все корни характеристического уравнения (7).

Теорема 2. Для того чтобы метод Зейделя для СЛАУ (2) сходился независимо от выбора начального приближения необходимо и достаточно, чтоб все корни характеристического уравнения (8) по модулю были меньше 1.

Доказательство. Покажем, что уравнения (7) и (8) имеют одинаковые корни:

Определители в левой и правой части обращаются в ноль одновременно при одинаковых значениях , то есть уравнения (7) и (8) имеют одинаковые корни.

Замечание 1. Проверка условий теоремы 2 , очевидно гораздо проще на практике, чем условий теоремы 1, так как не требует обращения матрицы .

Замечание 2. Условие сходимости (необходимое и достаточное) МПИ для системы уравнений (2) имеют вид: (9), где . Сравнивая это условие с условием теоремы 2 мы видим, что уравнения (8) и (9) имеют различные корни. Отсюда следует, что метод Зейделя и МПИ для СЛАУ (2) имеют разные области сходимости. То есть существует система уравнений, для которой один из методов сходится, а другой расходится.

Теорема 3. Для того чтобы метод Зейделя для СЛАУ (2) сходился независимо от выбора начального приближения достаточно, чтоб какая-либо норма .

Теорема 4. Для того чтобы метод Зейделя для СЛАУ (2) сходился независимо от выбора начального приближения достаточно, чтоб выполнялось одно из двух условий:

1) ;

2) .

Теорема 5. Пусть выполняется условие теоремы 4, тогда для метода Зейделя справедлива следующая оценка погрешности: (10), где . Из доказательства теоремы 5 вытекает, что метод Зейделя обладает линейной скоростью сходимости или скоростью сходимости геометрической прогрессии со знаменателем , причём легко показать, что . Таким образом, метод Зейделя сходится не медленнее МПИ, в том случае, когда оба метода сходятся.

Рассмотрим один из способов приведения СЛАУ (1) к виду удобному для итерирования.

Предположим, что в исходной матрице () имеет место диагональное преобладание по строкам или по столбцам: .

Разрешим каждое из уравнений системы (1) относительно диагонального неизвестного в результате этого система принимает вид:

(11) – система вида (2).

Применение метода Зейделя к системе уравнений (11) даёт нам следующие расчётные формулы:

(12) – метод Некрасова для решения СЛАУ (1).

Если выполняется условие теоремы 4, то метод Некрасова будет сходиться.



<== предыдущая лекция | следующая лекция ==>
Численное интегрирование | Приближённое решение проблемы собственных значений матрицы


Карта сайта Карта сайта укр


Уроки php mysql Программирование

Онлайн система счисления Калькулятор онлайн обычный Инженерный калькулятор онлайн Замена русских букв на английские для вебмастеров Замена русских букв на английские

Аппаратное и программное обеспечение Графика и компьютерная сфера Интегрированная геоинформационная система Интернет Компьютер Комплектующие компьютера Лекции Методы и средства измерений неэлектрических величин Обслуживание компьютерных и периферийных устройств Операционные системы Параллельное программирование Проектирование электронных средств Периферийные устройства Полезные ресурсы для программистов Программы для программистов Статьи для программистов Cтруктура и организация данных


 


Не нашли то, что искали? Google вам в помощь!

 
 

© life-prog.ru При использовании материалов прямая ссылка на сайт обязательна.

Генерация страницы за: 0.157 сек.