Участник:Bogdan/Проведение поверхностей наилучшего приближения
Материал из MachineLearning.
(Новая: == Введение == На практике мы часто сталкиваемся с задачей о сглаживании экспериментальных зависимост...) |
|||
Строка 47: | Строка 47: | ||
Если же используется многочлен второй степени <tex>P_2(x) = a_0+a_1x+a_2x^2</tex>, то нормальная система уравнений примет вид: | Если же используется многочлен второй степени <tex>P_2(x) = a_0+a_1x+a_2x^2</tex>, то нормальная система уравнений примет вид: | ||
- | <tex></tex> | + | |
+ | <tex>\left\{\begin{matrix} (n+1)a_0 + (\sum^{n}_{i=0}{x_i})a_1 + (\sum^{n}_{i=0}{x_i^2})a_2 = \sum^{n}_{i=0}{y_i},\\ (\sum^{n}_{i=0}{x_i})a_0 + (\sum^{n}_{i=0}{x_i^2})a_1 + (\sum^{n}_{i=0}{x_i^3})a_2 = \sum^{n}_{i=0}{y_ix_i},\\ (\sum^{n}_{i=0}{x_i^2})a_0 + (\sum^{n}_{i=0}{x_i^3})a_1 + (\sum^{n}_{i=0}{x_i^4})a_2 = \sum^{n}_{i=0}{y_ix_i^2} \end{matrix}\right.</tex> | ||
=== Числовой пример === | === Числовой пример === |
Версия 11:58, 15 ноября 2008
Содержание |
Введение
На практике мы часто сталкиваемся с задачей о сглаживании экспериментальных зависимостей.
Пусть зависимость между двумя переменными и выражается в виде таблицы, полученной опытным путем. Это могут быть результаты опыта или наблюдений, статистической обработки материала и т.п.
x | x1 | x2 | ... | xi | ... | xn |
---|---|---|---|---|---|---|
y | y1 | y2 | ... | yi | ... | yn |
Требуется наилучшим образом сгладить экспериментальную зависисмость между переменными и , т.е. по возможности точно отразить общую тенденцию зависимости от , исключив при этом случайные отклонения, связанные с неизбежными погрешностями измерений или статистических наблюдений. Такую сглаженную зависимость стремятся представить в виде формулы .
Формулы, служащие для аналитического представления опытных данных, получили название эмпирических формул.
Задача нахождения эмпирических формул разбивается на два этапа. На первом этапе нужно установить вид зависимости , т.е. решить, является ли она линейной, квадратичной, логарифмической или какой-либо другой. Второй этап – определение неизвестных параметров этой функции.
Часто вид эмпирической зависимости известен, но числовые параметры неизвестны. Будем считать, что зависимость полиномиальная, а для определения параметров полинома рассмотрим следующие методы.
Методы восстановления регрессии, минимизирующие невязку ответов
Метод наименьших квадратов
Пусть функция задана таблицей своих значений: . Требуется найти многочлен фиксированной степени , для которого среднеквадратичное отклонение (СКО) минимально.
Так как многочлен определяется своими коэффициентами, то фактически нужно подобрать набор кофициентов , минимизирующий функцию .
Используя необходимое условие экстремума, получаем так называемую нормальную систему метода наименьших квадратов: .
Полученная система есть система алгебраических уравнений относительно неизвестных . Можно показать, что определитель этой системы отличен от нуля, то есть решение существует и единственно. Однако при высоких степенях m система является плохо обусловленной. Поэтому метод наименьших квадратов применяют для нахождения многочленов, степень которых не выше 5. Решение нормальной системы можно найти, например, методом Гаусса.
Запишем нормальную систему наименьших квадратов для двух простых случаев: и . При многочлен примет вид: . Для нахождения неизвестного коэффициента имеем уравнение: . Получаем, что коэффициент есть среднее арифметическое значений функции в заданных точках.
Если же используется многочлен второй степени , то нормальная система уравнений примет вид: