Участник:Айнагуль Джумабекова/Песочница

Материал из MachineLearning.

< Участник:Айнагуль Джумабекова

Версия от 12:05, 26 декабря 2008; Айнагуль Джумабекова (Обсуждение | вклад)

(разн.) ← Предыдущая | Текущая версия (разн.) | Следующая → (разн.)

Перейти к: навигация, поиск

Содержание

1 Введение
- 1.1 Постановка математической задачи
2 Изложение метода
- 2.1 Интерполирование полиномами Лагранжа

Введение

Постановка математической задачи

Численное дифференцирование применяется, если функцию $y(x)$ трудно или невозможно продифференцировать аналитически - например, если она задана таблицей. Оно нужно также при решении дифференциальных уравнений при помощи разностных методов.

Изложение метода

При численном дифференцировании функцию $y(x)$ аппроксимируют легко вычисляемой функцией $\varphi(x)$ и приближенно полагают $y'(x)=\varphi'(x)$ . При этом можно использовать различные способы аппроксимации.

Интерполирование полиномами Лагранжа

Рассмотрим неравномерную сетку $\omega_h=\{a=x_0<x_1<x_2<\dots<x_N=b\}$ и обозначим за $h_i=x_i-x_{i-1}$ , $i=1,2,\dots,N$ шаги этой сетки. В качества примера получим формулы численного дифференцирования, основанные на использовании многочлена Лагранжа $L_{2,i}(x)$ , построенного для функции $u(x)$ по трем точкам $x_{i-1},x_i,x_{i+1}$ . Многочлен $L_{2,i}(x)$ имеет вид

$L_{2,i}(x)=\frac {(x-x_i)(x-x_{i+1})}{h_i(h_i+h_{i+1})}u_{i-1}-\frac {(x-x_{i-1})(x-x_{i+1})}{h_ih_{i+1}}u_i+\frac {(x-x_{i-1})(x-x_i)}{h_{i+1}(h_i+h_{i+1})}u_{i+1}$

Отсюда получим $L_{2,i}'(x)=\frac{(2x-x_i-x_{i+1})}{h_i(h_i+h_{i+1})}u_{i-1}-\frac {(2x-x_{i-1}-x_{i+1})}{h_ih_{i+1}}u_i+\frac {(2x-x_{i-1}-x_i)}{h_{i+1}(h_i+h_{i+1})}u_{i+1}$

Это выражение можно принять за приближенное значение $u'(x)$ в любой точке $x$ ∈ $[x_{i-1},x_{i+1}]$ . Его удобнее записать в виде $L_{2,i}'(x)=\frac {1}{\bar{h_i}}[(x-x_{i-\frac{1}{2}}) \frac{u_{i+1}-u_i}{h_{i+1}} + (x_{i+\frac{1}{2}}-x) \frac{u_i-u_{i-1}}{h_i}]$ , где $\bar{h_i}=0,5(h_i+h_{i+1})$ , $x_{i-\frac{1}{2}}=x_i-0,5h_i$ .

В частности, при $x=x_i$ получим $L_{2,i}'(x_i)=\frac{1}{2}(\frac{h_i}{\bar{h_i}}\frac{u_{i+1}-u_i}{h_{i+1}}+\frac{h_{i+1}}{\bar{h_i}}\frac{u_i-u_{i-1}}{h_i})$ , И если сетка равномерна, $h_{i+1}=h_i=h$ , то приходим к центральной разностной производной, $L_{2,i}'(x_i)=u_{\dot{x},i}$ . При использовании интерполяционного многочлена первой степени точно таким образом можно получить односторонние разностные производные $u_{\bar{x},i}$ и $u_{x,i}$ . Далее вычисляя вторую производную многочлена $L_{2,i}(x)$ , получим приближенное выражение для $u''(x)$ при $x$ ∈ $[x_{i-1},x_{i+1}]$ :

$u''(x)$ ≈ $L_{2,i}''(x)=\frac{1}{\bar{h_i}}(\frac{u_{i+1}-u_i}{h_{i+1}}- \frac{u_i-u_{i-1}}{h_i})$

На равномерной сетке это выражение совпадает со второй разностной производной $u_{\bar{x}x,i}$ . Ясно, что для приближенного вычисления дальнейших производных уже недостаточно многочлена $L_{2,i}(x)$ , надо привлекать многочлены более высокого порядка и тем самым увеличивать число узлов, участвующих в аппроксимации.

Порядок погрешности аппроксимации зависит как от порядка интерполяционного многочлена, так и от расположения узлов интерполирования. Получим выражение для погрешности аппроксимации, возникающей при замене $u'(x)$ выражением $L_{2,i}'(x)$ . Будем считать, что $x$ ∈ $[x_{i-1},x_{i+1}]$ и что величины $h_i, h_{i+1}$ имеют один и тот же порядок малости при измельчении сетки. По формуле Тейлора в предположении ограниченности $u^{(4)}(x)$ получим $u_{i+k}=u(x)+(x_{i+k}-x)u'(x)+\frac{{(x_{i+k}-x)}^2}{2}u''(x) +\frac{{(x_{i+k}-x)}^3}{3}u'''(x) +O(h^4)$ ,

где $k=0$ ,± $1,h=max\{h_i,h_{i+1}\}$

Отсюда приходим к следующим разложениям разностных отношений

$\frac{u_i-u_{i-1}}{h_i}=u'(x)-(x-x_{i-\frac{1}{2}})u''(x)+(\frac{{(x-x_{i-\frac{1}{2}})}^2}{2}+\frac{h_i^2}{24})u'''(x)+O(h^3)$

$\frac{u_{i+1}-u_i}{h_{i+1}}=u'(x)-(x_{i+\frac{1}{2}}-x)u''(x)+(\frac{{(x_{i+\frac{1}{2}}-x)}^2}{2}+\frac{h_{i+1}^2}{24})u'''(x)+O(h^3)$

Подставляя полученные формулы в выражение для разностной производной и приводя подобные слагаемые получим

$L_{2,i}'(x)=u'(x)-[\frac{{(x-x_i)}^2}{2}-\frac{(h_{i+1}-h_i)(x-x_i)}{3}-\frac{h_ih_{i+1}}{6}]u'''(x)+O(h^3)$ , $x$ ∈ $[x_{i-1},x_{i+1}]$ .

Отсюда видно,что разностное выражение аппроксимирует $u'(x)$ со вторым порядком.

Если подставить полученные ранее разностные отношения в выражение для второй производной многочлена $L_{2,i}(x)$ , то имеем

$L_{2,i}''(x)=u''(x)+(x_i-x + \frac{h_{i+1}-h_i}{3})u'''(x)+O(h^2)$

Из этого выражения видно, что даже на равномерной сетке,т.е. когда $h_i=h_{i+1}$ , второй порядок аппроксимации имеет место лишь в точке $x=x_i$ , а относительно других точек (например, $x=x_{i+1}$ ) выполняется аппроксимация только первого порядка. Таким образом, получим аппроксимацию лишь первого порядка.

Для того, чтобы избежать больших погрешностей в процессе приближения, весь отрезок [a,b] разбивают на частичные отрезки и на каждом из частичных отрезков приближенно заменяют функцию $f(x)$ многочленом невысокой степени (так называемая кусочно-полиномиальная интерполяция). Одним из способов интерполирования на всем отрезке является интерполирование с помощью сплайн-функций. Сплайн-функцией или сплайном называют кусочно-полиномиальную функцию, определенную на отрезке [a,b] и имеющую на этом отрезке некоторое число непрерывных производных. Преимущество сплайнов перед обычной интерполяцией является, во-первых их сходимость, во-вторых, устойчивость процесса вычислений. Построение кубического сплайна. Пусть на [a,b] задана непрерывная функция $f(x)$ . Введем сетку $a=x_0<x_1<x_2<\dots<x_N=b$ и обозначим $f_i=f(x_i)$ , $i=0,1,\dots,N$ . Сплайном соответствующим данной функции $f(x)$ и данным узлам $\{x_i\}_{i=0}^N$ называется функция $s(x)$ , удовлетворяющая следующим условиям: а) на каждом сегменте $[x_i-1,x_i]$ , $i=1,2,\dots,N$ функция $s(x)$ является многочленом третьей степени; б) функция $s(x)$ , а также её первая и вторая производная производные непрерывны на [a,b]; в) $s(x_i)=f(x_i)$ , $i=1,2,\dots,N$ ; На каждом из отрезков $[x_i-1,x_i]$ , $i=1,2,\dots,N$ будем искать функцию $s(x)=s_i(x)$ в виде многочлена третьей степени

$s_i(x)=a_i+b_i(x-x_i)+\frac{c_i}{2}(x-x_i)^2 +\frac{d_i}{6}(x-x_i)^3$

$x_i-1<=x<=x_i$ , $i=1,2,\dots,N$ , где $a_i,b_i,c_i,d_i$ - коэффициенты, подлежащие определению. Доказано, что существует единственный кубический сплайн, определяемый условиями а)-в) и граничными условиями $s''(a)=s''(b)=0$ . Для их нахождения используются следующие формулы 1) $a_i=f(x_i)$ , $i=1,2,\dots,N$

2) Для определения коэффициентов $c_i$ получаем систему уравнений

$h_ic_{i-1}+2(h_i+h_{i+1})c_i+h_{i+1}c_{i+1}=6\left(\frac{f_{i+1}-f_i}{h_{i+1}}-\frac{f_i-f_{i-1}}{h_i}\right), <tex>i=1,2,\dots,N-1$ , $c_0=c_N=0$

(система решается методом прогонки) По найденным коэффициентам $c_i$ коэффициенты $b_i$ , $d_i$ определяются с помощью явных формул

3) $d_i=\frac{c_i-c_{i-1}}{h_i},<tex>i=1,2,\dots,N$

4) $b_i=\frac{h_i}{2}c_i-\frac{h_i^2}{6}d_i+\frac{f_i-f_{i-1}}{h_i}, <tex>i=1,2,\dots,N$

Найдем производные введенного кубического сплайна, имеем $s_i'(x)=b_i+c_i(x-x_i)+\frac{d_i}{2}{(x-x_i)}^2$

$s_i''(x)=c_i+d_i(x-x_i)$

$s_i'''(x)=d_i$

Рассмотрим оценку погрешности метода, которая зависит от выбора сеток и от гладкости $f(x)$ . Для простоты изложения допустим, что сетка равномерная, т.е.

$\omega_h=\{x_i=a+ih, i=0,1,\dots,N\}$ с шагом $b=\frac{b-a}{N}$

От функции $f(x)$ будем требовать существования непрерывной на [a,b] четвертой производной, $f(x)$ $C^{(4)}[a,b]$ . Кроме того, предположим, что выполнены граничные условия $f''(a)=f''(b)=0$ и такие же условия для сплайнов. Обозначим,

$||g(x)||_{C[a,b]}=\max_{[a,b]}|g(x)|$ , $M_4=||f^4(x)||_{C[a,b]}$

Пусть $s_h(x)$ - кубический сплайн, построенный для функции $f(x)$ на сетке $\omega_h$ . В следующей теореме приведены оценки погрешности интерполяции для функции $f(x)$ и её производных $f'(x)$ , $f''(x)$

Теорема Для $f(x)$ $C^{(4)}[a,b]$ справедливы оценки

$||f(x)-s_h(x)||_{C[a,b]}<=M_4h^4$

$||f'(x)-s_h'(x)||_{C[a,b]}<=M_4h^3$

$||f''(x)-s_h''(x)||_{C[a,b]}<=M_4h^2$

Из этих оценок следует, что при $h \to 0$ (т.е. при $N \to \infty$ ) последовательности $s_h^{(i)}(x)$ , $i=0,1,2$ сходятся соответственно к функциям $f^{(i)}(x)$ $i=0,1,2$ .

Обычно дифференцирование кубического сплайна позволят определить первую и вторую производную интерполяционного многочлена с хорошей точностью. Если надо вычислить более высокие производные, то целесообразно строить сплайны высоких порядков. Из-за большей трудоемкости этот способ редко используется. Способ дифференцирования с помощью сплайновой интерполяцией теоретически мало исследован.

Не всякую функцию целесообразно приближать алгебраическими многочленами. Рассмотрим тригонометрическую интерполяцию. Если $f(x)$ - периодическая функция с периодом l, то естественно строить приближения с помощью функций

$\varphi_k(x)=a_k\cos(\frac{\pi kx}{l})+b_k\sin(\frac{\pi kx}{l}), k=0,1,\dots,n$