Metody matematyczne fizyki/Wprowadzenie do wielomianów ortogonalnych

Z Wikibooks, biblioteki wolnych podręczników.
Przejdź do nawigacji Przejdź do wyszukiwania
Metody matematyczne fizyki
Metody matematyczne fizyki
Wprowadzenie do wielomianów ortogonalnych

Licencja
Autor: Mirosław Makowiecki
Absolwent UMCS Fizyki Komputerowej Uniwersytetu Marii Curie-Skłodowskiej w Lublinie
Email: miroslaw.makowiecki@gmail.com
Dotyczy: książki, do której należy ta strona, oraz w niej zawartych stron i w nich podstron, a także w nich kolumn, wraz z zawartościami.
Użytkownika książki, do której należy ta strona, oraz w niej zawartych stron i w nich podstron, a także w nich kolumn, wraz z zawartościami nie zwalnia z odpowiedzialności prawnoautorskiej nieprzeczytanie warunków licencjonowania.
Umowa prawna: Creative Commons: uznanie autorstwa oraz miejsca pochodzenia książki i jej jakikolwiek części, a także treści, teksty, tabele, wykresy, rysunki, wzory i inne elementy oraz ich części zawarte w książce, i tą książkę, nawet w postaci przerobionej nie można umieszczać w jakikolwiek formie na czasopismach naukowych, archiwach prac, itp.
Autor tej książki dołożył wszelką staranność, aby informacje zawarte w książce były poprawne i najwyższej jakości, jednakże nie udzielana jest żadna gwarancja, czy też rękojma. Autor nie jest odpowiedzialny za wykorzystanie informacji zawarte w książce nawet jeśli wywołaby jakąś szkodę, straty w zyskach, zastoju w prowadzeniu firmy, przedsiębiorstwa lub spółki bądź utraty informacji niezależnie, czy autor (a nawet Wikibooks) został powiadomiony o możliwości wystąpienie szkód. Informacje zawarte w książce mogą być wykorzystane tylko na własną odpowiedzialność.


W tym rozdziale zapoznamy się z wielomianami, którego definicja jest przestawiana wzorem poniżej, jest ona kombinacją liniową funkcji potęgowych xn ze współczynnikami an i bn:

(9.1)

Będziemy się również zajmować wielomianami Legendre'a Pn, Hermite'a Hn i Laguerre'a Ln i na samym końcu Czebyszewa Tn. Każdy z tych wielomianów ma swoją dziedzinę zapisanych w przedziałach dla każdego wielomianu z osobna, podamy też dla tych wielomianów funkcje czemu są równe: , , .

Definicje ortogonalności wielomianów Qn[edytuj]

Zdefiniujmy iloczyn skalarny między dwoma funkcjami jednej zmiennej dwóch funkcji f(x) i g(x) wedle wzoru poniżej, którą definiujemy w przedziale (α,β).

(9.2)

Funkcje f(x) i g(x) są ortogonalne, jeśli zachodzi warunek (f,g)=0, jeśli do wzoru (9.2) wprowadzimy wagę ρ(x), to napiszemy definicję iloczynu skalarnego dwóch wielomianów:

(9.3)

Wielomiany (9.1) są z definicji ortogonalne, tzn. zachodzi wniosek (Qn,Qm)=δnm.

Wstęp do własności wielomianów ortogonalnych[edytuj]

Każdą potęgę xk możemy przestawić jako kombinację liniową wielomianów ortogonalnych Q0, Q1,Q2,Q3,...,Qk, wtedy na podstawie tej własności funkcja potęgowa dla k<n jest ortogonalna z wielomianem Qn:

(9.4)

Funkcja ortogonalna Qn ma n pierwiastków, bo to wynika z tego, że ona jest iloczynem n czynników (x-xj), zatem nasz wspomniany wielomian piszemy wedle schematu:

(9.5)

Aby przeprowadzić dowód przedstawienia funkcji Qn w postaci iloczynów pewnych czynników (9.5) musimy przeprowadzić dowód nie wprost, zatem załóżmy, że nasz wielomian ma m<n pierwiastków, wtedy wielomian Qn zapisujemy:

(9.6)

Iloczyn skalarny wielomianu ortogonalnego Qn(x) (9.6) i wielomianu zdefiniowane w punkcie (9.5) na mocy twierdzenia (9.4) jest równy zero, na podstawie definicji iloczynu skalarnego (9.3), zatem iloczyn skalarny napisany tuż niżej dla m<n jest po prostu równy zero:


(9.7)

Ale z drugiej jednak strony ten sam wielomian (9.5) możemy przepisać w postaci wielomianów o ustalonych znakach, zatem iloczyn skalarny (9.7), dla obranej odpowiedniej funkcji Qn wyżej zdefiniowaną, piszemy:

(9.8)

Przeprowadźmy dowód nie wprost i załóżmy, że wielomian ma mniej pierwiastów niż n, tzn. ma ich m, a Wn-m nie ma pierwiastków rzeczywistych. Na podstawie wzoru (9.7) całka jest równa zero, bo zachodzi m<n, a całka (9.8), w której występują czynniki podniesione do kwadratu, które są ustalonego znaku, ale 0<n-m<n, jest nie równa zero, bo wielomian Wn-m jest ustalonego znaku, zatem ten sam wynik (9.7) i (9.8) przyjmuje raz wynik równy zero, a za drugim razem jest nierówny zero, wtedy mamy sprzeczność, ale gdy m=n bo (m<n), to wtedy też jest sprzeczność, stąd wielomian Qn ma n pierwiastków. A więc dostajemy, że wielomian ortogonalny Qn ma n pierwiastków i da się przedstawić wzorem (9.5).

Wielomiany ortogonalne jako rozwiązania pewnych równań różniczkowych[edytuj]

Tutaj będziemy rozpatrywać wielomiany ortogonalne spełniających warunki ortogonalności. Aby przeprowadzić dalsze obliczenia napiszmy wielomian wymierny napisaną wedle schematu poniżej, który to jest ilorazem pochodnej zmiennej ρ, która jest wagą przy całkowaniu przy iloczynie skalarnym (9.3), przez tą samą wagę, które to wyrażenie jest ilorazem wielomianu A przez B, zatem w takim przypadku ten iloraz spełnia tożsamość (pierwszy wzór), a także napiszmy warunek na równość w punktach brzegowych x=α,β, który to jest iloczynem wagi ρ(x) i wielomianu B(x), który jest równy zero w tymże punktach:

(9.9)
(9.10)

Wyznaczmy funkcję V, która będzie nam bardzo potrzebna w toku dalszych obliczeń przy wyznaczeniu odpowiedniego typu równań różniczkowych, w tym celu należy skorzystać z równości (9.9), zatem:

(9.11)

Zbadajmy ortogonalność wielomianów V z funkcją potęgową xk dla k<n, wtedy obliczmy najpierw iloczyn skalarny funkcji V z funkcją potęgową, i sprawdzimy później czy te tutaj wspomniane wielomiany są do siebie ortogonalne, ale najpierw całkując w tak otrzymanym iloczynie skalarnym przez części, dochodzimy do wniosku:

(9.12)

Zakładamy, że iloczyn ρ(x)B(x) w punktach α i β jest równy zero, czyli zachodzi wzór (9.10), zatem pierwszy składnik we wzorze (9.12) znika, zatem pozostaje nam tylko drugi składnik, którego całkujemy przez części.


(9.13)

Ponieważ wyrażenia xk i xk-1 są wielomianami, dla których zachodzi k<n, zatem wielomian Qn jest prostopadły do funkcji potęgowej, stąd wynika, że wyrażenie (9.13) jest równe zero, zatem wielomian V zdefiniowany w punkcie (9.11) jest wielomianem prostopadłym do funkcji potęgowej xk, zatem w takim przypadku możemy napisać, że wielomian V jest wyrażamy wzorem V=γ Qn:

(9.14)

Współczynnik γ wyznaczamy w równaniu różniczkowym (9.14) w taki sposób by porównać w nim wyrazy stojące przy xn, to w takim razie dostajemy:

(9.15)

Mając równanie różniczkowe (9.14) na wielomian ortogonalny Qn zdefiniowanej w punkcie (9.1), zatem możemy napisać wzory różniczkowe na wielomiany Legendre'a Pn, Hermite'a Hn,Laguerre'a Ln i Czybyszewa Tn podstawiając za A i B pewne ściśle określone wielomiany:

Wielomian Legendre'a Pn
Wielomian Hermite'a Hn
(9.16)
(9.17)
Wielomian Laguerre'a Ln
Wielomian Czebyszewa Tn
(9.18)
(9.19)

Wzór Rodrigues'a[edytuj]

Można wykazać, że wielomiany ortogonalne można zapisać nade wszystko w prostej postaci. Wielomiany i są to wielomiany różniące się tylko stałym czynnikiem, wtedy wzór Rodrigues'a wyrażamy:

(9.20)

Znając wzór (9.20) nie jesteśmy pewni, czy wielomian jest w ogóle wielomianem, zatem zapiszmy wielomian poniżej i sprawdźmy czemu jest równy wielomian określony:

(9.21)

Wyznaczmy wyrażenie (9.21) dla k=0, czyli dla pochodnej zerowego rzędu, zatem dochodzimy do wniosku:

(9.22)

Teraz wyznaczmy wyrażenie (9.21) dla k=1, czyli dla pochodnej pierwszego rzędu, wtedy będziemy musieli wykorzystać wzór (9.9):

(9.23)

Patrząc na dwa wnioski, czyli (9.22) (przypadek zerowej pochodnej) i (9.23) (przypadek pierwszej pochodnej), możemy dojść do wniosku, że końcowy wynik (9.21) jest iloczynem wielomianu Bn-k i wielomianu Wk, zatem w takim przypadku dochodzimy do wniosku, że spełniona jest prawdopodobnie tożsamość:

(9.24)

Aby udowodnić tożsamość (9.24) należy skorzystać z metody indukcji zupełnej. Przypadek k=0,1, czyli przypadki (9.22) i (9.23) zostały już udowodnione, zatem w takim przypadku wykażmy, czy z zdania n wynika zdanie n+1, zatem przejdźmy do głównego nurtu dowodu:


(9.25)

Jeśli porównamy wynik końcowy wynikowy (9.25) i wzór (9.24), wtedy mamy tożsamość iteracyjną:

(9.26)

Jest to równanie różniczkowo-róznicowe na wielkość Wn, któremu odpowiada wartość początkowa iteracji:

(9.27)

Gdy mamy n=k, przypadek wielomianu Wn zgodnie ze wzorem (9.20) pokrywa się z wielomianem , zatem problem znalezienia wielomianów ortogonalnych sprowadza się do problemu znalezienia wielomianu Wn. Ten wielomian będziemy zapisywali go podobnie jak we wzorze (9.1) dla wielomianu Qn, czyli określmy nasz wielomian Wn jako:

(9.28)

Wielomiany Legendre'a[edytuj]

Wielomiany Legendre'a są opisywane przez równanie różniczkowe opisane przez wzór (9.16), gdzie B=1-x^2 i A=0, wtedy równanie iteracyjne (9.26) przyjmuje postać iteracyjną:

(9.29)

Porównując współczynniki stojące przy potędze xk+1 w (9.29), zatem możemy dojść do wzoru mówiącego o iteracji współczynnika wk:

(9.30)

Napiszmy w sposób zwarty współczynniki wn dla wielomianu Wn:

(9.31)

Jeśli będziemy porównywać współczynnikami stojące przy potędze xk w (9.42) dostajemy tożsamość iteracyjną:

(9.32)

Gdy zadamy warunek brzegowy v0=0, wtedy na podstawie warunku (9.32) dostajemy wniosek, że vn=0.

(Rys. 9.1) Wielomiany Legendre'a Pn(x) dla n=0,...,5

Wielomiany Legrendre'a jako rozwiązanie równania różniczkowego (9.16) piszemy:

(9.33)

Czynniki stojące przy dwóch ostatnich wyrazach dla wielomianów Legendre'a (9.33) są równe:

(9.34)
(9.35)

Wielomiany Hermite'a[edytuj]

(Rys. 9.2) Wykres pierwszych czterech wielomianów Hermite'a

Rozpatrzmy równanie iteracyjne dla wielomianów iteracyjnych Wk, który jest odpowiednikiem równania różniczkowego Hermite'a (9.17).

(9.36)

Porównując współczynniki stojące przy potędze xk i xk-1, i przyjmując odpowiednie warunki brzegowe, tzn. w0=1 i v0=0, wtedy dostajemy wnioski iteracyjne dla tych dwóch najwyższych współczynników. Jak się przekonamy współczynnik vn jest równy zawsze zero, bo współczynnik v0 jest równy zero. Współczynniki wn i vn na współczynników i , z których otrzymamy ich wersje, ale z , z postaci iteracyjnej na postać zwartą, są przedstawione wzorami w sposób:

(9.37)
(9.38)

Wielomiany Hermite'a nazywamy wielomianami napisane jako:

(9.39)

Czynniki stojący w ostatnich wyrazach we wzorze na wielomiany Legendre'a Hn (9.39) są równe:

(9.40)
(9.41)

Wielomiany Laguerre'a[edytuj]

(Rys. 9.3) Wykresy pierwszych czterech wielomianów Laguerre'a

Równaniem iteracyjnym równania różniczkowego Hermitte'a nazywamy wielomian, który jest odpowiednikiem równania różniczkowego (9.18), który wyrażamy wzorem iteracyjnym:

(9.42)

Porównując współczynniki stojące przy potędze xk+1 w (9.42) możemy dojść do wzoru mówiącego o iteracji współczynnika wk, stąd z warunkiem brzegowym w0=1 otrzymujemy wn:

(9.43)

Porównując współczynniki stojące przy potędze xk w (9.42) możemy dojść do wzoru mówiącego o iteracji współczynnika vk, stąd z warunkiem brzegowym v0=0 otrzymujemy vn:


(9.44)

Wielomianem Laguerre'a nazywamy wielomianem ortogonalnym, który piszemy:

(9.45)

Najwyższe dwa współczynniki stojące przy wielomianie Laguerre'a Ln są to współczynniki opisujące wielomian:

(9.46)
(9.47)

Wielomian Czebyszewa[edytuj]

Równaniem iteracyjnym równania różniczkowego Hermitte'a nazywamy wielomian, który jest odpowiednikiem (9.19), który wyrażamy wzorem iteracyjnym:

(9.48)

Porównując współczynniki stojące przy potędze xk+1 w (9.48) możemy dojść do wzoru mówiącego o iteracji współczynnika wk, stąd z warunkiem brzegowym w0=1 otrzymujemy wn:


(9.49)

Porównując współczynniki stojące przy potędze xk w (9.48) możemy dojść do wzoru mówiącego o iteracji współczynnika vk, stąd z warunkiem brzegowym v0=0 otrzymujemy vn:

(9.50)
(Rys. 9.4) Wykresy wielomianu Czebyszewa dla n=0 do n=5

Wielomianem Czebyszewa nazywamy wielomianem, która jest rozwiązaniem równania różniczkowego Czebyszewa (9.19):

(9.51)

Przy wielomianach Czebyszewa Tn współczynniki stojące przy dwóch najwyższych jego potęgach są to współczynniki wyrażone wzorami:

(9.52)
(9.53)

Definicja normy wielomianów ortogonalnych[edytuj]

Wielomiany ortogonalne nie stanowią zwykle bazy ortogonalnej, ponieważ ich normy są nierówne jeden, zatem normą wielomianu ortonormalnego nazywamy normą zapisywanej wzorem przy korzystaniu z definicji iloczynu skalarnego dla dwóch wielomianów ortonormalnych (9.3):

(9.54)

Wiadomo, że wielomian xk jest ortonormalny do wielomianu Qn dla k<n, wtedy norma wielomianu ortogonalnego dla ściśle określonego n w (9.54) sprowadza się do postaci poniżej, wprowadzając jeszcze współczynnik fn, który jest wprost proporcjonalności pomiędzy a , i całkując tak otrzymaną całkę n razy przez części, dostajemy stąd wniosek:

(9.55)

Napiszmy teraz normy dla poszczególnych rozważanych tutaj wielomianów ortonormalnych w tymże module.

Norma dla wielomianu Legendre'a[edytuj]

Przy liczeniu normy wielomianu Legendre'a (9.33), korzystamy z definicji normy wielomianu Qn (9.55), i z definicji wagi równą ρ=1 oraz ʙ=1-x2 i A=0:

(9.56)

Obliczmy tę całkę dokonując podstawienia t=(x+1)/2, czyli x=2t-1, w ten sposób możemy piszemy (9.56):


(9.57)

Norma dla wielomianu Hermite'a[edytuj]

Przy liczeniu normy wielomianu Hermite'a (9.39), korzystamy z definicji normy wielomianu Qn (9.55), zatem ta nasza rozważaną normę piszemy wedle schematu poniżej przy definicji ρ=e-x2 oraz B=1 i A=-2x, zatem:

(9.58)

Norma dla wielomianu Laguerre'a[edytuj]

Przy liczeniu normy wielomianu Hermite'a (9.39), korzystamy z definicji normy wielomianu Qn (9.55), to ta nasza rozważaną normę piszemy wedle przepisu poniżej przy definicjach oraz B=x i A=λ-x gdzie λ>-1, korzystając przy tym z definicji funkcji Γ Eulera drugiego rodzaju (5.13):

(9.59)

Norma dla wielomianu Czebyszewa[edytuj]

Przy liczeniu normy wielomianu Czebyszewa (9.51), korzystamy z definicji normy wielomianu Qn (9.55), zatem ta nasza rozważaną normę piszemy wedle schematu poniżej przy definicji oraz B=1-x2 i A=x korzystając przy tym z definicji funkcji Γ Eulera drugiego rodzaju (5.13):




(9.60)

Następnym krokiem jest wyznaczenie normy wielomianu Czebyszewa Tn dla n=0, korzystając z definicji normy dowolnego wielomianu (9.55) dla tego n, zatem możemy policzyć tą wielkość wedle poniższego sposobu:

(9.61)

Związki rekurencyjne dla wielomianów ortogonalnych[edytuj]

Przestawmy wielomian xQn w postaci rekurencyjnej, który jest jakoby wielomianem n+1 stopnia, który jest kombinacją wielomianów Q0, Q1, Q2,...,Qn+1:

(9.62)

Na wielomian xQn(9.62) podziałajmy iloczynem skalarnym zdefiniowany w punkcie (9.2) względem wielomianu Qj, zatem w takim przypadku możemy napisać, że współczynnik ci jest iloczynem skalarnym członu xQn przez człon Qi podzielonej przez kwadrat modułu wielomianu Qi:

(9.63)

Na podstawie definicji współczynnika ci możemy powiedzieć, że wielomian xQn jest kombinacją wielomianów Qn+1, Qn i Qn-1, czyli w ten w sposób określamy współczynniki cn+1, cn i cn-1, a pozostałe współczynniki ci na podstawie związku (9.63) są równe zero, zatem wielomian (9.62) jest równy wyrażeniu:

(9.64)

W wielomianie (9.64) zapisaną w sposób rekurencyjny, w którym porównując współczynniki stojące przy potęgach xn+1 dostajemy tożsamość:

(9.65)

Następnym krokiem jest porównanie współczynników stojących przy xn, w takim wypadku:

(9.66)

Przy liczeniu współczynnika cn, który wynika ze związku (9.66) wykorzystamy definicję współczynnika cn+1 (9.65), co wyniku czego otrzymujemy:

(9.67)

Jeśli skorzystamy ze wzoru końcowego wynikowego (9.63) dochodzimy do związku na współczynnik cn-1 rozpisując go korzystając z (9.65).

(9.68)

Wielomiany ortogonalne, a jego funkcje tworzące[edytuj]

Funkcjami tworzącymi nazywamy funkcje dwóch zmiennych, które po rozłożeniu w szereg potęgowy względem jednej zmiennej, przy którym w każdym składniku występuje pewien ściśle określony wielomian ortogonalny. Teraz napiszmy funkcję tworzącą Ψ dla wielomianów :

(9.69)

Jeśli skorzystamy ze wzoru całkowego Cauchy'ego (9.17), wtedy wzór zapisany w punkcie (9.69) można zapisać w troszeczkę w innej postaci, ale równoważnej do poprzedniego:

(9.70)

Jeśli wykorzystamy wzór całkowy Cachy'ego (8.17), wtedy możemy napisać tożsamość całkową:

(9.71)

Wzór (9.70) na podstawie własności (9.71), która jest całką Cachy'ego w pewnym sensie, przekształcamy do postaci:

(9.72)

W wyrażeniu na Ψ(z,w) pod sumą mamy szereg geometryczny o ilorazie , wtedy wyrażenie (9.72) piszemy:

(9.73)

Funkcję Ψ(x,w) (9.73) z zasadami liczenia residuum wyznaczamy względem puntu osobliwego z1 wynikający z tożsamości:

(9.74)

Wokół punktu z1 w całce (9.73) mianownik dąży do zera, zatem możemy skorzystać z reguły de l'Hospitala, wtedy tą naszą całkę piszemy wedle schematu poniżej. Nasza całka przebiega po linii zamkniętej w przestrzeni zespolonej o promieniu dążącej do zera (można udowodnić, że ten sam wynik wyjdzie, gdy policzymy całkę (9.73) po dowolnej linii zamkniętej w płaszczyźnie zespolonej okalający ten właśnie punkt, punkt osobliwy), a także w tych samych przekształceniach wykorzystamy metodę liczenia residuum (8.32).

(9.75)

Funkcje tworzące dla wielomianów Legendre'a[edytuj]

Równanie (9.74) dla wielomianu Legendre'a (9.33), dla którego zachodzi i ρ=1, przyjmuje postać:

(9.76)

Rozwiązanie (9.76) z minusem odrzucamy, ponieważ z1 jest poza przedziałem zmienności wielomianu Legendre'a, natomiast rozwiązanie z plusem przyjmujemy, bo jest w granicach przedziału zmienności naszego wielomianu, zatem funkcję tworzącą (9.75) określamy:

(9.77)

Jeśli dodatkowo we wniosku (9.77) napiszemy , to dojdziemy do następującej tożsamości:

(9.78)

Funkcje tworzące dla wielomianów Hermite'a[edytuj]

Równanie (9.74) dla wielomianów Hermite'a (9.39), dla którego mamy B(x)=1, , jest napisane:

(9.79)

Funkcja tworząca (9.75) dla wielomianów Hermite'a, po wykorzystaniu residuum policzonego w (9.79), piszemy w postaci zwartej:

(9.80)

Zatem możemy napisać (9.80), korzystając przy tym z (9.69), w postaci rozwinięcia:

(9.81)

Jeśli przyjmować będziemy w=-v w tożsamości (9.81), wtedy na podstawie definicji wielomianów Hermite'a H(x) przy pomocy (9.39) funkcję tworzącą wielomianu Hn możemy napisać w postaci rozwinięcia:

(9.82)

Funkcje tworzące dla wielomianu Laguerre'a[edytuj]

Równanie (9.74) dla wielomianu Laguerre'a (9.45), dla którego zachodzi B(x)=x, , przyjmuje postać:

(9.83)

Funkcja tworząca (9.75) dla wielomianów Laguerre'a, po wykorzystaniu residuum policzonego w (9.83), piszemy w postaci rozwinięcia:

(9.84)