Metody matematyczne fizyki/Metody matematyczne fizyki

Z Wikibooks, biblioteki wolnych podręczników.
Skocz do: nawigacji, wyszukiwania

Spis treści


Metody matematyczne fizyki
Metody matematyczne fizyki
Autor: Mirosław Makowiecki
Email: mirosław.makowiecki@gmail.com
Licencja: Creative Commons: uznanie autorstwa

[edytuj] Działania na wektorach

Przedstawimy tu wszystkie wiadomości o wektorach, tzn. dodawanie, odejmowanie, a także iloczyn skalarny i wektorowy dwóch wektorów. Oprócz tego wprowadzimy symbol Leviego-Civity oraz zależność symbolu Leviego-Civity z deltami Kroneckera.

[edytuj] Układ współrzędnych

Trójwymiarowy prawoskrętny układ współrzędnych

W układzie współrzędnych w przestrzeni n-wymiarowej możemy zaobserwować n-proste, które nazywamy osiami. Przecinają się one w jednym punkcie, zwanym punktem zerowym, którego współrzędne są równe (0,0,...,0). W środku układu współrzędnych jest określana baza n-wymiarowa, najczęściej kanoniczna, której każdy wektor ma przedstawienie _{\vec{e}_i=(0,0,...,1_i,....,0)}\;. Dla przestrzeni trójwymiarowej euklidesowej układ odniesienia jest pokazany na rysunku obok. Jak widzimy, każdy jego punkt jest określany za pomocą tylko trzech współrzędnych. Kąty między tymi wersorami są kątami prostymi.

[edytuj] Definicja wektora

Załóżmy, że mamy przestrzeń n-wymiarową, tzn. taką w której każdy z punktów można opisać za pomocą n współrzędnych:

A=(a_1,a_2,..,a_n)\;
(1.1)

Weźmy dwa takie punkty, które połączymy pewnym odcinkiem, i określimy zwrot do jednego z tych punktów. Wektor, który w tym przypadku nazywamy zaczepionym, definiujemy jako:

\vec{AB}=B-A=(b_1,b_2,...,b_n)-(a_1,a_2,...,a_n)=[b_1-a_1,b_2-a_2,...,b_n-a_n]\;
(1.2)

Zatem, ogólnie każdy wektor zaczepiony czy swobodny możemy zapisać w postaci:

\vec{a}=[a_1,a_2,...,a_n]=\vec{k}_1a_1+\vec{k}_2a_2+...+\vec{k}_na_n\;
(1.3)

Co dla przestrzeni trójwymiarowej (1.3), numerując kolejno współrzędne przez x,y,z, to wspomniany wzór zapisać można jako:

\vec{a}=[a_x,a_y,a_z]=\vec{i}a_x+\vec{j}a_y+\vec{k}a_z\;
(1.4)

[edytuj] Dodawanie i odejmowanie wektorów

Jeśli mamy dwa wektory \vec{a}\; i \vec{b}\;, to różnicą (sumą) dwóch wektorów, ogólnie niezaczepionych (tzn. takich w których początek wektora nie jest określony) nazywamy działanie o następującej postaci:

\vec{c}=\vec{a}\pm\vec{b}=[a_1,a_2,...,a_n]\pm[b_1,b_2,...,b_n]=[a_1\pm b _1,a_2\pm b_2,...,a_n\pm b_n]\;
(1.5)

Graficznie odejmowanie (dodawanie) wektorów określamy:

Dodawanie dwóch wektorów w przestrzeni dwuwymiarowej
Odejmowanie dwóch wektorów w przestrzeni dwuwymiarowej

[edytuj] Norma wektora

Normą wektora \vec{a}=[a_1,a_2,...,a_n]\; w przestrzeni n-wymiarowej euklidesowej nazywamy długość tego wektora, którego wzór wygląda:

|\vec {a}|=\sqrt{a_1^2+a_2^2+...+a_n^2}\;
(1.6)

[edytuj] Iloczyn skalarny

Dwa wektory o wspólnym początku

Iloczynem skalarnym dwóch wektorów nazywamy działanie określone jako iloczyn długości tychże wektorów oraz kosinusa kąta między nimi (określonego jak gdyby te wektory miały jeden punkt wspólny i różne końce)

\vec{x}\cdot\vec{y}=|\vec{x}||\vec{y}|\cos\alpha\;
(1.7)

Iloczyn skalarny dwóch wektorów można alternatywnie określić jako:

\vec{x}\cdot\vec{y}=x_1y_1+x_2y_2+...+x_ny_n\;
(1.8)

Znając iloczyn skalarny dwóch wektorów określony wzorem (1.7), a także długości wektorów \vec{x}\; i \vec{y}\; określonych wedle wzoru (1.6), można zapisać kosinus kąta między nimi:

\cos\alpha={{\vec{x}\cdot\vec{y}}\over{|\vec{x}||\vec{y}|}}\;
(1.9)

[edytuj] Iloczyn wektorowy

Mając definicję iloczynu mieszanego, skonstruowaną za pomocą iloczynu wektorowego i skalarnego, można przedstawić iloczyn wektorowy jako macierz wersorów układu kartezjańskiego wraz ze współrzędnymi dwóch wektorów, dzięki któremu wyznaczamy iloczyn wektorowy. Zapiszmy iloczyn skalarny wektora \vec{c}\; przez iloczyn wektorowy wektorów \vec{a} i \vec{b}:

\vec{c}\cdot(\vec{a}\times\vec{b})=
\eta\begin{vmatrix}
c_x&c_y&c_z\\
a_x&a_y&a_z\\
b_x&b_y&b_z\\
\end{vmatrix}
(1.10)

Wektor _{\vec{d}=\vec{a}\times\vec{b}}\; jest prostopadły do wektorów _{\vec{a}}\; oraz do _{\vec{b}}\; i tym samym układ wektorów _{(\vec{a}\times\vec{b},\vec{a},\vec{b})}\; tworzy nową bazę o wymiarze trzy zanurzoną w starej bazie w układzie kartezjańskim o takim samym wymiarze.

W definicji iloczynu mieszanego (1.10) wprowadziliśmy parametr η=±1, ponieważ z definicji wspomnianego iloczynu mieszanego, z jeszcze niewyznaczonym parametrem, wynika że iloczyn wektorowy jest prostopadły do wektorów, z którego jest wyznaczony. Istnieją dwa rodzaje tych wektorów, różniące się tylko zwrotami, i dlatego w tej definicji występuje ten wspomniany parametr, by określić te dwa wektory. Parametr η wyznaczymy poniżej, tj. wybierzemy jeden z dwóch tych wektorów, tak by definicja iloczynu wektorowego była taka, a zbudowana na jej podstawie baza określająca nowy układ współrzędnych w oparciu o te trzy wspomniane wcześniej wektory (dwa wektory iloczynu wektorowego i trzeci wektor, który jest jego wynikiem), była taka by skrętność nowego układu współrzędnych była zgodna z ze skrętnoscią starego układu, w którym współrzędne tych trzech wektorów są wyznaczone. Niech baza starego układu odniesienia posiada bazę kanoniczną. Z definicji iloczynu wektorowego możemy wyznaczyć współrzędne wyniku iloczynu wektorowego, którego przestawienie tegoż wektora za pomocą wersorów w prostokątnym układzie współrzędnym starej bazy na razie bliżej nie znanych, które mamy zamiar wyznaczyć. Możemy to zrobić wykorzystując definicję iloczynu mieszanego jako iloczyn pewnego wektora (w tym przypadku wektory bazy starego układu współrzędnych) i iloczynu wektorowego dwóch dowolnych wektorów.

Zatem wyznaczmy współrzędne iloczynu wektorowego względem pierwszego wektora bazy kanonicznej w starym układzie współrzędnych _{\vec{c}=\vec{i}=(1,0,0)}\;, mamy:

d_x=\vec{i}\cdot(\vec{a}\times\vec{b})=\eta\begin{vmatrix}
1&0&0\\
a_x&a_y&a_z\\
b_x&b_y&b_z\\
\end{vmatrix}=\eta\begin{vmatrix}
a_y&a_z\\
b_y&b_z
\end{vmatrix}
(1.11)

Wyznaczmy współrzędne iloczynu wektorowego względem drugiego wektora bazy kanonicznej w starym układzie współrzędnych _{\vec{c}=\vec{j}=(0,1,0)}\;, mamy:

d_y=\vec{j}\cdot(\vec{a}\times\vec{b})=\eta\begin{vmatrix}
0&1&0\\
a_x&a_y&a_z\\
b_x&b_y&b_z\\
\end{vmatrix}=-\eta\begin{vmatrix}
a_x&a_z\\
b_x&b_z
\end{vmatrix}
(1.12)

wyznaczmy współrzędne iloczynu wektorowego względem trzeciego wektora bazy kanonicznej układu współrzędnych _{\vec{c}=\vec{k}=(0,0,1)}\;, mamy:

d_z=\vec{k}\cdot(\vec{a}\times\vec{b})=\eta\begin{vmatrix}
0&0&1\\
a_x&a_y&a_z\\
b_x&b_y&b_z\\
\end{vmatrix}=\eta\begin{vmatrix}
a_x&a_y\\
b_x&b_y
\end{vmatrix}
(1.13)

Jeśli weźniemy _{\vec{d}=(d_x,d_y,d_z)}\;, to układ trzech wektorów _{(\vec{d},\vec{a},\vec{b})}\; jako nowy układ współrzędnych jest zgodny ze starym układem współrzędnym kartezjańskim, gdy wyznacznik macierzy przejścia ze starego układu współrzędnych do nowego spełnia warunek det(T) > 0. Zbudujmy macierz przejścia:

T=\begin{bmatrix}
d_x&d_y&d_z\\
a_x&a_y&a_z\\
b_x&b_y&b_z
\end{bmatrix}
(1.14)

Wykorzystując definicję wektora _{\vec{d}}\;, którego współrzędne są podane w punktach (1.11), (1.12) i (1.13), uzyskujemy wyznacznik macierzy T (1.14):

\det T=\begin{vmatrix}
\eta\begin{vmatrix}
a_y&a_z\\
b_y&b_z
\end{vmatrix}&
-\eta\begin{vmatrix}
a_x&a_z\\
b_x&b_z
\end{vmatrix}&
\eta\begin{vmatrix}
a_x&a_y\\
b_x&b_y
\end{vmatrix}\\
a_x&a_y&a_z\\
b_x&b_y&b_z
\end{vmatrix}=\eta\left( \begin{vmatrix}
a_y&a_z\\
b_y&b_z
\end{vmatrix}^2+\begin{vmatrix}
a_x&a_z\\
b_x&b_z
\end{vmatrix}^2+\begin{vmatrix}
a_x&a_y\\
b_x&b_y
\end{vmatrix}^2 \right)
(1.15)

Aby w naszej nowej bazie skrętność była zgodna ze skrętnością starego układu trójwymiarowego kartezjańskiego, musi zachodzić η = 1 wedle obliczeń (1.15). Udowodniliśmy więc, że iloczyn wektorowy dwóch dowolnych wektorów jest dany tak, by jego definicja na podstawie wcześniejszych rozważań i η=1 (obliczenia (1.15)) była napisana :

\vec{a}\times\vec{b}=\vec{i}d_x+\vec{j}d_y+\vec{k}d_z=
\vec{i}\begin{vmatrix}
a_y&a_z\\
b_y&b_z
\end{vmatrix}-\vec{j}\begin{vmatrix}
a_x&a_z\\
b_x&b_z
\end{vmatrix}+\vec{k}\begin{vmatrix}
a_x&a_y\\
b_x&b_y
\end{vmatrix}=
\begin{vmatrix}
\vec{i}&\vec{j}&\vec{k}\\
a_x&a_y&a_z\\
b_x&b_y&b_z
\end{vmatrix}
(1.16)

[edytuj] Długość wyniku iloczynu wektorowego

Znając długość kąta między wektorami składowymi iloczynu wektorowego, iloczyn wektorowy operujący na długościach wektorów można przedstawić :

|\vec{c}|=|\vec{a}| |\vec{b}|\sin\alpha\;
(1.17)

W celu udowodnienia wzoru (1.17) podnieśmy go do kwadratu i wykorzystamy wzór na jedynkę trygonometryczną, otrzymamy:

\vec{c}^{\,2}=\vec{a}^{\,2}\vec{b}^{\,2}\sin^2\alpha\Rightarrow\vec{c}^{\,2}=\vec{a}^{\,2}\vec{b}^{\,2}(1-\cos^2\alpha)\Rightarrow\vec{c}^{\,2}=\vec{a}^{\,2}\vec{b}^{\,2}-\vec {a}^{\,2}\vec{b}^{\,2}\cos^2\alpha\;
(1.18)

Do tożsamości (1.18) wykorzystajmy wzór na iloczyn skalarny (1.7), wówczas możemy napisać :

\vec{c}^{\,2}=\vec{a}^{\,2}\vec{b}^{\,2}-(\vec{a}\cdot\vec{b})^2\Leftrightarrow \left(\vec{a}\times\vec{b}\right)^2=\vec{a}^{\,2}\vec{b}^{\,2}-(\vec{a}\cdot\vec{b})^2\;
(1.19)

Dalszym krokiem jest wykorzystanie wzorów na długość dowolnego wektora (1.6) i alternatywnego wzoru na iloczyn skalarny (1.8), znając współrzędne składowych wektorów _{\vec{a}}\; i _{\vec{b}}\;, skąd można wyznaczyć składowe wektorów iloczynu wektorowego. Zatem (1.19) na podstawie naszych rozważań zapisujemy:

(a_yb_z-a_zb_y)^2+(a_xb_z-a_zb_x)^2+(a_xb_y-a_yb_x)^2=(a_x^2+a_y^2+a_z^2)(b_x^2+b_y^2+b_z^2)-(a_xb_x+a_yb_y+a_zb_z)^2\;
(1.20)

Lewą stronę równości (1.20) możemy rozpisać w sposób:

L=a_y^2b_z^2+a_z^2b_y^2-2a_ya_zb_yb_z+a_x^2b_z^2+a_z^2b_x^2-2a_xa_zb_xb_z+a_x^2b_y^2+a_y^2b_x^2-2a_xa_yb_xb_y\;
(1.21)

Prawą stronę równości (1.20) piszemy w postaci:

P=a_x^2b_x^2+a_x^2b_y^2+a_x^2b_z^2+a_y^2b_x^2+a_y^2b_y^2+a_y^2b_z^2+a_z^2b_x^2+a_z^2b_y^2+a_z^2b_z^2-a_x^2b_x^2-a_y^2b_y^2-a_z^2b_z^2+\;
-2a_xa_yb_xb_y-2a_xa_zb_xb_z-2a_ya_zb_yb_z
\;
(1.22)

Po redukcji wyrazów podobnych w wyrażeniu (1.22) dochodzimy do wniosku, że zachodzi L=P, zatem udowodniliśmy, że spełniona jest tożsamość (1.20), a zatem (1.17).

[edytuj] Iloczyn mieszany

Korzystając z (1.16), iloczyn mieszany przedstawiamy przyjmując η=1, wówczas skrętność dwóch składowych iloczynu wektorowego i samego wyniku jest taka sama jak skrętność układu odniesienia, w której zanurzone są te trzy wspomniane wektory.

\vec{c}\cdot(\vec{a}\times\vec{b})=[c_x,c_y,c_z][d_x,d_y,d_z]=
c_x\begin{vmatrix}
a_y&a_z\\
b_y&b_z
\end{vmatrix}-c_y\begin{vmatrix}
a_x&a_z\\
b_x&b_z
\end{vmatrix}+c_z\begin{vmatrix}
a_x&a_y\\
b_x&b_y
\end{vmatrix}=
\begin{vmatrix}
c_x&c_y&c_z\\
a_x&a_y&a_z\\
b_x&b_y&b_z\\
\end{vmatrix}
(1.23)

Udowodniliśmy zatem, że wzór (1.23) jest taki sam jak (1.10), z tą różnicą, że η musi być równe jeden.

Z definicji wyznacznika oraz definicji iloczynu mieszanego (1.23) zachodzi:

\vec{c}\cdot(\vec{a}\times\vec{b})=\vec{a}\cdot(\vec{b}\times\vec{c})=\vec{b}\cdot(\vec{c}\times\vec{a})\;
(1.24)

[edytuj] Właściwości podwójnego iloczynu wektorowego

Napiszmy pewną tożsamość , którą udowodnimy później:

\vec{a}\times(\vec{b}\times\vec{c})=\vec{b}(\vec{a}\vec{c})-\vec{c}(\vec{a}\vec{b})\;
(1.25)

Poniżej przedstawiony jest dowód z użyciem definicji iloczynu wektorowego (1.16) i iloczynu skalarnego za pomocą współrzędnych wektorów (1.8), wchodzących w skład podwójnego iloczynu wektorowego. Skorzystamy tu z nieformalnej definicji iloczynu wektorowego w przestrzeni trójwymiarowej jako macierzy, w której występują ortonormalne wersory.

\vec{a}\times(\vec{b}\times\vec{c})=\vec{a}\times\begin{vmatrix}
\vec{i}&\vec{j}&\vec{k}\\
b_x&b_y&b_z\\
c_x&c_y&c_z
\end{vmatrix}=
\begin{vmatrix}
\vec{i}&\vec{j}&\vec{k}\\
a_x&a_y&a_z\\
\begin{vmatrix}
b_y&b_z\\
c_y&c_z\\
\end{vmatrix}&
\begin{vmatrix}
b_z&b_x\\
c_z&c_x\\
\end{vmatrix}&
\begin{vmatrix}
b_x&b_y\\
c_x&c_y
\end{vmatrix}
\end{vmatrix}=
=\begin{vmatrix}
\vec{i}&\vec{j}&\vec{k}\\
a_x&a_y&a_z\\
b_yc_z-b_zc_y&b_zc_x-b_xc_z&b_xc_y-b_yc_x
\end{vmatrix}=
=\vec{i}[a_y(b_xc_y-b_yc_x)-a_z(b_zc_x-b_xc_z)]+\vec{j}[a_z(b_yc_z-b_zc_y)-a_x(b_xc_y-b_yc_x)]+

+\vec{k} a_x(b_zc_x-b_xc_z)-a_y(b_yc_z-b_zc_y)]=\vec{i}(b_x a_yc_y-c_x a_yb_y-c_x a_zb_z+b_x a_zc_z)+ +\vec{j}(b_y a_zc_z-c_ya_zb_z-c_ya_xb_x+b_ya_xc_x)+\vec{k}(b_za_xc_x-c_za_xb_x-c_za_yb_y+b_za_yc_y)= =\vec{i} b_x(a_xc_x+a_yc_y+a_zc_z)-\vec{i}c_x(a_xc_x+a_yb_y+a_zb_z)+\vec{j} c_y(a_zb_z+a_yb_y+a_xb_x)+ -\vec{j}b_y(a_zc_z+a_xc_x+b_ya_xc_x)+\vec{k}b_z(a_xc_x+c_ya_y+a_yc_y)-\vec{k}c_z(a_xb_x+a_yb_y+a_zb_z)=

=(\vec{i}b_x+\vec{j}b_y+\vec{k}b_z)(a_xc_x+a_yc_y+a_zc_z)-(\vec{i}c_x+\vec{j}c_y+\vec{k}c_z)(a_xc_x+a_yb_y+a_zb_z)=\vec{b}\left(\vec{a}\cdot\vec{c}\right)-\vec{c}\left(\vec{a}\cdot\vec{b}\right)
(1.26)

Co kończy dowód.

[edytuj] Symbol Leviego-Civity w iloczynie wektorowym

Iloczyn wektorowy (1.16) można alternatywnie przedstawić w łatwiejszy sposób, tzn. za pomocą symboli Leviego-Civity:

(\vec{a}\times\vec{b})_i=\epsilon_{ijk}a_jb_k
(1.27)
  • gdzie: symbol εijk, nazywany symbolem Leviego-Civity, definiujemy w sposób:
\epsilon_{ijk} = 
\begin{cases}
 1 & \mbox{gdy } ijk \mbox{ to permutacja parzysta } (1,2,3) \\
 0 & \mbox{gdy } i=j \mbox{ lub } j=k \mbox{ lub } k=i\\
-1 & \mbox{gdy } ijk \mbox{ to permutacja nieparzysta } (1,2,3) \\
\end{cases}
(1.28)

Widzimy, że w definicji (1.28) dla każdej parzystej permutacji (1,2,3) we wskaźnikach ijk, symbol Leviego-Civity daje nam wartość 1 (jeden), a dla każdej nieparzystej permutacji daje nam wartość -1 (minus jeden). Gdy wskaźniki w ijk się powtarzają, wówczas symbol ten jest z oczywistych powodów równy zero.

[edytuj] Zależność symbolu Leviego-Civity z deltami Kroneckera

Mając już wyznaczony wzór na podwójny iloczyn wektorowy (1.25) załóżmy, że kolejno wektory \vec{a}\;,\vec{b}\;,\vec{c}\; są równe wektorom bazy kanonicznej trójwymiarowego euklidesowego układu współrzędnych, tzn. są zapisane :

\vec{e}_1=(1,0,0)\;
(1.29)
\vec{e}_2=(0,1,0)\;
(1.30)
\vec{e}_3=(0,0,1)\;
(1.31)

dlatego podwójny iloczyn wektorowy (1.25) zapisujemy:

\vec{e}_i\times(\vec{e}_j\times\vec{e}_k)=\vec{e}_j(\vec{e}_i\cdot\vec{e}_k)-\vec{e}_k(\vec{e}_i\cdot\vec{e}_j)\;
(1.32)

Znając definicję wersorów kanonicznych trójwymiarowego układu współrzędnych (1.29), (1.39) i (1.31), oraz wykorzystując definicję iloczynu wektorowego przy pomocy symboli Leviego-Civity, którego kolejne wektory są wektorami bazy kanonicznej (1.32), możemy utworzyć następującą tożsamość:

\epsilon_{pil}\epsilon_{ljk}=\delta_{pj}\delta_{ik}-\delta_{pk}\delta_{ij}\;
(1.33)

[edytuj] Rachunek tensorowy

Przestrzeń nieeuklidesowa - przestrzeń, która nie jest płaska, tzn. promień krzywizny jest na ogół różny od nieskończoności, co oznacza że krzywizna jest różna od 0.

[edytuj] Konwencja Einsteina

W standardowej konwencji sumacyjnej, dla przypadku tensorowego przy sumowaniu iloczynów tensora kontrawariantnego Tn i kowariantnego Sn, których wskaźnikiem niemym jest n, tę sumę możemy zapisać:

P=\sum_pT^pS_p\;
(2.1)

A jeśli użyjemy konwencji sumacyjnej Einsteina, to przykład (2.1) zapisujemy w prostszej postaci:

P=T^pS_p\;
(2.2)

Widzimy, że obie konwencje oznaczają to samo, ale wygodniejsza jest konwencja Einsteina, bo zapis wyrażenia P jest o wiele prostszy i zawsze będziemy stosować konwencję Einsteina (chyba że zostanie napisane inaczej).

[edytuj] Tensor kowariantny

Tensorem kowariantnym bez konwencji Einsteina, który zawiera tylko dolne wskaźniki o ściśle określonej liczbie, nazywamy obiekt, który transformuje się ze zmiennych starych, których liczba wynosi m, na nowe o takiej samej liczbie zmiennych:

\widehat{B}_{p_1p_2...p_n}(\widehat{q}_1,\widehat{q}_2,..,\widehat{q}_m)=
\sum^{}_{k_i}\left[\prod^{m}_{j=1}{{\partial q^{k_i}}\over{\partial \widehat{q}^{p_j}}}\right]B_{k_1k_2...k_n}(q_1,q_2,...,q_m)\;
(2.3)

Dla przykładu podamy jak się transformuje tensor o dwóch wskaźnikach dolnych ze współrzędnych starych na nowe, dla dwóch zmiennych zapisanych w konwencji Einsteina.


\widehat{B}_{p_1p_2}(\widehat{q}_1,\widehat{q}_2)={{\partial q^{k_1}}\over{\partial\widehat{q}^{p_1}}}{{\partial q^{k_1}}\over{\partial\widehat{q}^{p_1}}}B_{k_1k_2}(q_1,q_2)\;
(2.4)

A transformację tensora z jednych współrzędnych do drugich o dwóch wskaźnikach dolnych dla m zmiennych ze starych współrzędnych na nowe zapisaną w konwencji Einsteina przedstawiamy:


\widehat{B}_{p_1p_2}(\widehat{q}_1,\widehat{q}_1,...,\widehat{q}_m)={{\partial q^{k_1}}\over{\partial\widehat{q}^{p_1}}}{{\partial q^{k_1}}\over{\partial\widehat{q}^{p_1}}}B_{k_1k_2}(q_1,q_1,..,q_m)\;
(2.5)

[edytuj] Tensor kontrawariantny

Tensorem kotrawariantnym bez konwencji Einsteina, który zawiera tylko dolne wskaźniki o ściśle określonej liczbie, nazywamy obiekt, który transformuje się ze zmiennych starych na nowe według schematu:

\widehat{A}^{p_1p_2...p_n}(\widehat{q}_1,\widehat{q}_2,...,\widehat{q}_m)=\sum_{k_i}\left[\prod^n_{j=1}{{\partial\widehat{q}^{p_j}}\over{\partial q^{k_i}}}\right]A^{k_1k_2...k_n}(q_1,q_2,...,q_m)\;
(2.6)

Dla przykładu podamy jak się transformuje tensor o dwóch wskaźnikach górnych dla dwóch zmiennych zapisanej ze starych na nowe w konwencji Einsteina:

\widehat{A}^{p_1p_2}(\widehat{q}_1,\widehat{q}_2)={{\partial\widehat{q}^{p_1}}\over{\partial q^{k_1}}}{{\partial\widehat{q}^{p_2}}\over{\partial q^{k_2}}}\widehat{A}^{k_1k_2}(q_1,q_2)\;
(2.7)

A transformację tensora z jednych współrzędnych do drugich o dwóch wskaźnikach górnych dla m zmiennych zapisanych q starych współrzędnych na nowe w konwencji Einsteina piszemy:

\widehat{A}^{p_1p_2}(\widehat{q}_1,\widehat{q}_2,...,\widehat{q}_m)={{\partial\widehat{q}^{p_1}}\over{\partial q^{k_1}}}{{\partial\widehat{q}^{p_2}}\over{\partial q^{k_2}}}A^{k_1k_2}(q_1,q_2,...,q_m)\;
(2.8)

[edytuj] Definicja prostego tensora metrycznego

Załóżmy, że mamy przestrzeń n-wymiarową, przy zastosowaniu twierdzenia o różniczce zupełnej zależnej od n zmiennych, używając przy tym definicji delty Kroneckera, możemy przedstawić infinitezymalną długość według schematu:

ds=\sqrt{ dx^i dx^{i}}=\sqrt{\delta_{ij}dx^idx^j}=\sqrt{\delta_{ij} {{\partial x_i}\over{\partial p^k}} {{\partial x^j}\over{\partial p^r}}dp^kdp^r}=\sqrt{g_{kr}dp^kdp^r}\;
(2.9)

W obliczeniach (2.9) wprowadziliśmy tensor gkr, mając zmienne xi przedstawione w zależności od współrzędnych w układzie krzywoliniowym:

g_{kr}=\delta_{ij}{{\partial x^i}\over{\partial p^k}}{{\partial x^j}\over{ \partial p^r}}\;
(2.10)

Mając powyższy wzór (2.10) tensor metryczny w układzie kartezjańskim przedstawiany jest jako delta Kroneckera, który jest tensorem symetrycznym z definicji.

Teraz udowodnimy, że tensor metryczny jest tensorem symetrycznym, korzystając z definicji tensora Kroneckera, który jest symetryczny, wtedy możemy dojść do wniosku, że:

g_{kr}=\delta_{ij}{{\partial x_i}\over{\partial p^k}}{{\partial x_j}\over{\partial p^r}}
={{1}\over{2}}\left(\delta_{ij}{{\partial x_i}\over{\partial p^k}}{{\partial x_j}\over{\partial p^r}}+ \delta_{ji}{{\partial x_j}\over{\partial p^k}}{{\partial x_i}\over{\partial p^r}}    \right)
={{1}\over{2}}\delta_{ij}\left({{\partial x_i}\over{\partial p^k}}{{\partial x_j}\over{\partial p^r}}+ {{\partial x_j}\over{\partial p^k}}{{\partial x_i}\over{\partial p^r}}       \right)
\;
(2.11)

W powyższym wzorze, gdy zamienimy miejscami k na r i odwrotnie, mamy gkr=grk, czyli tensor metryczny jest symetryczny, co oznacza, że dla macierzy g tensora metrycznego mamy: g=gT, bo g=[g_{ij}]_{nxn}\;.

[edytuj] Definicja odwrotnego tensora metrycznego

Tensor odwrotny do tensora metrycznego gkr definiujemy w analogii do tensora metrycznego prostego, przestawionego w punkcie (2.10), wedle wzoru:

g^{kr}=\delta^{ij}{{\partial p^k}\over{\partial x^i}}{{\partial p^r}\over{\partial x^j}}
(2.12)

Oczywiste jest, że tensor metryczny odwrotny (2.12) jest tensorem symetrycznym (korzystać tutaj będziemy z symetryczności delty Kroneckera), czego dowód jest przedstawiony poniżej:

g^{kr}=\delta^{ij}{{\partial p^k}\over{\partial x^i}}{{\partial p^r}\over{\partial x^j}}={{1}\over{2}}\left(\delta^{ij}{{\partial p^k}\over{\partial x^i}}{{\partial p^r}\over{\partial x^j}}+\delta^{ji}{{\partial p^k}\over{\partial x^j}}{{\partial p^r}\over{\partial x^i}}\right)=
{{1}\over{2}}\delta^{ij}\left({{\partial p^k}\over{\partial x^i}}{{\partial p^r}\over{\partial x^j}}+{{\partial p^k}\over{\partial x^j}}{{\partial p^r}\over{\partial x^i}}\right)
(2.13)

W powyższym wzorze, gdy zamienimy miejscami k na r i odwrotnie, mamy gkr=grk, zatem możemy dojść do wniosku, że odwrotny tensor metryczny przestawionej w punkcie (2.12) jest tensorem symetrycznym ze względu na zmianę wskaźników k i r między sobą.

[edytuj] Wykorzystanie tensora metrycznego prostego lub odwrotnego w działaniach na zwykłych tensorach

Aby zamienić zwykły tensor lub tensor metryczny z jego wersji kowariantnej do kontrawariantnej lub odwrotnie, postępujemy wedle schematów:

A^p=A_sg^{sp}\;
(2.14)
A_p=A^sg_{sp}\;
(2.15)

Jeśli zwykły tensor ma kilka wskaźników, składających się ze wskaźników dolnych lub górnych albo składających się ze wskaźników jednocześnie górnych i dolnych, to możemy je przenosić z góry na dół lub odwrotnie, wykorzystując podobne przedstawienia do (2.14) lub (2.15).

[edytuj] Właściwości tensora metrycznego kowariantno-kontrwariantnego

Sprawdźmy, czy tensor metryczny kowariantno-kotrawarianty jest tensorem jednostkowym, ale korzystając z definicji tensora metrycznego prostego (2.10) i odwrotnego (2.12) oraz podobnych przekształceń do (2.14) i (2.15), kolejno postępując:

{g^m}_k={g_k}^{m}=g_{kr}g^{rm}=\delta_{ij}{{\partial x^i}\over{\partial p^k}}{{\partial x^j}\over{\partial p^r}}\delta^{pq}{{\partial p^r}\over{\partial x^p}}{{\partial p^m}\over{\partial x^q}}={\delta^j}_p\delta_{ij}\delta^{pq}{{\partial x^i}\over{\partial p^k}}{{\partial p^m}\over{\partial x^q}}={{\partial x^i}\over{\partial p^k}}{{\partial p^m}\over{\partial x^i}}=\;
=
{{\partial p^m}\over{\partial p^k}}={\delta^m}_{k}={\delta_k}^m
(2.16)

Na podstawie obliczeń (2.16) dochodzimy do wniosku, że prawdziwe są poniższe wzory na tensor metryczny kowariantno-kontrawariantny i na tensor metryczny kontrawariantno-kowariantny:

{g_k}^{m}={\delta_k}^m
(2.17)
{g^m}_k={\delta^m}_k
(2.18)

Macierz gmk jest macierzą diagonalną i jednostkową, a także tensor jako macierz gij jest macierzą odwrotną do macierzy (tensora) gij wedle obliczeń przeprowadzonych w punkcie (2.16).

[edytuj] Baza krzywoliniowa a tensor metryczny

W układzie krzywoliniowym wektor wodzący można przedstawić w układzie Euklidesa, w którym zanurzony jest układ krzywoliniowy, a zapisać go możemy przy pomocy wzoru zależnego od współrzędnych kartezjańskich i współrzędnych krzywoliniowych:

\vec{r}=\vec{k}_i x^i(q^j)\;
(2.19)

Zdefiniujmy wektor, który jest zapisywany jako pochodna cząstkowa wektora wodzącego (2.19) względem współrzędnej krzywoliniowej qm:

\vec{e}_m={{\partial \vec{r}}\over{\partial q^m}}={{\partial \left(\vec{k}_i x^i\right)}\over{\partial q^m}}=\vec{k}_i{{\partial x^i}\over{\partial q^m}}\;
(2.20)

Wyznaczmy iloczyn wektorów zdefiniowanych w (2.20) o wskaźnikach m i n, wtedy możemy dojść do wniosku, że końcowy wynik jest tensorem metrycznym prostym (2.10), co wynika z definicji wektora kowariantnego (2.20):

\vec{e}_m\vec{e}_n=\vec{k}_i{{\partial x^i}\over{\partial q^m}}
\vec{k}_j{{\partial x^j}\over{\partial q^n}}=\delta_{ij}{{\partial x^i}\over{\partial q^m}}{{\partial x^j}\over{\partial q^n}}=g_{mn}\;
(2.21)

Jeszcze raz przepiszmy wynik końcowy obliczeń w punkcie (2.21), który jest analogiczną definicją do (2.10). Stąd wynika, że iloczyn dwóch wektorów kowariantnych jest równy podwójnie kowariantnemu tensorowi metrycznemu:

g_{mn}=\vec{e}_m\vec{e}_n\;
(2.22)

Podnieśmy wskaźnik m do góry we wzorze (2.22), który jest wektorem (2.20) i jednocześnie tensorem, a zatem ostatecznie możemy napisać iloczyn m-tego kontrawariantnego wektora bazy przez n-ty kowariantny wektor, który jak się można przekonać jest tensorem metrycznym o wskaźniku górnym m i dolnym n:

{g^{m}}_{n}=\vec{e}^m\vec{e}_n\;
(2.23)

[edytuj] Definicja symboli Christoffela

Symbol Christofela zdefiniowany jest w rachunku tensorowym dla wektorów bazy kowariantnych i kontrawariantnych:

\nabla_le_j={\Gamma^k}_{lj}e_k.\;
(2.24)
\nabla_le^j=-{\Gamma^j}_{lk}e^k\;
(2.25)

Udowodnijmy teraz równoważność obu definicji symboli Christoffela zdefiniowanych w punktach (2.24) i (2.25). W pierwszej definicji symbolu Christofela pomnóżmy przez er zdefiniowanych w punkcie (2.20), a dalej wykorzystajmy wzór (2.22), który jest definicją tensora metrycznego prostego:

(\nabla_le_j)e_r={\Gamma^k}_{lj}e_ke_r\Rightarrow(\nabla_le_j)e_r={\Gamma^k}_{lj}g_{kr}\;
(2.26)

Pomnóżmy wynikowy wzór (2.26) przez podwójnie kontrawariantny tensor metryczny gkr obustronnie. Jeśli wykorzystamy tożsamość (2.18), wtedy możemy dojść do wniosku:

(\nabla_le_j)e_rg^{kr}={\Gamma^k}_{lj}\;
(2.27)

Następnie pomnóżmy obustronnie równanie (2.27) przez wektor kontrawariantny ej zdefiniowany wcześniej, otrzymujemy:

(\nabla_le_j)e_rg^{kr}e^j={\Gamma^k}_{lj}e^j\;
(2.28)

Jeśli skorzystamy z własności tensora metrycznego, tzn. ergkr=ek, do których wykorzystamy definicję (2.20), które przedstawiają pewne wektory:

e^ie_k=e^i g_{sk}e^s=g_{sk}e^ie^s=g_{sk}g^{is}={g^i}_k={\delta^i}_k\;
(2.29)

Równanie (2.28), wykorzystując przy tym udowodnioną tożsamość (2.29), możemy przekształcić do poniższej postaci (według praw rachunku tensorowego):

(\nabla_le_j)e^ke^j={\Gamma^k}_{lj}e^j\Rightarrow\nabla_l (e_je^ke^j)-(\nabla_l e^k) e_je^j-(\nabla_l e^j)e_je^k={\Gamma^k}_{lj}e^j\Rightarrow
\Rightarrow(\nabla_le^kg^{j}_j)-(\nabla_l e^k) g^j_j-(\nabla_l e^j)g^k_j={\Gamma^k}_{lj}e^j\;
(2.30)

Jeśli wykorzystamy tożsamość (2.18) na tensor metryczny kowariantno-kontrwariantno, wtedy możemy końcowy wzór (2.30) zapisać w sposób:

(\nabla_l e^k)g^{j}_j-(\nabla_le^k)g^{j}_j-(\nabla_le^k)={\Gamma^k}_{lj}e^j\;
(2.31)

Pierwsze dwa wyrazy we wzorze w punkcie (2.31) redukują się, po tym uproszczeniu możemy zapisać wyrażenie w ostatecznej formie:

-(\nabla_le^k)={\Gamma^k}_{lj}e^j\Rightarrow(\nabla_le^k)=-{\Gamma^k}_{lj}e^j\;
(2.32)

W tej chwili w końcowym punkcie (2.32) otrzymaliśmy drugą definicję (2.25) symboli Christoffela z pierwszej (2.24).

[edytuj] Pochodna kowariantna o współrzędnych kowariantnych

W tym rozdziale policzymy pochodną kowariantną o współrzędnych kowariantnych, weźmiemy w tym celu wektor A, który można rozłożyć na składowe Ai względem wersorów ei wedle sposobu:

A=A^ie_i\;\;
(2.33)

Policzmy teraz różniczkę wielkości wektorowej A zdefiniowaną wedle wzoru (2.33), wykorzystując twierdzenie o różniczce zupełnej z iloczynu dwóch wielkości, którą możemy rozpisać w taki sposób:

dA=dA^i e_i+A^i de_i\;\;
(2.34)

Możemy również wykorzystując tożsamość (2.24), używając jej dla wzoru na różniczkę wektora ei. Wtedy będziemy mogli napisać tożsamość na różniczkę zupełną wielkości wektora kowariantnego o wskaźniku "i":

de_i={{\partial e_i}\over{\partial x^l}}dx^l=\nabla_l e_i dx^l={\Gamma^k}_{li}e_kdx^l\;
(2.35)

Na podstawie napisanej tożsamości na różniczkę zupełną wektora kowariantnego (2.35) możemy wpisać go do wzoru na różniczkę zupełną wielkości A (2.34), którą można zapisać tożsamością przy pomocy tensora Christoffela:

dA={{\partial A^i}\over{\partial x^l}}dx^le_i+A^i{\Gamma^k}_{li}e_kdx^l\;
(2.36)

A teraz, po przemianowaniu indeksów w pierwszym składniku we wzorze (2.36), możemy wspomniany wzór na różniczkę zupełną wielkości A, jako różniczkę wielkości absolutnej:

dA={{\partial A^k}\over{\partial x^l}}dx^le_k+A^i{\Gamma^k}_{li}e_kdx^l\;
(2.37)

Obie strony (2.37) podzielmy przez różniczkę du i wyłączmy za nawias pewne wyrażenie, która jest pochodną zupełną wielkości xl względem wielkości u pomnożonej przez wektor ek:

{{dA}\over{du}}=\left({{\partial A^k}\over{\partial x^l}}+A^i{\Gamma^k}_{li} \right){{dx^l}\over{du}}e_k\;
(2.38)

A zatem zdefiniujmy na podstawie wzoru (2.38) pochodną tensorową, która mieści się w nawiasie w wspomnianym wyrażeniu zapisujemy ją jako wielkość kontrawiantną, w której występuje zwykła pochodna cząstkowa i wyraz będący iloczynem współrzędnej wielkości A i symbolu Christoffela:

{A^k}_{;l}={{\partial A^k}\over{\partial x^l}}+A^i{\Gamma^k}_{li}\;
(2.39)

Wyrażenie (2.38) nazywamy pochodna absolutną, a (2.39) jest pochodną kowariantną wielkości kontrawariantnej.

[edytuj] Pochodna kowariantna o współrzędnych kontrawariantnych

W tym rozdziale policzymy pochodną kowariantną o współrzędnych kowariantnych, w tym celu napiszmy wektor A, który można rozłożyć na składowe Bi względem wektorów kontrawiantnych ei, wedle sposobu:

B=B_je^j\;\;
(2.40)

A teraz policzmy różniczkę wielkości wektorowej B zdefiniowanej wedle wzoru (2.40) wykorzystując twierdzenie o różniczce zupełnej iloczynu dwóch wielkości. Na samym końcu nasza różniczka dB wyraża się wzorem:

dB=dB_je^j+Bde^j\;\;
(2.41)

Możemy również, wykorzystując tożsamość (2.25) i używając jej we wzorze na różniczkę wersora ei, napisać tożsamość na różniczkę zupełną wielkości wektora kontrawariantnego o wskaźniku i-tym:

de^j={{\partial e^j}\over{\partial x^l}}dx^l=\nabla_l e^jdx^l=-{\Gamma^j}_{lk}e^kdx^l\;
(2.42)

Tożsamości na różniczkę wektora wielkości kontrawiariantnej (2.42) możemy użyć we wzorze na różniczkę zupełną wielkość B (2.41), którą można przy pomocy tensora Christoffela zapisać wzorem:

dB={{\partial B_j}\over{\partial x^l}}e^jdx^l+B_j\nabla_le^jdx^l={{\partial B_j}\over{\partial x^l}}dx^le^j-B_j{\Gamma^j}_{lk}e^kdx^l\;
(2.43)

Po przemianowaniu indeksów w pierwszym składniku we wzorze (2.43) możemy przepisać wspomniany wzór na różniczkę zupełną wielkości B jako różniczkę absolutną:

{{dB}\over{du}}=\left({{\partial B_k}\over{\partial x^l}}-B_j{\Gamma^j}_{lk}\right){{dx^l}\over{du}}e^k=\left( {{\partial B_k}\over{\partial x^l}}-B_j{\Gamma^j}_{lk}\right){{dx^l}\over{du}}e^k\;
(2.44)

A zatem zdefiniujmy na podstawie wzoru (2.44) pochodną tensorową, która mieści się w nawiasie w wspomnianym wyrażeniu. Zapisujemy ją jako wielkość kowariantną, w której występuje zwykła pochodna cząstkowa i wyraz będący iloczynem współrzędnej wielkości B i symbolu Christoffela:

B_{k;l}= {{\partial B_k}\over{\partial x^l}}-B_j{\Gamma^j}_{lk}\;
(2.45)

Wyrażenie (2.44) nazywamy pochodną absolutną, natomiast wzór (2.45) nazywamy pochodną kowariantną wielkości kowariantnej.

[edytuj] Pochodna tensorowa iloczynu tensorów

Wyznaczymy pochodną tensorową wielkości iloczynu tensorowego, najpierw podając pełną jej postać:

(A^iB^j)_{;k}={A^i}_{;k}B^j+A^i{B^j}_{;k}\;
(2.46)

Wyznaczmy lewą stronę równania (2.46), wykorzystując definicję pochodnej kowariantnej (2.39), po czym przejdziemy do jej prawej strony, zatem przekształcając jednocześnie możemy zapisać:

(A^iB^j)_{;k}={C^{ij}}_{;k}={C^{ij}}_{,k}+{\Gamma^{i}}_{ks}C^{sj}+
{\Gamma^{j}}_{ks}C^{is}={(A^iB^j)}_{,k}+{\Gamma^i}_{ls}A^sB^j+{\Gamma^j}_{ks}A^iB^s=\;

={A^i}_{,k}B^j+A^i{B^j}_{,k}+({\Gamma^i}_{ls}A^s)B^j+({\Gamma^j}_{ks}B^s)A^i=\;
=B^j({A^i}_{,k}+{\Gamma^i}_{ls}A^s)+A^i({B^j}_{,k}+\Gamma^j_{ks}B^s)=\;

={A^i}_{;k}B^j+A^i{B^j}_{;k}\;
(2.47)

Co kończy dowód.

Wyznaczmy pochodną tensorową wielkości iloczynu tensorowego, w tym celu najpierw podamy, jak ta zależność jest napisana w pełnej postaci:

(A_iB_j)_{;k}={A_i}_{;k}B_j+A_i{B_j}_{;k}\;
(2.48)

Wyznaczmy lewą stronę równania (2.48), wykorzystując definicję pochodnej kowariantnej (2.45), i przejdziemy do jej prawej strony, przekształcając jednocześnie obie strony:

(A_iB_i)_{;k}=C_{ij;k}=C_{ij,k}-{\Gamma^s}_{ik} C_{sj}-{\Gamma^s}_{jk}C^{is}=(A_iB_i)_{,k}-{\Gamma^s}_{ik}A_sB_j-{\Gamma^s}_{jk}A_iB_s=\;

=A_iB_{j,k}+A_{i,k}B_j-{\Gamma^s}_{ik}A_sB_j-{\Gamma^s}_{jk}B_sA_i=\;
=A_i(B_{j,k}-{\Gamma^s}_{jk}B_s)+(A_{i,k}-{\Gamma^s}_{ik}A_s)B_j=\;

=A_iB_{j;k}+A_{i;k}B_j\;
(2.49)

Co kończy dowód.

[edytuj] Właściwości przemienne kolejności wskaźników tensora Christoffela

Weźmy pochodną cząstkową pewnego skalaru, który nazwiemy φ napisaną względem wielkości α i β, co wyrazimy:

\phi_{,\alpha,\beta}={{\partial}\over{\partial x^{\alpha}}}{{\partial}\over{\partial x^{\beta}}}\phi\;
(2.50)

Można udowodnić, z warunku że zwykła pochodna funkcji jest tensorem stopnia zerowego, że jego pochodna cząstkowa jest także tensorem, zatem możemy napisać dwie tożsamości, z których będziemy korzystać w dalszych krokach naszego rozważania:

\phi_{;\beta;\alpha}=\phi_{;\alpha;\beta}\;
(2.51)
\phi_{,\alpha}=\phi_{;\alpha}\;
(2.52)

Z definicji pochodnej kowariantnej oraz korzystając z faktu, że pochodna cząstkowa zwykłej funkcji jest tensorem, dochodzimy:

\phi_{,\beta,\alpha}-\phi_{,\mu}{\Gamma^{\mu}}_{\beta\alpha}=\phi_{,\alpha,\beta}-\phi_{,\mu}{\Gamma^{\mu}}_{\alpha\beta}\;
(2.53)

Pochodna cząstkowa względem parametru xα, a potem od parametru xα jest taka sama, gdybyśmy różniczkowali od odwrotnej strony, zatem wiadomo z analizy matematycznej:

\phi_{,\beta,\alpha}=\phi_{,\alpha,\beta}\;
(2.54)

W takim bądź razie wyrażenie (2.53), przy pomocy tożsamości (2.54) wynikającej z przemienności różniczkowania cząstkowego, możemy zapisać w uproszczonej postaci:

\phi_{,\mu}{\Gamma^{\mu}}_{\beta\alpha}=\phi_{,\mu}{\Gamma^{\mu}}_{\alpha\beta}\;
(2.55)

Dla dowolnej pochodnej funkcji zwykłej φ i z przemienności różniczkowania cząstkowego funkcji φ (2.54), tensor Christoffela jest zapisywany wzorem poniżej, w którym widać że tensor ten jest przemienny ze względu na kolejność dolnych wskaźników:

{\Gamma^{\mu}}_{\beta\alpha}={\Gamma^{\mu}}_{\alpha\beta}\;
(2.56)

Udowodnijmy teraz inne twierdzenie, które jest zapisywane wedle schematu:

{\Gamma^k}_{ij}={{\Gamma_i}^k}_j\;
(2.57)

Obok definicji (2.24) poprawny również jest zapis:

\nabla_i e_j={{\Gamma_i}^k}_je_k\;
(2.58)

Odejmując obie strony równań (2.24) i (2.58) otrzymujemy poniższą pierwszą tożsamość, które jest zawsze równa zero, z czego wynika że nawias powinien być zawsze równy zero i dochodzimy do drugiego wniosku:

0=({{\Gamma_i}^k}_j-{\Gamma^k}_{ij})e_k\Rightarrow{{\Gamma_i}^k}_j={\Gamma^k}_{ij}\;
(2.59)

[edytuj] Uogólnienie tensora absolutnego

Weźmy tensor o dowolnych wskaźnikach dolnych i górnych, wówczas wielkość A zapisujemy jako zależność od wektorów (tensorów) eki:

A=A^{k_1,k_2,..,k_r}_{r_1,r_2,...,r_m}e_{k_1}e_{k_2}\cdot ...\cdot e_{k_r} e^{r_1}e^{r_2}\cdot ... \cdot e^{r_m}\;\;
(2.60)

Oznaczmy (k_1,k_2,..k_r)=up\;\; oraz (r_1,r_2,...,r_m)=down\;\;, wtedy (2.60) piszemy:

A=A^{up}_{down}\prod^r_{i=1} e_{k_i}\prod^m_{i=1}e^{r_i}\;
(2.61)

Szczególnymi przypadkami powyższej definicji są schematy zapisane wedle wzorów (2.33) i (2.40).

[edytuj] Pochodna kowarianta o współrzędnych kowariantnych i kontrawariantnych

Aby udowodnić wzór na pochodną tensorową na dowolną wielkość tensorową, należy skorzystać z definicji wielkości absolutnej z poprzedniego rozdziału, czyli ze wzoru z punktu (2.61), dla której różniczka zupełna wielkości absolutnej wyraża się przez:

dA=d\left[(A^{up}_{down})(\prod^r_{i=1} e_{k_i}\prod^m_{i=1}e^{r_i})\right]=\;
=d(A^{up}_{down})(\prod^r_{i=1} e_{k_i}\prod^m_{i=1}e^{r_i})+A^{up}_{down}(\sum^r_{q=1}de_q\prod^r_{i=1}e_{k_i})+A^{up}_{down}(\sum^m_{q=1}de^q\prod^m_{i=1}e^{k^i})\;
(2.62)

Teraz skorzystajmy z definicji symboli Christofela, czyli ze wzorów (2.24) i (2.25), aby dojść do wniosku, że różniczki zupełne wektorów kowariantnych i kowariantnych wyrażają się jak poniżej:

de_q={{\partial e_q}\over{\partial x^l}}dx^l=\nabla_l e_q dx^l={\Gamma^k}_{lq}e_kdx^l\;
(2.63)
de^q={{\partial e_q}\over{\partial x^l}}dx^l=\nabla_le^qdx^l=-{\Gamma^q}_{lk}e^kdx^l\;
(2.64)

A zatem wzór na różniczką wielkości A przedstawia się na podstawie wzoru (2.62) do którego podstawiamy dwie tożsamości (2.63) i (2.64), wtedy dostajemy:

dA={{\partial A^{up}_{down}}\over{\partial x^l}}dx^l(\prod^r_{i=1} e_{k_i}\prod^m_{i=1}e^{r_i})+A^{up}_{down}\sum^r_{q=0}{\Gamma^k}_{lq}dx^l\prod^r_{i=1} e_{k_i}+\sum^m_{q=1}-{\Gamma^{q}}_{lj}\prod^m_{i=1}e^{r_i}dx^l)\;
(2.65)

Jeśli wzór (2.65) podzielimy przez wielkość du, dalej grupując wyrazy w nawiasie, a poza nawiasem umieścimy pochodne wielkości xl względem wielkości u i iloczyn wszystkich wektorów kowariantnych i kontrawariantnych, otrzymamy:

{{dA}\over{du}}=\left({{\partial A^{k_1,k_2,k_3,...,k_r}_{f_q,f_2,f_3,..,f_m}}\over{\partial x^l}}+\sum^r_{q=1} A^{...,q,...}_{down}{\Gamma^{k_q}}_{lq}-\sum^m_{q=1} A^{up}_{...,q,...}{\Gamma^q}_{lf_q}\right){{dx^l}\over{du}}\prod^r_{i=1} e_{k_i}\prod^m_{i=1}e^{r_i}\;
(2.66)

A więc pochodna tensorowa wielkości A nazwijmy wyrażenie w nawiasie (2.66) względem wielkości xl, którą piszemy wedle sposobu poniżej przedstawionej ją za pomocą tensorów Christoffela:

A^{k_1,k_2,k_3,...,k_r}_{f_q,f_2,f_3,..,f_m;l}={{\partial A^{up}_{down}}\over{\partial x^l}}+\sum^r_{q=1} A^{...,q,...}_{down}{\Gamma^{k_q}}_{lq}-\sum^m_{q=1} A^{up}_{...,q,...}{\Gamma^q}_{lf_q}\;
(2.67)

Dla tensorów dwu-wskaźnikowych górnych lub górnych podamy ogólny wzór określony według wzoru (2.67), dla przykładów poniżej:

{A^{ij}}_{;l}={{\partial A^{ij}}\over{\partial x^l}}+A^{qj}{\Gamma^i}_{lq}+A^{iq}{\Gamma^j}_{lq}\;
(2.68)
A_{ij;l}={{\partial A_{ij}}\over{\partial x^l}}-A_{kj}{\Gamma^k}_{li}-A_{ik}{\Gamma^k}_{lj}\;
(2.69)

Dla tensora dwuwskaźnikowego górno-dolnego podamy ogólny wzór według wzoru (2.67), które zapisujemy:

{A^i}_{j;l}={{\partial {A^i}_j}\over{\partial x^l}}+{A^{m}}_j{\Gamma^i}_{lm}-{A^{i}}_m{\Gamma^{m}}_{lj}\;
(2.70)

[edytuj] Własności tensora metrycznego

Możemy przekształcić tensor kontrawariantny na tensor kowariantny z własności tensora metrycznego prostego, które możemy napisać:

V_{\alpha}=g_{\alpha\mu} V^{\mu}\;\;
(2.71)

Także możemy zróżniczkować tensorowo obustronnie dane równanie (2.71) wykorzystując przy okazji wzór na pochodną tensorową iloczynu wedle schematu:

V_{\alpha;\beta}=g_{\alpha\mu;\beta}V^{\mu}+g_{\alpha\mu}{V^{\mu}}_{;\beta}\;\;
(2.72)

Jeśli dodatkowo zauważymy, że powinno zachodzić z własności tensora metrycznego przy niemym wskaźniku μ, przy operacjach na wskaźnikach:

g_{\alpha\mu}{V^{\mu}}_{;\beta}=V_{\alpha;\beta}\;\;
(2.73)

Równość (2.72) do której zastosujemy tożsamość tensorową (2.73), którą zapisujemy z własności tensora metrycznego:

V_{\alpha;\beta}=g_{\alpha\mu;\beta}V^{\mu}+V_{\alpha;\beta}\;\;
(2.74)

Patrząc na wzór (2.74) i aby ona była tożsamością, to powinno na pewno zachodzić wyrażenie poniżej, czyli dowolna pochodna kowariantna tensora metrycznego podwójnie kowariantnego byłaby zapisywana według tożsamości:

g_{\alpha\mu;\beta}=0\;\;
(2.75)

[edytuj] Wyznaczanie symboli Christoffela

Ponieważ pochodna tensorowa tensora metrycznego jest równa wzorowi (2.75), to wykorzystując przy okazji wzór (2.69), możemy powiedzieć, że:

(j,r,l)->
{{\partial g_{jr}}\over{\partial x^l}}-\Gamma^k_{lj}g_{kr}-{\Gamma^k}_{lr}g_{jk}=0\;\;
(2.76)

Poprzez permutację wskaźników we wzorze (2.76) otrzymujemy dwa dalsze równania dostajemy trzy równania z powyższym, z których mamy zamiar wyznaczyć tensor Christoffela:

(r,l,j)->
{{\partial g_{rl}}\over{\partial x^j}}-{\Gamma^k}_{jr}g_{kl}-{\Gamma^k}_{jl}g_{rk}=0\;\;
(2.77)
(l,j,r)->
{{\partial g_{lj}}\over{\partial x^r}}-{\Gamma^k}_{rl}g_{kj}-{\Gamma^k}_{rj}g_{lk}=0\;\;
(2.78)

Następnie dwa pierwsze równania dodajemy do siebie, a ostatnie od otrzymanego odejmujemy i zastępując wskaźnik niemy przy symbolu Christoffer'a z k na p, dochodzimy do wniosku:

{{\partial g_{jr}}\over{\partial x^l}}+{{\partial g_{rl}}\over{\partial x^j}}-{{\partial g_{lj}}\over{\partial x^r}}-2{\Gamma^p}_{lj}g_{pr}=0\;\;
(2.79)

Dzieląc przez dwa oraz mnożąc przez gkr tożsamość otrzymaną w punkcie (2.79) przechodzimy do tożsamości:

{\Gamma^p}_{lj}g_{pr}g^{kr}={{1}\over{2}}g^{kr}\left({{\partial g_{jr}}\over{\partial x^l}}+{{\partial g_{rl}}\over{\partial x^j}}-{{\partial g_{lj}}\over{\partial x^r}}\right)\;\;
(2.80)

Po przekształceniach w punkcie (2.80) wykorzystując własności tensora metrycznego, oraz że zachodzi dla tensora metrycznego kontrawiariantno-kowariantnego (2.18), co ono jest równo delcie Kroneckera, wtedy mamy:

{\Gamma^p}_{lj}{\delta^k}_p={{1}\over{2}}g^{kr}\left({{\partial g_{jr}}\over{\partial x^l}}+{{\partial g_{rl}}\over{\partial x^j}}-{{\partial g_{lj}}\over{\partial x^r}}\right)\Rightarrow{\Gamma^k}_{lj}={{1}\over{2}}g^{kr}\left({{\partial g_{jr}}\over{\partial x^l}}+{{\partial g_{rl}}\over{\partial x^j}}-{{\partial g_{lj}}\over{\partial x^r}}\right)\;\;
(2.81)

Końcowy wynik zapisany w punkcie (2.81) jest zależny od pierwszych pochodnych cząstkowych tensora metrycznego, a także zależy od tensora metrycznego podwójnie kontrawariantnego tego samego tensora co wcześniej. Dlatego piszemy go wedle sposobności:

{\Gamma^k}_{lj}={{1}\over{2}}g^{kr}\left(g_{jr,l}+g_{rl,j}-g_{lj,r}\right)\;
(2.82)

[edytuj] Tensor Riemanna-Christoffela dla tensorów kontrawariantnych

Teraz udowodnimy, że pochodne mieszane w przestrzeni nieuklidesowej nie są sobie równe, tzn. poniższe wyrażenie nie powinno być równe zero, nie tak jak przy pochodnych cząstkowych, które nie zależą od kolejności różniczkowania:

{a^k}_{;l;n}-{a^k}_{;n;l}\;
(2.83)

Ale wiadomo, że pochodna kowariantna, która jest zapisana wedle schematu (2.39), to możemy również zapisać przy innych oznaczeniach podobnie, ale oznaczające to samo:

{a^k}_{;l}={{\partial a^k}\over{\partial x^l}}+a^m{\Gamma^k}_{lm}\;
(2.84)

Wykorzystując tożsamość na pochodną tensorową (2.84), to wyrażenie (2.83) możemy zapisać poniżej korzystając z pierwszego wspomnianego wzoru na różnicę pochodnych kowariantnych tensorowych wielkości tensora kontrawariantnego:

{a^k}_{;l;n}-{a^k}_{;n;l}=({a^k}_{;l})_{;n}-({a^k}_{;n})_{;l}=({{\partial a^k}\over{\partial x^l}}+a^m{\Gamma^k}_{lm})_{;n}-({{\partial a^k}\over{\partial x^n}}+a^m{\Gamma^k}_{nm})_{;l}=\;

=\left[({{\partial a^k}\over{\partial x^l}}+a^m{\Gamma^k}_{lm})_{,n}+({{\partial a^r}\over{\partial x^l}}+a^m{\Gamma^r}_{lm}){\Gamma^k}_{nr}-({{\partial a^k}\over{\partial x^s}}+a^m{\Gamma^k}_{sm}){\Gamma^s}_{ln}\right]+\;
-\left[({{\partial a^k}\over{\partial x^n}}+a^m{\Gamma^k}_{nm})_{,l}+({{\partial a^r}\over{\partial x^n}}+a^m{\Gamma^r}_{nm}){\Gamma^k}_{lr}-({{\partial a^k}\over{\partial x^s}}+a^m{\Gamma^k}_{sm}){\Gamma^s}_{ln}\right]=\;
=(a^k_{,l,n}-a^k_{,n,l})+a^m({\Gamma^r}_{lm}{\Gamma^k}_{nr}-{\Gamma^r}_{nm}{\Gamma^k}_{lr})+a^m({{\partial {\Gamma^k}_{lm}}\over{\partial x^n}}-{{\partial {\Gamma^k}_{nm}}\over{\partial x^l}})\;

=a^m\left({{\partial {\Gamma^k}_{lm}}\over{\partial x^n}}-{{\partial {\Gamma^k}_{nm}}\over{\partial x^l}}+{\Gamma^r}_{lm}{\Gamma^k}_{nr}-{\Gamma^r}_{nm}{\Gamma^k}_{lr}\right)\;
(2.85)

Wyrażenie (2.83) wedle obliczeń (2.85) zapisujemy wedle wzoru poniżej wstawiając definicję czterowskaźnikowego tensora krzywizny:

{a^k}_{;l;n}-{a^k}_{;n;l}={R^k}_{mnl}a^m\;
(2.86)
  • gdzie definicja czterowskaźnikowego tensora metrycznego jest zapisana przy pomocy tensorów Christoffela:
{R^k}_{mnl}={{\partial {\Gamma^k}_{lm}}\over{\partial x^n}}-{{\partial {\Gamma^k}_{nm}}\over{\partial x^l}}+{\Gamma^r}_{lm}{\Gamma^k}_{nr}-{\Gamma^r}_{nm}{\Gamma^k}_{lr}\;
(2.87)

[edytuj] Tensor Riemanna-Christoffela dla tensorów kowariantnych

Teraz udowodnimy, że pochodne mieszane w przestrzeni nieuklidesowej nie są sobie równe, tzn. poniższe wyrażenie nie powinno być równe zero, nie tak jak przy pochodnych cząstkowych, które nie zależą od kolejności różniczkowania:

a_{k;l;n}-a_{k;n;l}\;\;
(2.88)

Ale wiadomo, że pochodna kowariantna, która jest zapisana wedle schematu (2.45), może zostać zapisać podobnie z użyciem innych oznaczeń, ale oznaczających to samo:

a_{k;l}= {{\partial a_k}\over{\partial x^l}}-a_j{\Gamma^j}_{lk}\;
(2.89)

Wykorzystując tożsamość na pochodną tensorową (2.89), to wyrażenie (2.88) możemy zapisać poniżej jako różnicę pochodnych kowariantnych wspomnianego wzoru:

a_{k;l;n}-a_{k;n;l}=\left({{\partial a_k}\over{\partial x^l}}-a_m{\Gamma^m}_{lk}\right)_{;n}
-\left({{\partial a_k}\over{\partial x^n}}-a_m{\Gamma^m}_{nk}\right)_{;l}=\;

=\left[\left( {{\partial a_k}\over{\partial x^l}}-a_m{\Gamma^m}_{lk}\right)_{,n}-\left( {{\partial a_r}\over{\partial x^l}}-a_m{\Gamma^m}_{lr}  \right){\Gamma^r}_{nk}-({{\partial a_k}\over{\partial x^s}}+a_m{\Gamma^m}_{sk}){\Gamma^s}_{ln}\right]+\;
-\left[\left(   {{\partial a_k}\over{\partial x^n}}-a_m{\Gamma^m}_{nk}\right)_{,l}- \left({{\partial a_r}\over{\partial x^n}}-a_m{\Gamma^m}_{nr}\right){\Gamma^r}_{lk}-({{\partial a_k}\over{\partial x^s}}-a_m{\Gamma^m}_{sk}){\Gamma^s}_{ln}\right]=\;

=(a_{k,l,n}-a_{k,n,l})+a_m\left({{\partial {\Gamma^m}_{nk}}\over{\partial x^l}}-{{\partial {\Gamma^m}_{lk}}\over{\partial x^n}}\right)+a_m\left({\Gamma^m}_{lr}{\Gamma^r}_{nk}-{\Gamma^m}_{nr}{\Gamma^r}_{lk}\right)\;
(2.90)

Wyrażenie (2.88) wedle obliczeń (2.90) zapisujemy wedle wzoru poniżej, wstawiając definicję czterowskaźnikowego tensora krzywizny:

a_{k;l;n}-a_{k;n;l}=-{{R^{m}}}_{knl}a_m\;\;
(2.91)
  • gdzie definicja czterowskaźnikowego tensora metrycznego jest zapisana przy pomocy tensorów Christoffela, które zapisujemy:
{{R^{m}}}_{kln}={{\partial {\Gamma^m}_{nk}}\over{\partial x^l}}-{{\partial {\Gamma^m}_{lk}}\over{\partial x^n}}+{\Gamma^m}_{lr}{\Gamma^r}_{nk}-{\Gamma^m}_{nr}{\Gamma^r}_{lk}=-{R^m}_{knl}\;
(2.92)

[edytuj] Tensor Riemanna-Christoffela (tensor krzywizny) zdefiniowany przy pomocy tensorów metrycznych

Do wzoru na czterowskaźnikowy tensor metryczny (2.87) wstawiamy za tensory Christoffela zdefiniowane wedle wzoru (2.82), w końcu otrzymujemy następujący wzór zależny tylko od drugich pochodnych cząstkowych tensora metrycznego, co wykażemy później:

{R^k}_{mnl}={{1}\over{2}}g^{kr}\left(g_{mr,l,n}+g_{rl,m,n}-g_{lm,r,n}-g_{mr,n,l}-g_{rn,m,l}+g_{nm,r,l}\right)+\;
+{{1}\over{2}}{g^{kr}}_{,n}\left(g_{mr,l}+g_{rl,m}-g_{lm,r}\right)-{{1}\over{2}}{g^{kr}}_{,l}\left(g_{mr,n}+g_{rn,m}-g_{nm,r}\right)+{\Gamma^r}_{lm}{\Gamma^k}_{nr}-{\Gamma^r}_{nm}{\Gamma^k}_{lr}\;\;
(2.93)

Ponieważ pochodna tensorowa tensora metrycznego jest równa zero według schematu (2.75), to wyznaczając z niego pochodną cząstkową stojącą po lewej stronie tensora metrycznego, a pozostałe po prawej jego stronie, otrzymujemy wielkość:

0={g^{kr}}_{;n}={g^{kr}}_{,n}+{\Gamma^k}_{ns}g^{sr}+{\Gamma^r}_{ns}g^{sk}\Rightarrow{g^{kr}}_{,n}=-{\Gamma^k}_{ns}g^{sr}-{\Gamma^r}_{ns}g^{sk}\;
(2.94)

Czterowskaźnikowy tensor krzwywizny (2.93). po zastosowaniu do niego tożsamości wynikowej (2.94), możemy zapisać:

{R^k}_{mnl}={{1}\over{2}}g^{kr}\left(g_{rl,m,n}-g_{lm,r,n}-g_{rn,m,l}+g_{nm,r,l}\right)+\;

-{{1}\over{2}}\left({\Gamma^k}_{ns}g^{sr}+{\Gamma^r}_{ns}g^{sk}\right)\left(g_{mr,l}+g_{rl,m}-g_{lm,r}\right)+
{{1}\over{2}}\left({\Gamma^k}_{ls}g^{sr}+{\Gamma^r}_{ls}g^{sk}\right)\left(g_{mr,n}+g_{rn,m}-g_{nm,r}\right)+\;
+{\Gamma^r}_{lm}{\Gamma^k}_{nr}-{\Gamma^r}_{nm}{\Gamma^k}_{lr}\;\;
{R^k}_{mnl}={{1}\over{2}}g^{kr}\left(g_{rl,m,n}-g_{lm,r,n}-g_{rn,m,l}+g_{nm,r,l}\right)-{{1}\over{2}}{\Gamma^k}_{ns}{\Gamma^s}_{lm}+{{1}\over{2}}{\Gamma^k}_{ls}{\Gamma^s}_{nm}+\;

+{\Gamma^r}_{lm}{\Gamma^k}_{nr}-{\Gamma^r}_{nm}{\Gamma^k}_{lr}-{{1}\over{2}}{\Gamma^r}_{ns}g^{sk}{\Gamma^p}_{lm}g_{pr}+
{{1}\over{2}}{\Gamma^r}_{ls}g^{sk}{\Gamma^p}_{nm}g_{rp}\;
(2.95)

Następnie wyznaczmy wyrażenie tensorowe, które występuje według wzoru (9.25), korzystając przy tym z właściwości tensora metrycznego:

{\Gamma^r}_{ns}g^{sk}{\Gamma^p}_{lm}g_{pr}={\Gamma_{pn}}^k{\Gamma^p}_{lm}=
{{\Gamma_p}^k}_n{\Gamma^p}_{lm}={\Gamma^k}_{np}{\Gamma^p}_{lm}\;
(2.96)

Dalej wyznaczmy wyrażenie tensorowe, które występuje (9.25), korzystając przy tym z właściwości tensora metrycznego:

{\Gamma^r}_{ls}g^{sk}{\Gamma^p}_{nm}g_{rp}={\Gamma_{pl}}^k{\Gamma^p}_{nm}={\Gamma^k}_{pl}{\Gamma^p}_{nm}\;
(2.97)

Mając wzór (2.95), a także tożsamości (2.96) i (2.97), wspomniany czterowskaźnikowy tensor krzywizny możemy zapisać:

{R^k}_{mnl}={{1}\over{2}}g^{kr}\left(g_{rl,m,n}-g_{lm,r,n}-g_{rn,m,l}+g_{nm,r,l}\right)+
{{1}\over{2}}{\Gamma^r}_{lm}{\Gamma^k}_{nr}-{{1}\over{2}}{\Gamma^r}_{nm}{\Gamma^k}_{lr}+\;
-{{1}\over{2}}{\Gamma^k}_{np}{\Gamma^p}_{lm}+{{1}\over{2}}{\Gamma^k}_{pl}{\Gamma^p}_{nm}\;
(2.98)

Przepisując jeszcze raz końcowy wynik (2.98), wtedy czterowskaźnikowy tensor krzywizny z tylko pierwszym wskaźnikiem górnym zapisujemy wedle schematu:

{R^k}_{mnl}={{1}\over{2}}g^{kr}\left(g_{rl,m,n}-g_{lm,r,n}-g_{rn,m,l}+g_{nm,r,l}\right)\;
(2.99)

Inny równoważny do (2.99) czterowskaźnikowy tensor krzywizny, z wykorzystaniem własności tensora metrycznego, otrzymujemy w postaci:

R_{imnl}=g_{ik}{R^k}_{mnl}=g_{ik}{{1}\over{2}}g^{kr}\left(g_{rl,m,n}-g_{lm,r,n}-g_{rn,m,l}+g_{nm,r,l}\right)\;
(2.100)

Czterowskaźnikowy tensor krzywizny o wszystkich wskaźnikach dolnych na podstawie obliczeń (2.100) piszemy natomiast wedle wyobrażeń:

R_{imnl}={{1}\over{2}}\left(g_{il,m,n}-g_{lm,i,n}-g_{in,m,l}+g_{nm,i,l}\right)\;
(2.101)

[edytuj] Tensorowy charakter tensora krzywizny

Z definicji pochodnej tensorowej (2.67) możemy napisać pochodne tensorowe tensora Christoffela w takiej postaci:

{\Gamma^k}_{lm;n}={\Gamma^k}_{lm,n}+{\Gamma^k}_{sn}{\Gamma^s}_{lm}-
{\Gamma^s}_{ln}{\Gamma^{k}}_{sm}-{\Gamma^s}_{mn}{\Gamma^k}_{sl}\;
(2.102)

Tożsamość (2.102) wstawiamy do wzoru (2.86) na tensor czterowskaźnikowy krzywizny i otrzymujemy równość, którą zapisujemy wedle schematu:

{R^k}_{mnl}={\Gamma^k}_{lm;n}-{\Gamma^k}_{sn}{\Gamma^s}_{lm}+{\Gamma^s}_{ln}{\Gamma^k}_{sm}+{\Gamma^s}_{mn}{\Gamma^k}_{sl}-
{\Gamma^k}_{mn;l}+{\Gamma^k}_{sl}{\Gamma^s}_{mn}-{\Gamma^s}_{ml}{\Gamma^k}_{ns}-{\Gamma^s}_{nl}{\Gamma^k}_{sm}+\;
+{\Gamma^r}_{lm}{\Gamma^k}_{nr}-{\Gamma^r}_{nm}{\Gamma^k}_{lr}\;
(2.103)

Jak udowodniliśmy czterowskaźnikowy tensor krzywizny (2.103) jest zwykłym tensorem, ponieważ występują w nim same tensory, ale w nich nie ma pochodnych cząstkowych, co pierwotnie ten sam tensor zawierał w zdefiniowany w punkcie (2.92). Można więc na podstawie wspomnianych tychże obliczeń powiedzieć, iż:

{R^k}_{mnl}={\Gamma^k}_{lm;n}-{\Gamma^k}_{mn;l}+{\Gamma^r}_{nm}{\Gamma^k}_{lr}-{\Gamma^r}_{lm}{\Gamma^k}_{nr}\;
(2.104)

[edytuj] Właściwości tensora krzywizny

Ze względu na przestawienie wskaźników w pierwszej parze wskaźników czterowskaźnikowego tensora krzywizny (2.101), dochodzimy do wniosku, że takie przestawienie powoduje, że on jest antysymetryczny w takim działaniu:

R_{imnl}={{1}\over{2}}\left(g_{il,mn}-g_{lm,in}-g_{in,ml}+g_{nm,il}\right)=
-{{1}\over{2}}\left(g_{ml,in}-g_{lm,mn}-g_{mn,il}+g_{ni,ml}\right)=-R_{minl}\;\;
(2.105)

Ze względu na przestawienie wskaźników w drugiej parze wskaźników czterowskaźnikowego tensora krzywizny (2.101), dochodzimy do wniosku, że takie przestawienie powoduje, że on jest antysymetryczny takim działaniu:

R_{imnl}={{1}\over{2}}\left(g_{il,mn}-g_{lm,in}-g_{in,ml}+g_{nm,il}\right)=
-{{1}\over{2}}\left(g_{in,ml}-g_{nm,il}-g_{il,mn}+g_{lm,in}\right)=-R_{imln}\;\;
(2.106)

Zaś ze względu na przestawienie pierwszej pary wskaźników z drugą parą wskaźników czterowskaźnikowego tensora krzywizny (2.101), dochodzimy do wniosku, że takie przestawienie powoduje symetryczność takiego działania:

R_{imnl}={{1}\over{2}}\left(g_{il,mn}-g_{lm,in}-g_{in,ml}+g_{nm,il}\right)=
{{1}\over{2}}\left(g_{nm,li}-g_{ml,ni}-g_{ni,lm}+g_{il,lm}\right)=R_{nlim}\;\;
(2.107)

Stwierdziliśmy, że na podstawie obliczeń (2.105) przy przestawianiu pierwszej pary wskaźników, (2.106) przy przedstawianiu drugiej pary wskaźników i ostatecznie (2.107) przy przedstawieniu pierwszej pary wskaźników z drugą parą otrzymujemy, co następuje:

R_{imnl}=-R_{minl}=-R_{imln}=R_{nlim}\;\;
(2.108)

Przejdźmy teraz do następnej tożsamości, korzystając ze wzoru (2.101). Dochodzimy zatem do wniosku, że ta tożsamość jest równa zero, na co dowód przeprowadzamy poniżej:

R_{imnl}+R_{ilmn}+R_{inlm}={{1}\over{2}}\left(g_{il,mn}-g_{lm,in}-g_{in,ml}+g_{nm,il}\right)+\;\;
+{{1}\over{2}}\left(g_{in,lm}-g_{nl,im}-g_{im,ln}+g_{ml,in}\right)+{{1}\over{2}}\left(g_{im,nl}-g_{mn,il}-g_{il,nm}+g_{ln,im}\right)=0\;\;
(2.109)

Na podstawie obliczeń wykonanych w punkcie (2.109) przepisując jeszcze raz wynik końcowy, co do czego doszliśmy:

R_{imnl}+R_{ilmn}+R_{inlm}=0\;\;
(2.110)

[edytuj] Tożsamość Bianchiego

Pochodna zwykła cząstkowa tensora krzywizny zdefiniowanego w punkcie (2.101) przyjmuje takową postać w wyglądzie tensorowym:

R_{imnl,p}={{1}\over{2}}\left(g_{il,mnp}-g_{lm,inp}-g_{in,mlp}+g_{nm,ilp}\right)\;\;
(2.111)

Policzmy teraz tożsamość poniżej korzystając przy tym z definicji pochodnej cząstkowej czterowskaźnikowego tensora krzywizny, który jest napisana wzorem (2.111).

R_{imnl,p}+R_{impn,l}+R_{imlp,n}=
{{1}\over{2}}\left(g_{il,mnp}-g_{lm,inp}-g_{in,mlp}+g_{nm,ilp}\right)+\;\;
+{{1}\over{2}}\left(g_{in,mpl}-g_{nm,ipl}-g_{ip,mnl}+g_{pm,inl}\right)+
{{1}\over{2}}\left(g_{ip,mln}-g_{pm,iln}-g_{il,mpn}+g_{lm,ipn}\right)=0\;\;
(2.112)

Powyższą tożsamość jest spełniona, ponieważ różniczkowanie jest przemienne i przepisując nasz wniosek w postaci twierdzenia o tensorach, udowadniamy:

R_{imnl,p}+R_{impn,l}+R_{imlp,n}=0\;\;
(2.113)

Zdefiniujmy nowy dwuwskaźnikowy tensor, który jest kombinacją czterowskaźnikowego tensora krzywizny i tensora metrycznego w postaci:

K_{nl}=g^{im}R_{imnl}\;\;
(2.114)

Można udowodnić, że zachodzi na pewno tożsamość podana poniżej; polegająca na tym, że tensor (2.114) jest tensorem antysymetrycznym, tzn. przy zmianie wskaźników miejscami przed tensorem pojawia się znak minus:

K_{nl}=-K_{ln}\;\;.
(2.115)

A dowód (2.115) przeprowadzamy wykorzystując definicję pewnego tensora zdefiniowanego w punkcie (2.114) i korzystając przy tym z własności (2.106), dochodzimy do wniosku:

K_{nl}=g^{im}R_{imnl}=g^{im}(-R_{imln})=-g^{im}R_{imln}=-K_{ln}\;\;
(2.116)

Udowodniliśmy, że tensor Knl (2.114), jest tensorem antysymetrycznym, tak jak powiedziane zostało wcześniej z własności tensora czterowskaźnikowego krzywizny.

Pochodna tensorowa tensora Knl zapisanego w punkcie (2.114), przedstawia się wzorem wedle schematu:

K_{nl;p}=K_{nl,p}-{\Gamma^k}_{np}K_{kl}-{\Gamma^k}_{lp}K_{nk}\;\;
(2.117)

Następnym naszym krokiem jest policzenie wyrażenia poniżej z wykorzystaniem przy tym tożsamości (2.117). Dzięki temu wiemy, że;

K_{nl;p}+K_{pn;l}+K_{lp;n}=K_{nl,p}-{\Gamma^k}_{np}K_{kl}-{\Gamma^k}_{lp}K_{nk}+K_{pn,l}-{\Gamma^k}_{pl}K_{kn}-{\Gamma^k}_{nl}K_{pk}+\;\;

+K_{lp,n}-{\Gamma^k}_{ln}K_{kp}-{\Gamma^k}_{pn}K_{lk}=K_{nl,p}+K_{pn,l}+K_{lp,n}-{\Gamma^k}_{lp}(K_{nk}+K_{kn})-{\Gamma^k}_{np}(K_{kl}+K_{lk})+\;\;

-{\Gamma^k}_{ln}(K_{kp}+K_{pk})=K_{nl,p}+K_{pn,l}+K_{lp,n}\;\;
(2.118)

Udowodniliśmy, że na podstawie obliczeń (2.118) zachodzi tożsamość, którą udowodniliśmy we wspomnianych obliczeniach:

K_{nl;p}+K_{pn;l}+K_{lp;n}=K_{nl,p}+K_{pn,l}+K_{lp,n}\;\;
(2.119)

Teraz skorzystamy z definicji Knl (2.114) i z własności, że pochodna tensorowa tensora metrycznego jest równa zero wedle punktu (2.75), a wtedy lewa strona (2.119) jest zapisana wzorem:

L=K_{nl;p}+K_{pn;l}+K_{lp;n}=(R_{imnl}g^{im})_{;p}+(R_{impn}g^{im})_{;l}+(R_{imlp}g^{im})_{;n}=\;
=g^{im}(R_{imnl;p}+R_{impn;l}+R_{imlp;n})\;\;
(2.120)

A także prawą stronę równości (2.119) zapisujemy:

P=K_{nl,p}+K_{pn,l}+K_{lp,n}=(R_{imnl}g^{im})_{,p}+(R_{impn}g^{im})_{,l}+(R_{imlp}g^{im})_{,n}\;\;
(2.121)

Dochodzimy do wniosku, że jeśli L=P\;, czyli wyrażenia (2.120) i (2.121) są sobie równe, bo punkt (2.119), mamy:

g^{im}(R_{imnl;p}+R_{impn;l}+R_{imlp;n})=(R_{imnl}g^{im})_{,p}+(R_{impn}g^{im})_{,l}+(R_{imlp}g^{im})_{,n}\;\;
(2.122)

Można udowodnić, że na pewno zachodzi własność powiedziana poniżej, bo tensor czterowskaźnikowy krzywizny (2.101) nie zawiera w swojej definicji podwójnie kontrawariantnych tensorów metrycznych. Inaczej mówiąc tensor krzywizny zależy tylko od drugich pochodnych tensora metrycznego, a nie od samego tensora krzywizny, co przedstawiamy jako:

{{\partial R_{imnl}}\over{\partial g^{im}}}=0\;\;
(2.123)

Z wiadomości pochodzących z analizy matematycznej możemy napisać tożsamość matematyczną, która będzie przydatna do dalszych obliczeń w celu maksymalnego uproszczenia tożsamości (2.122):

{{\partial (R_{imnl}g^{im})_{,p}}\over{\partial g^{ij}}}=\left({{\partial (R_{imnl}g^{im})}\over{\partial g^{im}}}\right)_{,p}=R_{imnl,p}\;
(2.124)

Zróżniczkujmy obie strony równania tensorowego (2.122) względem gim, wtedy otrzymujemy wniosek:

R_{imnl;p}+R_{impn;l}+R_{imlp;n}=R_{imnl,p}+R_{impn,l}+R_{imlp,n}\;\;
(2.125)

Wcześniej udowodniliśmy, że zachodzi tożsamość (2.113). Zatem tożsamość Bianchiego po zastosowaniu wspomnianej tożsamości do (2.125) pozwala na wyciągnięcie końcowego wniosku:

R_{imnl;p}+R_{impn;l}+R_{imlp;n}=0\;\;
(2.126)

[edytuj] Tensor Ricciego

Definicja tensora Ricciego poprzez czterowskaźnikowy tensor krzywizny o pierwszym wskaźniku górnym (2.87) piszemy wedle schematu:

R_{ml}={R^k}_{mkl}=R_{lm}\;
(2.127)

Powyższe skrajne równości są sobie równe w (2.127). Na tej podstawie możemy udowodnić, korzystając z czterowskaźnikowego tensora krzywizny (2.101):

R_{ml}={R^k}_{mkl}=
{{1}\over{2}}g^{kr}\left(g_{rl,mk}-g_{lm,rk}-g_{rk,ml}+g_{km,rl}\right)=\;
={{1}\over{2}}g^{kr}\left(g_{km,rl}-g_{rk,ml}-g_{lm,rk}+g_{rl,mk}\right)=R_{lm}\;
(2.128)

Co kończy dowód.

Tensor Ricciego (2.127) zdefiniowany poprzez czterowskaźnikowy tensor krzywizny, w której sumowanie następuje po dwóch wskaźnikach niemych, tzn. pierwszym i trzecim, pozwala na narysowanie definicji tego tensora:

R_{ln}=g^{km}R_{klmn}={R^m}_{lmn}\;
(2.129)

A skalar Ricciego można zdefiniować poprzez tensor Ricciego (2.129) wedle sposobu podanego poniżej lub inaczej wyrażając w tym samym wzorze tensor Ricciego poprzez czterowskaźnikowy tensor krzywizny:

R=g^{ln}R_{ln}=g^{ln}g^{km}R_{klmn}\;
(2.130)

[edytuj] Układ współrzędnych

Omówimy tutaj trzy rodzaje układów współrzędnych, tzn. układ kartezjański, cylindryczny i sferyczny.

[edytuj] Układ kartezjański

Dwuwymiarowy układ współrzędnych kartezjańskich

Układem współrzędnych kartezjańskich, nazywamy taki układ współrzędnych, w których zadany jest punkt zwany początkiem układu współrzędnych. W punkcie tym wszystkie wspòłrzędne są równe zero.

[edytuj] Współrzędne

W układzie współrzędnych kartezjańskich trzy pierwsze osie, nazywamy:

  • oś x: odcięta
  • oś y: rzędna
  • oś z: kota

Prostokatny układ współrzędny jest to układ, której współrzędne danego punktu powstają poprzez prostokatny rzut jego na poszczególne osie układu.

[edytuj] Podział płaszczyzny

resize

Kartezjański układ współrzędnych (x,y) w dwóch wymiarach dzieli płaszczyznę na cztery części tzw. ćwiartki:

  • I ćwiartka\left\{(x,\; y): x>0, \; y>0\right\},
  • II ćwiartka\left\{(x,\; y): x<0, \; y>0\right\},
  • III ćwiartka\left\{(x,\; y): x<0, \; y<0\right\},
  • IV ćwiartka\left\{(x,\; y): x>0, \; y<0\right\}.

[edytuj] Skrętność trójwymiarowego układu współrzędnych

Każdy układ kartezjański w przestrzeni trójwymiarowej może być lewoskrętny lub prawoskrętny. Według reguły prawej dłoni, jeśli obracamy prawą dłoń od OX do OY, to taki układ nazywamy prawoskrętny.

[edytuj] Układ cylindryczny

Walcowy układ współrzędnych

Walcowym (cylindrycznym) układem współrzędnych jest to układ współrzędnych w trójwymiarowym układzie współrzędnych. Każdy punkt w przestrzeni zapisuje się za pomocą trójki współrzędnych(\rho,\phi,z)\;, gdzie poszczególne współrzędne wyrażają się w postaci:

\rho: jest to odległość układ współrzędnych od jego początku.
\phi jest to kąt rzutu jaki tworzy rzut wektora wodzącego z osią OX.
z jest to odległość rzutu punktu na oś OZ od początku układu współrzędnych.

[edytuj] Przejście do układu współrzędnych kartezjańskiego

Wzory transformujące współrzędne kuliste φ i ρ i z' w układzie współrzędnych kartezjańskich walcowatych przedstawiamy wedle sposobu:

x=\rho\cos\phi\;
(3.1)
y=\rho\sin\phi\;
(3.2)
z=z'\;
(3.3)

[edytuj] Jakobian przejścia

Wyznaczmy Jakobian przejścia z układu o współrzędnych kartezjańkich do walcowatych:

{{D(x,y,z)}\over{D(\rho,\phi,z')}}=\begin{vmatrix}
{{\partial x}\over{\partial \rho}}&{{\partial x}\over{\partial \phi}}&{{\partial x}\over{\partial \phi}}\\
{{\partial y}\over{\partial \rho}}&{{\partial y}\over{\partial \phi}}&{{\partial y}\over{\partial \phi}}\\
{{\partial z}\over{\partial \rho}}&{{\partial z}\over{\partial \phi}}&{{\partial z}\over{\partial \phi}}
\end{vmatrix}=\begin{vmatrix}
\cos\phi&-\rho\sin\phi&0\\
\sin\phi&\rho\cos\phi&0\\
0&0&1
\end{vmatrix}=\begin{vmatrix}
\cos\phi&-\rho\sin\phi\\
\sin\phi&\rho\cos\phi
\end{vmatrix}=
=\rho\cos^2\phi+\rho\sin^2\phi=\rho(\cos^2\phi+\sin^2\phi)=\rho\;
(3.4)

Przepiszmy końcowy wynik (3.4), który właśnie wyznaczyliśmy:


{{D(x,y,z)}\over{D(\rho,\phi,z')}}=\begin{vmatrix}
{{\partial x}\over{\partial \rho}}&{{\partial x}\over{\partial \phi}}&{{\partial x}\over{\partial z}}\\
{{\partial y}\over{\partial \rho}}&{{\partial y}\over{\partial \phi}}&{{\partial y}\over{\partial z}}\\
{{\partial z}\over{\partial \rho}}&{{\partial z}\over{\partial \phi}}&{{\partial z}\over{\partial z'}}
\end{vmatrix}=\rho
(3.5)

[edytuj] Układ sferyczny

Wspólrzędne punktu w "matematycznym" systemie współrzędnych sferycznych

Dowolnemu punktowi można przepisać trójkę współrzędnych(\rho,\theta,\phi)

  • \rho-promień wodzący, gdzie \rho\geq 0
  • \theta długość azymutalna ,gdzie 0\leq \theta\leq 2\pi
  • \phi-odległość zenitalna, gdzie 0\leq \phi\le\pi

[edytuj] Przejście do układu współrzędnych kartezjańskich trójwymiarowej

Wzory transformujące współrzędne kuliste ρ i θ i φ w układzie współrzędnych kartezjańskich sferycznych do współrzędnych kartezjańskich przedstawiamy:

x=\rho\sin\phi\cos\theta\;
(3.6)
y=\rho\sin\phi\sin\theta\;
(3.7)
z=\rho\cos\phi\;
(3.8)

[edytuj] Jakobian przejścia

Wyznaczmy Jakobian przejścia z układu o współrzędnych kartezjańkich do sferycznych według:

{{D(x,y,z)}\over{D(\rho,\phi,\theta)}}=\begin{vmatrix}
{{\partial x}\over{\partial \rho}}&{{\partial x}\over{\partial \phi}}&{{\partial x}\over{\partial \theta}}\\
{{\partial y}\over{\partial \rho}}&{{\partial y}\over{\partial \phi}}&{{\partial y}\over{\partial \theta}}\\
{{\partial z}\over{\partial \rho}}&{{\partial z}\over{\partial \phi}}&{{\partial z}\over{\partial \theta}}
\end{vmatrix}=\begin{vmatrix}
\sin\phi\cos\theta&\rho\cos\phi\cos\theta&-\rho\sin\phi\sin\theta\\
\sin\phi\sin\theta&\rho\cos\phi\sin\theta&\rho\sin\phi\cos\theta\\
\cos\phi&-\rho\sin\phi&0
\end{vmatrix}=

=\cos\phi\begin{vmatrix}
\rho\cos\phi\cos\theta&-\rho\sin\phi\sin\theta\\
\rho\cos\phi\sin\theta&\rho\sin\phi\cos\theta
\end{vmatrix}+\rho\sin\phi\begin{vmatrix}
\sin\phi\cos\theta&-\rho\sin\phi\sin\theta\\
\sin\phi\sin\theta&\rho\sin\phi\cos\theta
\end{vmatrix}=

=\rho^2\cos\phi(\cos^2\theta\sin\phi\cos\phi+\sin\phi\cos\phi\sin^2\theta)+\rho^2\sin\phi(\sin^2\phi\cos^2\phi+\rho\sin^2\phi\sin^2\theta)=
\;

=\rho^2\cos\phi\sin\phi\cos\phi+\rho\sin\phi\sin\phi^2=\rho^2\sin\phi(\cos^2\phi+\sin^2
\phi)=\rho^2\sin\phi
\;
(3.9)

Przepiszmy końcowy wynik (3.9), który właśnie wyznaczyliśmy:

{{D(x,y,z)}\over{D(\rho,\phi,\theta)}}=\rho^2\sin\phi
(3.10)

[edytuj] Obrót układu współrzędnych

Zajmować się będziemy obrotem punktu wokół początku układu współrzędnych, a także obrotem układu współrzędnego płaskiego o ściśle określony kąt, a także obrotem układu współrzędnych w przestrzeni trójwymiarowej o ściśle określone kąty Eulera.

[edytuj] Obrót punktu wokół osi z

Spróbujmy napisać transformacje obrotu punktu (x,y) dla przestrzeni dwuwymiarowej przy obrocie odwrotnym niż ruch wskazówek zegara o kąt α do punktu (x',y'), wiedząc że transformacje współrzędnych z układu cylindrycznego na kartezjański można napisać w postaci wzorów x=rcosα i y=rcosφ:

x'=r\cos(\alpha+\phi)=r\cos\alpha\cos\phi-r\sin\alpha\sin\phi=x\cos\phi-y\sin\phi\;
(4.1)
y'=r\sin(\alpha+\phi)=r\sin\alpha\cos\phi+r\cos\alpha\sin\phi=x\sin\phi+y\cos\phi\;
(4.2)

Otrzymujemy w ten sposób dwa równania przedstawiające obrót wokół osi z o kąt φ mając stare współrzędne kartezjańskie "x" i "y" w płaskim układzie współrzędnych:

  • Obrót dwuwymiarowy punktu, wokół osi z:
x'=x\cos\phi-y\sin\phi\;
(4.3)
y'=x\sin\phi+y\cos\phi\;
(4.4)

Macierzowo, macierz obrotu punktu w układzie kartezjańskim wokół osi z o kąt φ piszemy na podstawie wzorów (4.3) i (4.4) według:

M=\begin{bmatrix}
\cos\phi&-\sin\phi\\
\sin\phi&\cos\phi
\end{bmatrix}
(4.5)

Ogólnie macierzowo związek (4.3) i (4.4) piszemy ogólnie przy definicji macierzy obrotu (4.5) wedle schematu:

X'=MX\;
(4.6)

Po podstawieniu za M określone wzorem (4.5) do (4.6) możemy macierzowo opisać transformacje obrotu punktu (x,y) wokół punktu (0,0) wedle wzoru określonego poniżej.

Twierdzenie
Pełny zapis transformacji wraz z macierzą obrotu punktu w przestrzeni dwuwymiarowej dla transformacji prostej:
\begin{bmatrix}x'\\y'\end{bmatrix}=\begin{bmatrix}
\cos\phi&-\sin\phi\\
\sin\phi&\cos\phi
\end{bmatrix}\begin{bmatrix}x\\y\end{bmatrix}
(4.7)

Twierdzenie
Pełny zapis transformacji wraz z macierzą obrotu punktu w przestrzeni dwuwymiarowej dla transformacji odwrotnej:
\begin{bmatrix}x\\y\end{bmatrix}=\begin{bmatrix}
\cos\phi&\sin\phi\\
-\sin\phi&\cos\phi
\end{bmatrix}\begin{bmatrix}x'\\y'\end{bmatrix}
(4.8)

[edytuj] Obrót układu współrzędnych wokół osi z

Z poprzedniego rozdziału wiemy, że macierz transformacji określająca obrót punktu wokół początku układu współrzędnej jest napisana wzorem (4.7). Teraz niech punkt pozostaje w spoczynku, a układ współrzędnych porusza się odwrotnie ze wskazówkami współrzędnych, wtedy w macierzy transformacji trzeba zastąpić według podstawienia _{\alpha\rightarrow-\alpha}\;, stąd:

M=\begin{bmatrix}
\cos\phi&\sin\phi\\
-\sin\phi&\cos\phi
\end{bmatrix}
(4.9)

Zaś sama transformacja wygląda :

Twierdzenie
Pełny zapis transformacji wraz z macierzą transformacji dla obracającego się układu współrzędnych:
\begin{bmatrix}x'\\y'\end{bmatrix}=\begin{bmatrix}
\cos\phi&\sin\phi\\
-\sin\phi&\cos\phi
\end{bmatrix}\begin{bmatrix}x\\y\end{bmatrix}
(4.10)

[edytuj] Kąty Eulera

Kąty Eulera (od nazwiska szwajcarskiego matematyka Leonharda Eulera), to układ trzech kątów, za pomocą których można jednoznacznie określić wzajemną orientację dwu kartezjańskich układów współrzędnych o jednakowej skrętności w trójwymiarowej przestrzeni euklidesowej.

[edytuj] Definicja

Kąty Eulera dla prawoskrętnych układów współrzędnych

Dokonajmy obrotu układu współrzędnych xyz do x'y'z', według opisu:

  • obrotu wokół osi z, takiego aby oś x pokryła się z linią węzłów w
  • obrotu wokół osi x ( = w), takiego aby oś z pokryła się z osią z'
  • obrotu wokół osi z ( = z'), takiego aby oś x pokryła się z osią x' (wówczas również oś y pokryje się z osią y').

Przy czym zakładamy, że obrót wokół np. osi x uważamy za dodatni, gdy odbywa się odwrotnie ze wskazówkami zegara. W niektórych książkach (w tym na Wikipedii) przyjęto przeciwną definicję kąta. Obrót układu współrzędnych można opisać przez trójkę katów:

\varphi,\psi,\theta=[0,2\pi),[0,2\pi),[0,\pi)

Określmy:

  • \varphi — kąt mierzony od osi x do osi węzłów w w kierunku wyznaczonym osią z; jest to kąt obrotu 1.
  • \theta — kąt mierzony od osi węzłów w do osi x' w kierunku wyznaczonym osią z'; jest to kąt obrotu 3.
  • \psi — kąt mierzony od osi z do z' w kierunku wyznaczonym osią węzłów w; jest to kąt obrotu 2.

Macierze obrotu A1, A2 i A3, którego symbolizują obroty z charakteryzowane powyżej wynoszą:


A_1 = \begin{bmatrix}
\cos\varphi   &  \sin\varphi & 0\\
-\sin\varphi  &  \cos\varphi & 0\\
     0        &        0     & 1
\end{bmatrix}\qquad
(4.11)

A_2 = \begin{bmatrix}
1 &      0      &     0     \\
0 & \cos\theta  & \sin\theta\\
0 & -\sin\theta & \cos\theta
\end{bmatrix}\qquad
(4.12)

A_3 = \begin{bmatrix}
\cos\psi  & \sin\psi & 0\\
-\sin\psi & \cos\psi & 0\\
    0     &     0    & 1
\end{bmatrix}
(4.13)

Macierz obrotu w trzech kierunkach na podstawie macierzy poszczególnych obrotów (4.11), (4.12) i (4.13) jest przedstawiona wzorem A=A1A2A3, i podstawieniu do tej formuły macierze obrotów, otrzymujemy:

A=\begin{bmatrix}
\cos\varphi   &  \sin\varphi & 0\\
-\sin\varphi  &  \cos\varphi & 0\\
     0        &        0     & 1
\end{bmatrix}\begin{bmatrix}
1 &      0      &     0     \\
0 & \cos\theta  & \sin\theta\\
0 & -\sin\theta & \cos\theta
\end{bmatrix}\begin{bmatrix}
\cos\psi  & \sin\psi & 0\\
-\sin\psi & \cos\psi & 0\\
    0     &     0    & 1
\end{bmatrix}
A=\begin{bmatrix}
\cos\varphi&\sin\varphi\cos\theta&\sin\varphi\sin\theta\\
-\sin\varphi&\cos\varphi\cos\theta&\cos\varphi\sin\theta\\
0&-\sin\theta&\cos\theta
\end{bmatrix}\begin{bmatrix}
\cos\psi  & \sin\psi & 0\\
-\sin\psi & \cos\psi & 0\\
    0     &     0    & 1
\end{bmatrix}
(4.14)

Macierz obrotu w przestrzeni trójwymiarowej, określająca obroty ze starego położenia do nowego układu współrzędnych, przedstawiamy:

A=\begin{bmatrix}
\cos\varphi\cos\psi-\sin\varphi\cos\theta\sin\psi&\cos\varphi\sin\psi+\sin\varphi\cos\theta\cos\psi&\sin\varphi\sin\theta\\
-\sin\varphi\cos\psi-\cos\varphi\cos\theta\sin\psi&-\sin\varphi\sin\psi+\cos\varphi\cos\theta\cos\psi&+\cos\varphi\sin\theta\\
\sin\theta\sin\psi&-\sin\theta\cos\psi&\cos\theta
\end{bmatrix}
(4.15)

Natomiast odwrotna macierz obrotu w przestrzeni trójwymiarowej, przekształcająca obroty z nowego położenia układu współrzędnych do starego, jest napisana w sposób następujący:

A^{-1}=\begin{bmatrix}
\cos\psi\cos\varphi-\sin\psi\cos\theta\sin\varphi&\cos\psi\sin\varphi-\sin\psi\cos\theta\cos\varphi&\sin\psi\sin\theta\\
\sin\psi\cos\varphi+\cos\psi\cos\theta\sin\varphi&-\sin\psi\sin\varphi+\cos\psi\cos\theta\cos\varphi&-\cos\psi\sin\theta\\
\sin\theta\sin\varphi&\sin\theta\cos\varphi&\cos\theta
\end{bmatrix}
(4.16)

[edytuj] Całki i funkcje Eulera

Poznamy tutaj całki, które są nam w fizyce bardzo potrzebne do przeprowadzania różnych obliczeń.

[edytuj] Całka Eulera pierwszego rodzaju

Całką Eulera pierwszego rodzaju nazywamy całkę mówiąc za Legendre całkę zapisaną za pomocą schematu poniżej, który jest funkcją argumentów a i b, które są liczbami rzeczywistymi. Ta nasza funkcja Eulera jest całką całkowalną przy granicach od zera do jedynki z pewnego wyrażenia ściśle określonego:

B(a,b)=\int^1_{0}x^{a-1}\left(1-x\right)^{b-1}dx\;
(5.1)

Można udowodnić, że ze względu na przestawianie argumentów w całce (5.1) jest działaniem przemiennym ze względu na kolejność parametrów a i b, co można udowodnić zmieniając zmienną x na x=1-t:

B(a,b)=\int^1_{-1}x^{a-1}\left(1-x\right)^{b-1}dx=\int^{-1}_{1}\left(1-t\right)^{a-1}\left(1-\left(1-t\right)\right)^{b-1}d(1-t)=\;
=\int^1_{-1}\left(1-t\right)^{a-1}t^{b-1}dt=B(b,a)\;
(5.2)

Można również udowodnić tożsamość rekurencyjną, która jest zależna od argumentów a i b oraz która jest zależnością rekurencyjną po argumencie b, przedstawiamy tą rekurencję:

B(a,b)={{b-1}\over{a+b-1}}B(a,b-1)\;
(5.3)

Tożsamość (5.3) udowodniamy przez całkowanie przez części dla b>1, korzystając z definicji całki Eulera (5.1):

B(a,b)=\int_0^1(1-x)^{b-1}x^{a-1}dx=\int_{0}^1(1-x)^{b-1}d{{x^{a}}\over{a}}={{x^{a}(1-x)^{b-1}}\over{a}}\Bigg|^{1}_0+\;
+{{b-1}\over{a}}\int_0^1x^a(1-x)^{b-2}dx={{b-1}\over{a}}\int^1_0x^a(1-x)^{b-1-1}dx=\;
={{b-1}\over{a}}\int^1_0{{x^{a-1}(x-1+1)(1-x)^{b-1}}\over{1-x}}dx\;
=-{{b-1}\over{a}}\int^1_0x^{a-1}(1-x)^{b-1}dx+{{b-1}\over{a}}\int^1_0x^{a-1}(1-x)^{b-1}dx=\;
=-{{b-1}\over{a}}B(a,b)+{{b-1}\over{a}}B(a,b-1)
(5.4)

Korzystając z końcowego wniosku w przeprowadzonych obliczeniach w punkcie (5.4) dochodzimy do wniosku, że B(a,b) można zapisać w zależności od B(a,b-1), co dowód tej zależności przeprowadzimy poniżej w taki sposób, że pierwszy wyraz po prawej stronie w wspomnianym wyprowadzeniu przenosimy na jej lewą stronę:

B(a,b)+{{b-1}\over{a}}B(a,b)={{b-1}\over{a}}B(a,b-1)\Rightarrow B(a,b)\left(1+{{b-1}\over{a}}\right)={{b-1}\over{a}}B(a,b-1)\;

B(a,b){{a+b-1}\over{a}}={{b-1}\over{a}}B(a,b-1)\Rightarrow B(a,b)={{b-1}\over{a+b-1}}B(a,b-1)
(5.5)

Wzór (5.5) przestawia zależność rekurencyjną jaką oczekiwaliśmy otrzymać z obliczeń. Niech mamy już obliczone całki Eulera B(a,1), w ten sposób na podstawie zależności rekurencyjnej końcowego wywodu (5.5) piszemy wedle schematu wzór na wielkość B(a,n), którego pierwszym argumentem jest dowolna liczba rzeczywista, a drugim argumentem jest liczba naturalna znana z analizy matematycznej ze szkoły średniej:

B(a,n)={{n-1}\over{a+n-1}}\cdot{{n-2}\over{a+n-2}}\cdots\cdot{{1}\over{a+1}}B(a,1)\;
(5.6)

Następnym krokiem jest wyznaczenie całki Eulera (5.1) dla argumentu b=1, czyli całkę Eulera pierwszego rodzaju B(a,1), gdy drugim jego argumentem jest liczba całkowita równa jeden, zatem w takim przypadku mamy wzór:

B(a,1)=\int_0^1x^{a-1}dx={{1}\over{a}}\;
(5.7)

Zatem wyrażenie (5.6) przy obliczonej całce Eulera B(a,1) (5.7), czyli w tym ostatnim w drugim argumentem w całce Eulera pierwszego rodzaju jest liczba jeden, zatem możemy wyznaczyć ogólny wzór na opisywaną tutaj całkę.

B(a,n)=B(n,a)={{1\cdot 2\cdot 3\cdot\cdots\cdot (n-1)}\over{a(a+1)(a+2)\cdots(a+n-1)}}\;
(5.8)

Wzór (5.8) jest słuszny, gdy a jest rzeczywiste, określmy teraz przypadek, gdy a jest liczbą naturalną oznaczonej przez m, wtedy ze wspomnianego wzoru dostajemy wzór zapisujemy za pomocą silni:

B(m,n)={{(n-1)!(m-1)!}\over{(m+n-1)!}}\;
(5.9)

[edytuj] Inne przestawienie analityczne całki Eulera B(a,b)

W całce Eulera (5.1) dokonajmy podstawienia określonego wzorem _{x={{y}\over{1+y}}}\;, gdzie argument x jest ilorazem liczby y przez y+1, wtedy:

B(a,b)=\int^{\infty}_{0}{{y^{a-1}}\over{(1+y)^{a-1}}}\left(1-{{y}\over{1+y}}\right)^{b-1}d{{y}\over{1+y}}=\;
=
\int_0^{\infty}{{y^{a-1}}\over{(1+y)^{a-1}}}{{1}\over{(1+y)^{b-1}}}{{1+y-y}\over{(1+y)^2}}dy=\int_0^{\infty}{{y^{a-1}}\over{(1+y)^{a+b}}}dy\;
(5.10)

W całce Eulera (5.1) określoną wzorem (5.10) po dokonaniu w nim podstawienia za b=1-a, 0<a<1 , dostajemy wniosek na całkę Eulera B(1-a,a):

B(a,1-a)=\int_0^{\infty}{{y^{a-1}}\over{1+y}^{a+1-a}}dy=\int_0^{\infty}{{y^{a-1}}\over{1+y}}dy\;
(5.11)

Całka Eulera (5.10) można przepisać bez dowodu, którego to dowód można znaleźć w analizie matematycznej, a my tutaj napiszemy gotowe jego rozwiązanie:

B(a,1-a)={{\pi}\over{\sin a\pi}}\;
(5.12)

[edytuj] Całka Eulera drugiego rodzaju

Całką Eulera drugiego rodzaju nazywamy całkę zapisaną wedle schematu poniżej, która jest funkcją jednego argumentu a, całkowana w granicach od zera do nieskończoności.

\Gamma(a)=\int_0^{\infty}x^{a-1}e^{-x}dx\;
(5.13)

Dokonajmy podstawienia określonego wzorem _{x=\ln{{1}\over{z}}}\;, którego jest logarytmem z odwrotności liczby z i którą tą całkę (5.13) zapisujemy po dokonaniu tego podstawienia do ostatnio wspomnianej całki:

\Gamma(a)=\int^0_{\infty}\left(\ln{{1}\over{z}}\right)^{a-1}{{1}\over{e^{\ln {{1}\over{z}}} }}d\ln {{1}\over{z}}=\int_0^{\infty}\left(\ln{{1}\over{z}}\right)^{a-1}z z{{1}\over{z^2}}dz=\int_0^{\infty}\left(\ln{{1}\over{z}}\right)^{a-1}dz\;
(5.14)

Bardzo ważną tożsamością jest tożsamość, z której wyjdziemy jest tożsamość _{\lim_{\alpha\rightarrow \infty}{{a^{\alpha}-1}\over{\alpha}}=\ln a}\;, w tej tożsamości należy dokonać podstawienia rozpatrzonego według schematu_{\alpha\rightarrow{{1}\over{n}}}\;:

\ln {{1}\over{z}}=\lim_{n\rightarrow}n\left(1-z^{{1}\over{n}}\right)\;
(5.15)

Całkę (5.14) możemy zapisać przy pomocy udowodnionej tożsamości (5.15) w tym tekście, którą zapisujemy przy pomocy granicy n dążącą do nieskończoności:

\Gamma(a)=\lim_{n\rightarrow\infty}n^{\alpha-1}\int_0^1\left(1-z^{{1}\over{n}}\right)^{a-1}dz\;
(5.16)

Do tożsamości (5.16) podstawimy podstawienie wedle schematu z=yn, zatem ten nasz wspomniany wzór przyjmuje postać bardzo podobną do całki Eulera pierwszego rodzaju:

\Gamma(a)=\lim_{n\rightarrow\infty}n^{a-1}\left(1-\left(y^n\right)^{{{1}\over{n}}}\right)^{a-1}dy^n=\lim_{n\rightarrow\infty}n^{a}\int_0^1y^{n-1}(1-y)^{a-1}dy\;
(5.17)

Całka występująca we wzorze (5.17) jest całką Eulera pierwszego rodzaju, zatem możemy napisać ostatnio wspomniany wzór wedle:

\Gamma(a)=\lim_{n\rightarrow\infty}n^{a}B(a,n)\;
(5.18)

Jeśli skorzystamy z tożsamości (5.8), to można napisać całkę Eulera drugiego rodzaju (5.18) zapisaną przy pomocy granicy z liczby całkowitej n dążącej do nieskończoności:

\Gamma(a)=\lim_{n\rightarrow\infty}n^a\cdot{{1\cdot 2\cdot 3\cdot...\cdot(n-1)}\over{a(a+1)(a+2)\cdot...\cdot(a+n-1)}}\;
(5.19)

[edytuj] Ciągłość funkcji Γ'(a) jako pochodnej całki Eulera drugiego rodzaju

Całkę Eulera (5.13) zróżniczkujmy względem argumentu "a", a potem jeszcze raz względem argumentu a, i w ten sposób otrzymamy pierwszą i drugą pochodną funkcji Γ(a), to dochodzimy do postaci tych dwóch pochodnych:

\Gamma^'(a)=\int_0^{\infty}x^{a-1}\ln x e^{-x}dx\;
(5.20)
\Gamma^{''}(a)=\int_0^{\infty}x^{a-1}(\ln x)^2e^{-x}dx\;
(5.21)

n-ta pochodna funkcji Γ(x) (5.13) zapisujemy analogicznie do wzorów (5.20) (Pierwsza pochodna funkcji Γ(a) (5.13)) i (5.21) (Druga pochodna funkcji Γ(a) (5.13)), zatem ogólna forma tej n-tej pochodnej jest:

\Gamma^{(n)}=\int_0^{\infty}x^{a-1}\left(\ln x\right)^ne^{-x}dx\;
(5.22)

[edytuj] Postać rekurencyjna funkcji Γ(x) (5.13)

Przecałkujmy przez części funkcję napisaną poniżej wedle praw analizy matematycznej, z której wykorzystamy definicję funkcji Γ(a) zapisaną wzorem w punkcie (5.13).

a\int_0^{\infty}x^{a-1}e^{-x}dx=x^ae^{-x}\Bigg|^{\infty}_0+\int_0^{\infty}x^{a}e^{-x}dx\;
(5.23)

Jeśli skorzystamy z definicji całki Eulera (5.13), to tożsamość (5.23), którą zapiszemy przy pomocy definicji całki Eulera Γ(a) jako:

a\Gamma(a)=\Gamma(a+1)\;
(5.24)

Wyznaczmy całkę Eulera Γ(1), wtedy funkcja potęgowa występująca we wspomnianej funkcji (5.13) (pierwszy czynnik) jest równa jeden dla a=1, ze względu na zerowanie się wykładnika potęgi (bo a-1=0) dla pierwszego czynnika w całce, wtedy:

\Gamma(1)=-\int_0^{\infty}e^{-x}d(-x)=-\int_0^{-\infty}e^{-x}dx=-\int_0^{-\infty}e^{x}dx=e^{x}\Bigg|_0^{-\infty}=1\;
(5.25)

Postać rekurencyjna (5.24) dla a naturalnego, którą oznaczymy przez "n" i z własności (5.25) możemy napisać, że:

\Gamma(n)=(n-1)\Gamma(n-1)=(n-1)(n-2)\Gamma(n-2)=(n-1)(n-2)\cdot...\cdot 1=(n-1)!\;
(5.26)

[edytuj] Granica górna funkcji Γ(a) dla a nieskończonego

Obierzmy takie n by było liczbą naturalną nie większą niż a, by było a>n+1, zatem mamy Γ(a)>n!, jeśli dodatkowo zauważymy, że _{{{n}\over{a}}\Rightarrow 1}\;, wtedy:

\Gamma(a)={{\Gamma(a+1)}\over{a}}>{{n!}\over{a}}={{(n-1)!n}\over{a}}=(n-1)!{{n}\over{a}}\rightarrow (n-1)!\rightarrow\infty\;
(5.27)

Widzimy, że granicą dla "a" nieskończonego jest Γ(a) nieskończone, zatem największą wartością Γ(a) jakie może przyjmować jest wartość nieskończona.

[edytuj] Związek pomiędzy funkcjami B(a,b) i Γ(a)

Do całki (5.13) dokonujemy podstawienia opisane przez schemat x=ty, które to x jest iloczynem liczby t i liczby y, zatem przy założeniu t>0, nasza wspomniana całka jest pisana:

\Gamma(a)=\int_0^{\infty}t^{a-1}y^{a-1}e^{-ty}d(ty)=t^a\int_0^{\infty}y^{a-1}e^{-ty}dy\Rightarrow {{\Gamma(a)}\over{t^a}}=\int_0^{\infty}y^{a-1}e^{ty}dy\;
(5.28)

We wzorze (5.28) piszemy zamiast a wyrażenie a+b (będące sumą liczb a i b) oraz 1+t (będące sumą jedynki i liczby b) zamiast t, zatem w ten sposób dostajemy tożsamość:

{{\Gamma(a+b)}\over{(1+t)^{a+b}}}=\int_0^{\infty}y^{a+b-1}e^{-(1+t)y}dy\;
(5.29)

Tożsamość (5.29) mnożymy przez funkcję potęgową ta-1 czyli funkcję z liczby t o wykładniku a-1 i obie strony tak otrzymanego równania całkujemy względem zmiennej t:

\Gamma(a+b)\int_0^{\infty}{{t^{a-1}}\over{(1+t)^{a+b}}}dt=\int_0^{\infty}t^{a-1}dt\int_0^{\infty}y^{a+b-1}e^{-(1+t)y}dy\;
(5.30)

Całka występująca po lewej stronie jest funkcją B(a,b), czyli ona jest taka sama, jak całka zapisana w punkcie (5.10). Zatem całkę występująca po prawej stronie równości (5.30), przy wykorzystaniu z definicji drugiej całki Eulera (pierwszego rodzaju) (5.13), możemy napisać jako:

\Gamma(a+b)B(a,b)=\int_0^{\infty}t^{a-1}dt\int_0^{\infty}y^{a+b-1}e^{-(1+t)y}dy=\int_0^{\infty}y^{a+b-1}e^{-y}dy\int_0^{\infty}t^{a-1}e^{-ty}dt=\;
=\int _0^{\infty}y^{a+b-1}e^{-y}{{\Gamma(a)}\over{y^a}}dy=\Gamma(a)\int_0^{\infty}y^{b-1}e^{-x}dy=F(a)\Gamma(b)\;
(5.31)

Tożsamość wynikająca z obliczeń przedstawionych w punkcie (5.31) jest napisana poniżej (pierwszy wzór wynikowy), stąd możemy wyznaczyć B(a,b), która jest całką Eulera pierwszego rodzaju:

\Gamma(a+b)B(a,b)={{\Gamma(a)\Gamma(b)}\over{\Gamma(a+b)}}\Rightarrow B(a,b)={{\Gamma(a)\Gamma(b)}\over{\Gamma(a+b)}}\;
(5.32)

[edytuj] Wzór na dopełnienie w tożsamości (5.32)

We wzorze (5.31) dokonajmy podstawienia b=1-a (którego to b jest różnicą liczby 1 i liczby b), w którym wiadomo, że "a" należy do do przedziału 0<a<1, ale też później korzystając z tożsamości na funkcję B(a,1-a) napisaną w punkcie (5.12), możemy napisać:

\Gamma(a)\Gamma(1-a)=B(a,1-a)\Rightarrow \Gamma(a)\Gamma(1-a)={{\pi}\over{\sin a\pi}}\;
(5.33)

Korzystając z tożsamości (5.33), to tożsamość _{\Gamma\left({{1}\over{2}}\right)}\; jest napisana wzorem wynikowym wynikających z powyższych obliczeń:

\Gamma\left({{1}\over{2}}\right)\Gamma\left(1-{{1}\over{2}}\right)={{\pi}\over{\sin {{1}\over{2}}\pi}}\Rightarrow \Gamma\left({{1}\over{2}}\right)=\sqrt{\pi}\;
(5.34)

[edytuj] Wzór Stirlinga

Napiszmy funkcję Γ(x+1), która jest całką Eulera pierwszego rodzaju z argumentu x powiększonej o jeden, w którym dokonamy od razu podstawienia w postaci wzoru zależnej od liczby x i od parametru u, czyli podstawienia t=x+u\sqrt{x}\;, wiedząc, że dla t równego zero (t=0) według wspomnianego podstawienia mamy u=-\sqrt{x}\;, co wykorzystamy w całce poniżej:

\Gamma(x+1)=\int_0^{\infty}t^{x}e^{-t}dt=\int_{-\sqrt{x}}^{\infty}e^{-x-u\sqrt{y}}(x+u\sqrt{x})^xdu\sqrt{x}=\;
=\int_{-\sqrt{x}}^{\infty}\sqrt{x}e^{-x-u\sqrt{x}}e^{x\ln(x+u\sqrt{x})}du=\sqrt{x}e^{-x}\int_{-\sqrt{x}}^{\infty}e^{-u\sqrt{x}+x\ln\left[x\left(1+u{{1}\over{\sqrt{x}}}\right)\right]}du=\;
=
x^x\sqrt{x}e^{-x}\int^{\infty}_{-\sqrt{x}}e^{-u\sqrt{x}+x\ln\left(1+{{u}\over{\sqrt{x}}}\right)}du
(5.35)

Ponieważ posługujemy wartościami x, które są liczbami bardzo dużymi, zatem możemy powiedzieć, że posługujemy się wartościami nieskończenie dużymi, to logarytm naturalny z liczby n! możemy przybliżyć wyrażeniem _{\ln(1+a)\simeq a-{{a^2}\over{2}}}\; dla a bardzo małego bliskiego zeru, wtedy końcową całkę (5.35) można przestawić:

\Gamma(x+1)\simeq x^x\sqrt{x}e^{-x}\int_{-\infty}^{\infty}e^{-u\sqrt{x}+x\left({{u}\over{\sqrt{x}}}-{{1}\over{2}}{{u^2}\over{x}}\right)}du=x^x\sqrt{x}e^{-x}\int^{\infty}_{-\infty}e^{-{{u^2}\over{2}}}du=\;
=x^x\sqrt{x}e^{-x}\sqrt{2\pi}=\sqrt{2\pi}x^{x+{{1}\over{2}}}e^{-x}\;
(5.36)

Jeśli skorzystamy z udowodnionej tożsamości (5.26) i za miejsce x wstawimy wartość n, to przybliżona tożsamość (5.36) przyjmuje postać:

n!\simeq\sqrt{2\pi}n^{n+{{1}\over{2}}}e^{-n}\;
(5.37)

Po zlogarytmowaniu wyrażenia (5.37) logarytmem naturalnym ze względu na n bardzo duże w końcowych obliczeniach pomijamy składnik z liczby _{\ln\sqrt{2\pi}}, bo jest mały z porównaniu z innymi składnikami sumy:

\ln n!\simeq\ln\sqrt{2\pi}+\left(n+{{1}\over{2}}\right)\ln n-n\simeq n\ln n-n\;
(5.37)

[edytuj] Kula zanurzona w przestrzeni n-wymiarowej

[edytuj] Równanie kuli

W przestrzeni n-wymiarowej mamy zdefiniowaną pewną normę _{||\cdot||}, należącej do przestrzeni rzeczywistej, wzór na kulę niedomkniętą, a także domkniętą, a na samym końcu sfery przestawiamy wzorami poniżej o promieniach R, obie kule (niedomkniętą i domkniętą) dla przestrzeni z tą właśnie zdefiniowaną normą przestawiamy:

||\vec{x}-\vec{x_0}||< R
(6.1)
||\vec{x}-\vec{x_0}||\leq  R
(6.2)
||\vec{x}-\vec{x_0}||=R
(6.3)

Dla przestrzeni Euklidesowej z normalną normą kule niedomkniętą, domknięta, a także sferę przestawiamy po kolei:

\sum^N_{i=1}(\vec{x_i}-\vec{x_{0i}})^2< R^2
(6.4)
\sum^N_{i=1}(\vec{x_i}-\vec{x_{0i}})^2\leq  R^2
(6.5)
\sum^N_{i=1}(\vec{x_i}-\vec{x_{0i}})^2=R^2
(6.6)
  • gdzie N jest to wymiar kuli w przestrzeni n-wymiarowej.

[edytuj] Objętość kuli w n-wymiarowej przestrzeni

Wzór na sferę (6.6), dla której promień naszej rozważanej sfery jest R mając współrzędne środka tej kuli xio, i współrzędne punktów sfery xi, piszemy:

\sqrt{\sum^N_{i=1}(x_i-x_{i0})^2}=R
(6.7)

Oznaczmy dla oczywistych powodów, że środek kuli jest w środku układu współrzędnych, tzn. zachodzi warunek x0i=0 we wzorze (6.7), co nie umniejsza dowodu, by później wyznaczyć objętość n wymiarowej kuli zanurzonej w przestrzeni n-wymiarowej, zatem z definicji n-wymiarowej objętości kuli o promieniu jeden Ω(1) pomnożonej przez Rs mamy:

R^s\Omega_s(1)=\int\int\cdot\ldots\cdot\int dx_1dx_2\cdot..\cdot dx_n
(6.8)

Grupując we wzorze (6.8) odpowiednio wyrazy w czynniku pod całką, gdy promień kuli wynosi jeden, korzystając przy tym ze wzoru (6.8), wtedy objętość n-wymiarowej kuli jest:

\Omega_s(1)=\int\limits^1_{-1}dx_1\int\cdot\ldots\cdot\int dx_2\cdot\ldots\cdot dx_n
(6.9)

Obierzmy promień kuli s-1 wymiarowej o promieniu jeden, który określany wzorem _{1=\sqrt{y_1^2+R_1^2}}\;, gdzie R1 jest promień kuli w n-1 wymiarowej przestrzeni, pisząc ją przez _{R_1^2=\sum^n_{i=1}x^2_i}\;, wtedy jej objętość:

\Omega_s(1)=\int\limits^1_{-1} dy_1 R^{s-1}_1\Omega_{s-1}(1)
(6.10)

Ale ponieważ zachodzi na pewno _{R1=\sqrt{1-y_1^2}}\;, to wzór (6.10) na promień jednostkowy kuli, którego objętość Ωs(1) wyżej wspomniana w zależności od objetości kuli s-1 wymiarowej Ωs-1(1), piszemy:

\Omega_s(1)=\int\limits^1_{-1}dy_1(1-y^2_1)^{{s-1}\over{2}}\Omega_{s-1}\Rightarrow\Omega_s(1)=\Omega_{s-1}\int\limits^1_{-1}dy_1(1-y^2_1)^{{s-1}\over{2}}
(6.11)

Policzmy teraz całkę początkowo przekształcając tą całkę z własności symetryczności funkcji podcałkowej, która występuje jako całka we wzorze końcowym wynikowym (6.11):

\int\limits^1_{-1}dy_1(1-y^2_1)^{{s-1}\over{2}}=2\int\limits^1_0dy_1(1-y^2_1)^{{s-1}\over{2}}
(6.12)

Dokonując podstawienia wynikającego z podstawienia wynikającego ze wzoru x=y2, to różniczka funkcji y(x) piszemy przez _{dy=dx^{1\over 2}=x^{-{{1}\over{2}}}dx}\;, wtedy końcowy wzór (6.12) piszemy jako:

2\int\limits^1_0 {1\over 2}x^{-1\over 2}(1-x)^{{s-1}\over{2}}=\int\limits^1_0x^{-{1\over 2}}(1-x)^{{s-1}\over{2}}
(6.13)

Całka występująca we wzorze (6.13) jest szczególnym rodzajem całki Eulera pierwszego rodzaju, gdzie w naszym przypadku mamy_{\alpha={{1}\over{2}}} oraz _{\beta={{s+1}\over{2}}}, którą definiujemy wzorem zapisaną w punkcie (5.1).

Całka Eulera B(a,b) dla parametrów równych a=α i b=β we wspomnianym wzorze na definicji całki Eulera pierwszego rzędu, dla naszych argumentów wchodzących w skład do tej całki, którą możemy napisać jako tożsamość:

B\left({1\over 2},{{s+1}\over{2}}\right)={{\Gamma({1\over 2})\Gamma({{s+1}\over{2}}) }\over{\Gamma(1+{{s}\over{2}})}}
(6.14)

Korzystając z całki (6.13) i z definicji całki Eulera dla specyficznych wartości a i b dla kuli zanurzonej w s-wymiarowej przestrzeni i po pewnych operacjach dokonywanych przez nas we wzorach pośrednich, to wzór na objętość n-wymiarowej kuli jednostkowej przestawianych wzorem (6.11), które tutaj dla kuli jednostkowej piszemy:

\Omega_s(1)={{\Gamma({1\over 2})\Gamma({{s+1}\over{2}}) }\over{\Gamma(1+{{s}\over{2}})}}\cdot {{\Gamma({1\over 2})\Gamma({{s}\over{2}}) }\over{\Gamma({{s+1}\over{2}})}}\cdot...\cdot {{\Gamma({1\over 2})\Gamma({{3}\over{2}}) }\over{\Gamma(2)}}\Omega_1(0)\Rightarrow\Omega_s(1)={{\pi^{{s-1}\over 2}\Gamma({3 \over 2})}\over{{\Gamma({{s}\over{2}}+1)}}}\Omega_1(1)
(6.15)

Ale pamiętając również, że funkcja _{\Gamma\left({{1}\over{2}}\right)}\;, którego wartość wprowadziliśmy w punkcie (5.34), wtedy objętość kuli określamy ogólnym wzorem w zależności od funkcji Γ z liczby _{{{s}\over{2}}+1}\;, gdzie s jest wymiarem kuli s-wymiarowej.

\Gamma({3\over 2})={1\over 2}\Gamma({1\over 2})={1\over 2}\sqrt{\pi}\Rightarrow\Omega_s(1)={{\pi^{{s-1}\over 2}{1\over 2}\sqrt{\pi}}\over{{\Gamma({{s}\over{2}}+1)}}}2\Rightarrow\Omega_s(1)={{\pi^{s\over 2}}\over{\Gamma({{s}\over{2}}+1)}}
(6.16)

Gdy s jest równa podwojonej liczbie k, czyli wedle podstawienia s=2k, które dokonamy we wzorze (6.16), zatem objętość kuli jednostkowej w tym naszym przypadku zapisujemy:

\Omega_{1}={{\pi^k}\over{\Gamma(k+1)}}\Rightarrow \Omega_{2k}(1)={{\pi^k}\over{k!}}
(6.17)

Gdy s jest liczbą nieparzystą, czyli jest równa podwojonej wartości k odejmując od niej później jeden, czyli według podstawienia s=2k-1, to wyrażenie (6.16) piszemy wedle schematu:

\Omega_{2k-1}={{\pi^{k-{1\over 2}}}\over{\Gamma(k-{1\over 2}+1)}}\Rightarrow\Omega_s(1)={{\pi^{k-{{1}\over{2}}}2^{k}}\over{(2k-1)(2k-3)(2k-5)\cdot...\cdot 1\cdot\Gamma({{1}\over{2}})}}\Rightarrow\;
\Rightarrow\Omega_s(1)={{\pi^{k-{{1}\over{2}}}2^{k}}\over{s!!\sqrt{\pi}}}\Rightarrow\Omega_s(1)={{{\pi^{k-1}}2^{k}}\over{s!!}}
(6.18)

[edytuj] Zestawienie wzorów na objętość dla kuli s wymiarowej

Wiedząc, że objętość s-wymiarowej kuli jest wyrażona za pomocą objętości kuli jednostkowej pomnożonej przez s-tą potęgę promienia tejże kuli, którego ta objętość jest _{V_s=\Omega_s(1)R^s}\;, to ta nasza objętość jest wyrażona wedle wzorów dla s parzystego (6.17) i s nieparzystego (6.18), wtedy zbierając to wszystko do kupy, piszemy:

V_{s}=\frac { \pi^{\frac{s}{2}}}{\Gamma (\frac{s}{2}+1)}\cdot R^{s} =
\begin{cases} \displaystyle {\pi^k\over k!}\cdot R^s & \mbox{dla }s=2k \\[2ex]
 \displaystyle {2^k \pi^{k-1}\over s!!}\cdot R^s & \mbox{dla } s=2k-1
\end{cases}
(6.19)

co kończy dowód.

[edytuj] Pole powierzchni sfery w n-wymiarowej przestrzeni

Zakładamy, że mamy dwie sfery o wspólnym środku i promieniach, takimi że zachodzi _{R_1-R_2 \rightarrow 0}, czyli wystarczy policzyć pochodną funkcji V określone wzorem ogólnym (6.19) względem promienia kuli określonego przez wielkość R,

P_sdR={{dV}\over{dR}}dR={{\pi^{s\over 2}}\over{\Gamma({s\over 2}+1)}}sR^{s-1}dR
(6.21)

Stąd jego powierzchnia s-wymiarowej kuli, korzystając ze wzoru na objętość kuli określone wzorem (6.17) lub wzorem (6.18), jest:

P_s=\frac { \pi^{\frac{s}{2}}}{\Gamma (\frac{s}{2}+1)}\cdot sR^{s-1} =
\begin{cases} \displaystyle {\pi^k\over k!}\cdot sR^{s-1} & \mbox{dla }s=2k \\[2ex]
 \displaystyle {2^k \pi^{k-1}\over s!!}\cdot sR^{s-1} & \mbox{dla } s=2k-1
\end{cases}
(6.22)

[edytuj] Operatory różniczkowe

[edytuj] Operator Nabla

Operator nabla oznaczamy symbolem ∇, jest wektorem różniczkowania, każda jego składowa jest pochodną cząstkową za każdym razem po innej współrzędnej trójwymiarowego układu współrzędnej, tzn. po kolei x,y,z, jego definicja jest:

\nabla=\sum^{3}_{i=1}\vec{k_i}{{\partial}\over{\partial x_i}}=\vec{i}{{\partial f}\over{\partial x}}+\vec{j}{{\partial f}\over{\partial y}}+\vec{k}{{\partial f}\over{\partial z}}
(7.1)

[edytuj] Baza ortogonalna we współrzędnych uogólnionych

Niech znamy funkcję transformująca współrzędne uogólnione trójwymiarowego układu współrzędnych transformujących się według _{\vec{r}=f(\vec{q})} do trójwymiarowego układu kartezjańskiego, wtedy możemy napisać definicję na wektory jednostkowe zależne od "i" w krzywoliniowym układzie współrzędnych jako:

\vec{e_i}={{{{\partial \vec{r}}\over{\partial q_i}}}\over{||\vec{e_i}||}}, gdzie: ||\vec{e_i}||=||{{\partial \vec{r}}\over{\partial q_i}}||
(7.2)

Niech operator ∇ działa na współrzędną uogólnioną qr, wtedy wynik tej operacji rozkładamy w bazie \vec{e}_k\; opisywaną wzorem (7.2), którego wersory z założenia są prostopadłe do siebie:

\nabla q_r=\sum^3_{k=1}\alpha_{kr} \vec{e_k}
(7.3)

Ale wektory \vec{e_r} tworzą bazę wektorów bazowych unormowanych i ortogonalnych do jedności, to pomnóżmy ostatni wzór obustronnie przez wektor\vec{e_n}, to:

\nabla q_r\vec{e_n}=\sum^3_{k=1}\alpha_{kr}\vec{e_k}\vec{e_n}\Rightarrow\nabla q_r\vec{e_n}=\sum^3_{k=1}\alpha_{kr}\delta_{kn}\Rightarrow\nabla q_r\vec{e_n}=\alpha_{rn}
(7.4)

Jeśli zastąpimy wektor _{\vec{e}_n}\; przez jego definicję (7.2) we wzorze (7.4), wtedy możemy napisać lewą stronę tego równania:

\sum^3_{i=1}\vec{k_i}{{\partial q_k}\over{\partial x_i}}{{{{\partial \sum^3_{s=1}\vec{k_s}\vec{x_s}}\over{\partial q_r}}}\over{||\vec{e_r}||}}=\sum^3_{i=1}\sum^3_{s=1}\vec{k_i}\vec{k_s}{{\partial q_k}\over{\partial x_i}}{{\partial x_s}\over{\partial q_r}}{{1}\over{||e_{r}||}}=\sum^3_{i=1}\sum^3_{s=1}\delta_{is}{{\partial q_k}\over{\partial x_i}}{{\partial x_s}\over{\partial q_r}}{{1}\over{||e_{r}||}}=\;
={{1}\over{||e_{r}||}}\sum^3_{i=1}{{\partial q_k}\over{\partial x_i}}{{\partial x_i}\over{\partial q_r}}={{1}\over{||e_{r}||}}\delta_{rn}=\alpha_{rn}
(7.5)

Wzór (7.3) na podstawie przeprowadzonych obliczeń (7.5) piszemy przy definicji wersora (7.2):

\nabla q_k={{\vec{e_k}}\over{||\vec{e_k}||}}
(7.6)

[edytuj] Operator Nabla we współrzędnych uogólnionych

Napiszmy operator ∇, który jest we współrzędnych trójwymiarowego układu współrzędnych kartezjańskich, który przekształcimy przy pomocy wzoru (7.6), by póżniej przepisać jego definicję we współrzędnych uogólnionych:

\nabla=\sum^3_{i=1}\vec{k_i}{{\partial}\over{\partial x_i}}=\sum^3_{i=1}\sum^3_{r=1}\vec{k_i}{{\partial q_r}\over{\partial x_i}}{{\partial}\over{\partial q_r}}=\sum^3_{r=1}\nabla q_r{{\partial}\over{\partial q_r}}=\sum^3_{r=1}{{\vec{e_r}}\over{||e_r||}}{{\partial}\over{\partial q_r}}
(7.7)

Na podstawie obliczeń przeprowadzonych w punkcie (7.7), operator ∇ napisany jest we współrzędnych uogólnionych przy pomocy wersorów uogólnionego układu współrzędnych:

\nabla=\sum^3_{r=1}{{\vec{e_r}}\over{||e_r||}}{{\partial}\over{\partial q_r}}
(7.8)

[edytuj] Operator ∇ we współrzędnych cylindrycznych i kulistych

[edytuj] Operator Nabla we współrzędnych cylindrycznych

Niech mamy wektor wodzący danego punktu w trójwymiarowym układzie współrzędnych _{\vec{r}}\; w zależności od współrzędnych cylindrycznych, tzn. od (r,θ,z), którego piszemy:

\vec{r}=[\rho \cos\theta,\rho \sin\theta,z]
(7.9)

Wektory bazy cylindrycznego układu współrzędnych obliczamy, korzystając przy tym z definicji wektora wodzącego w układzie kartezjańskich (7.9) i przy wykorzystaniu definicji ortogonalnych wersorów (7.2), którego są definicjami wektorów bazowych uogólnionego układu współrzędnych:

{{\partial \vec{r}}\over{\partial \rho}}=[\cos\theta,\sin\theta,0]\;
(7.10)
||e_r||=||{{\partial \vec{r}}\over{\partial \rho}}||=1\;
(7.11)
\vec{e}_{\rho}=[\cos\theta,\sin\theta,0]\;
(7.12)
{{\partial \vec{r}}\over{\partial \theta}}=[-\rho \sin\theta,\rho \cos\theta,0]\;
(7.13)
||e_{\theta}||=||{{\partial \vec{r}}\over{\partial \theta}}||=\rho\;
(7.14)
\vec{e_{\theta}}=[-\sin\theta,\cos \theta,0]\;
(7.15)
{{\partial \vec{r}}\over{\partial z}}=[0,0,1]\;
(7.16)
||\vec{e_x}||=||{{\partial\vec r}\over{\partial z}}||=1\;
(7.17)
\vec{e_z}=[0,0,1]
(7.18)

Jeśli wykorzystamy wzory (7.12), (7.15) i (7.18), którego definicję operatora ∇ wyjdziemy z (7.8), którego ten nasz operator był początkowo zapisany we współrzędnych kartezjańskiego układu współrzędnych opisywanego wzorem (7.1), to we współrzędnych cylindrycznych piszemy go:

\nabla=\vec{e}_{\rho}{{\partial}\over{\partial \rho}}+{{\vec{e_{\theta}}}\over{\rho}}{{\partial}\over{\partial \theta}}+\vec{e_z}{{\partial}\over{\partial z}}
(7.19)

[edytuj] Operator Nabla we współrzędnych kulistych

We współrzędnych kulistych wektor wodzący \vec{r}\;, napisany we współrzędnych kartezjańskich układu współrzędnych w zależności od współrzędnych kulistych, jest zdefiniowany:

\vec{r}=[\rho\cos\theta\sin\phi,\rho\sin\theta\sin\phi,\rho\cos\phi]
(7.20)

Korzystając z wektora wodzącego w układzie kartezjańskich (7.20) i przy wykorzystaniu wzoru (7.2), wtedy możemy wyznaczyć wersory uogólnionego układu współrzędnych:

{{\partial \vec{r}}\over{\partial \rho}}=[\cos\theta\sin\phi,\sin\theta\sin\phi,\cos\phi]\;
(7.21)
||\vec{e}_{\rho}||=1\;
(7.22)
\vec{e}_{\rho}=[\cos\theta\sin\phi,\;
\sin\theta\sin\phi,\cos\phi]\;
(7.23)
{{\partial \vec{r}}\over{\partial \theta}}=[-\rho\sin\theta\sin\phi,\rho\cos\theta\sin\phi,0]\;
(7.24)
||\vec{e_{\theta}}||=\rho\sin\phi\;
(7.25)
\vec{e_\theta}=[-\sin\theta,\cos\theta,0]\;
(7.26)
{{\partial \vec{r}}\over{\partial\phi}}=[\rho\cos\theta\cos\phi,\rho\sin\theta\cos\phi,-\rho\sin\phi]\;
(7.27)
||e_{\phi}||=\rho\;
(7.28)
e_{\phi}=[\cos\theta\cos\phi,\;
\sin\theta\cos\phi,-\sin\phi]\;
(7.29)

Jeśli wykorzystamy wzory (7.23), (7.26) i (7.29), którego definicję operatora ∇ wyjdziemy z (7.8), którego ten nasz operator był początkowo zapisanej we współrzędnych kartezjańskiego układu współrzędnych opisywanej wzorem (7.1), a we współrzędnych kulistych piszemy go:

\nabla=\vec{e}_{\rho}{{\partial}\over{\partial \rho}}+{{\vec{e}_\theta}\over{\rho\sin\phi}}{{\partial}\over{\partial \theta}}+{{\vec{e}_{\phi}}\over{\rho}}{{\partial}\over{\partial \phi}}
(7.30)

[edytuj] Operator Δ

Kwadrat operatora ∇, czyli operator Δ piszemy przy definicji operatora wspomnianego operatora ∇ (7.1), którego to operator tutaj rozważany wychodzi z definicji operatora ∇ i ortogonalności wersorów w kartezjańskim układzie współrzędnych:

\Delta=\nabla^2=\nabla\nabla=\sum^3_{i=1}\vec{k_i}{{\partial}\over{\partial x_i}}\sum^3_{r=1}\vec{k_i}{{\partial}\over{\partial x_i}}=\sum^3_{i=1}\sum^3_{r=1}\vec{k_i}\vec{k_r}{{\partial^2}\over{\partial x_i\partial x_r}}=\sum^3_{i=1}\sum^3_{r=1}\delta_{ri}{{\partial^2}\over{\partial x_i\partial x_r}}=\sum^3_{i=1}{{\partial^2}\over{\partial x_i^2}}
(7.31)

Wedle obliczeń przeprowadzonych w punkcie (7.31) operator Δ piszemy we współrzędnych kartezjańskich wedle sposobu zapisanego poniżej, jako sumą drugich pochodnych względem każdej ze zmiennych, tzn. x, y ,z:

\Delta=\sum^3_{i=1}{{\partial^2}\over{\partial x_i^2}}
(7.32)

[edytuj] Operator Δ we współrzędnych uogólnionych

Operator Δ we współrzędnych uogólnionych zapisujemy jako kwadrat operatora ∇ we współrzędnych uogólnionych (7.8), wtedy możemy napisać tą tożsamość operatorową dla tego opisywanego tutaj operatora:

\Delta=\nabla\nabla=\nabla\sum^3_{r=1}{{\vec{e_r}}\over{||e_r||}}{{\partial}\over{\partial q_r}}=
\sum^3_{m=1}{{\vec{e_m}}\over{||e_m||}}{{\partial}\over{\partial q_m}}\sum^3_{r=1}{{\vec{e_r}}\over{||e_r||}}{{\partial}\over{\partial q_r}}=\;
=\sum^3_{m=1}\sum^3_{r=1}{{\vec{e_m}}\over{||e_m||}}{{\partial}\over{\partial q_m}}{{{\vec{e_r}}\over{||e_r||}}{{\partial}\over{\partial q_r}}}
(7.33)

Zatem na podstawie obliczeń przeprowadzonych w punkcie (7.33) dla kwadratu operatora ∇, czyli operatora Δ, którego definicja we współrzędnych uogólnionych jest:

\Delta=\sum^3_{m=1}\sum^3_{r=1}{{\vec{e_m}}\over{||e_m||}}{{\partial}\over{\partial q_m}}\left\{{{\vec{e_r}}\over{||e_r||}}{{\partial}\over{\partial q_r}}\right\}
(7.34)

[edytuj] Operator Δ w układzie cylindrycznym i kulistym

[edytuj] Operator Δ we współrzędnych cylindrycznych

Wyznaczmy operator Δ we współrzędnych cylindrycznych (7.9), wykorzystując wzór na operator Δ zapisanego w sposób ogólny dla współrzędnych w dowolnym układzie krzywoliniowym (7.34):

\Delta=\sum^3_{m=1}\sum^3_{r=1}{{\vec{e_m}}\over{||e_m||}}{{\partial}\over{\partial q_m}}\left\{{{\vec{e}_{r}}\over{||e_r||}}{{\partial}\over{\partial q_r}}\right\}=\vec{e}_{\rho}{{\partial}\over{\partial \rho}}\left(\vec{e}_{\rho}{{\partial}\over{\partial \rho}}+{{\vec{e_{\theta}}}\over{\rho}}{{\partial}\over{\partial \theta}}+\vec{e_z}{{\partial}\over{\partial z}}\right)+\;
+{{\vec{e_\theta}}\over{\rho}}{{\partial}\over{\partial \theta}}
\left(\vec{e}_{\rho}{{\partial}\over{\partial \rho}}+{{\vec{e_{\theta}}}\over{\rho}}{{\partial}\over{\partial \theta}}+\vec{e_z}{{\partial}\over{\partial z}}\right)+\vec{e_z}{{\partial}\over{\partial z}}\left(\vec{e}_{\rho}{{\partial}\over{\partial \rho}}+{{\vec{e_{\theta}}}\over{\rho}}{{\partial}\over{\partial \theta}}+\vec{e_z}{{\partial}\over{\partial z}}\right)=

=\vec{e}_{\rho}\left(\vec{e}_{\rho}{{\partial^2}\over{\partial \rho^2}}+\vec{e_{\theta}}{{\partial}\over{\partial \rho}}\left({{1}\over{\rho}}{{\partial}\over{\partial \theta}}\right)+\vec{e_{z}}{{\partial^2}\over{\partial \rho\partial z}}\right)+\vec{e}_{\rho}\left({{\partial\vec{e}_{\rho}}\over{\partial \rho}}{{\partial}\over{\partial \rho}}+{{\partial\vec{e_{\theta}}}\over{\partial \rho}}{{\partial}\over{\rho\partial \theta}}+{{\partial \vec{e_z}}\over{\partial \rho}}{{\partial}\over{\partial z}}\right)+
+{{\vec{e_\theta}}\over{\rho}}\left(\vec{e}_{\rho}{{\partial^2}\over{\partial \theta\partial \rho}}+{\vec{e_{\theta}}}{{\partial}\over{\partial \theta}}{{\partial}\over{\rho\partial\theta}}+\vec{e_z}{{\partial^2}\over{\partial\theta\partial z}}\right)+{{\vec{e_{\theta}}}\over{\rho}}\left({{\partial\vec{e_{\theta}} }\over{\partial\theta}}{{\partial}\over{\partial \rho}}-\vec{e}_{\rho}{{\partial}\over{\rho\partial\theta}}+{{\partial\vec{e_z}}\over{\partial \theta}}{{\partial}\over{\partial z}}\right)+
+\vec{e_z}\left(\vec{e}_{\rho}{{\partial^2}\over{\partial z\partial \rho}}+\vec{e_{\theta}}{{\partial}\over{\partial z}}{{\partial}\over{\rho\partial\theta}}+\vec{e_z}{{\partial^2}\over{\partial z^2}}\right)+\vec{e_z}\left({{\partial e_{\rho}}\over{\partial z}}{{\partial}\over{\partial \rho}}+{{\partial \vec{e_{\theta}}}\over{\partial z}}{{\partial}\over{\rho\partial\theta}}+{{\partial \vec{e_{\theta}}}\over{\partial z}}{{\partial}\over{\partial z}}\right)=

={{\partial^2}\over{\partial \rho^2}}+{{1}\over{\rho}}{{\partial}\over{\partial \rho}}+{{\partial^2}\over{\rho^2\partial\theta^2}}+{{\partial^2}\over{\partial z^2}}={{1}\over{\rho}}{{{\partial}\over{\partial \rho}}}\left(\rho{{{\partial}\over{\partial \rho}}}\right)+{{1}\over{\rho^2}}{{\partial^2}\over{\partial\theta^2}}+{{\partial^2}\over{\partial z^2}}
(7.35)

Ostatecznie wzór na operator Δ zapisanego we współrzędnych cylindrycznych jako kwadrat operatora ∇ zapisujemy jako:

\Delta={{1}\over{\rho}}{{{\partial}\over{\partial \rho}}}\left(\rho{{{\partial}\over{\partial \rho}}}\right)+{{1}\over{\rho^2}}{{\partial^2}\over{\partial\theta^2}}+{{\partial^2}\over{\partial z^2}}
(7.36)

[edytuj] Operator Δ we współrzędnych kulistych

Wyznaczmy operator Δ opisany we kulistym układzie współrzędnych (7.20) wykorzystując wzór na operator Δ we współrzędnych uogólnionych (7.34):

\Delta=\sum^3_{m=1}\sum^3_{r=1}{{\vec{e_m}}\over{||e_m||}}{{\partial}\over{\partial q_m}}\{{{\vec{e}_{\rho}}\over{||e_r||}}{{\partial}\over{\partial q_r}}\}=

=\vec{e}_{\rho}{{\partial}\over{\partial \rho}}[\vec{e}_{\rho}{{\partial}\over{\partial \rho}}+{{\vec{e_{\theta}}}\over{\rho\sin\phi}}{{\partial}\over{\partial \theta}}+{{\vec{e_{\phi}}}\over{\rho}}{{\partial}\over{\partial\phi}}]+{{\vec{e_{\theta}}}\over{\rho\sin\phi}}{{\partial}\over{\partial\theta}}[\vec{e}_{\rho}{{\partial}\over{\partial \rho}}+{{\vec{e_{\theta}}}\over{\rho\sin\phi}}{{\partial}\over{\partial \theta}}+{{\vec{e_{\phi}}}\over{\rho}}{{\partial}\over{\partial\phi}}]+

+{{\vec{e_{\phi}}}\over{\rho}}{{\partial}\over{\partial\phi}}[\vec{e}_{\rho}{{\partial}\over{\partial \rho}}+{{\vec{e_{\theta}}}\over{\rho\sin\phi}}{{\partial}\over{\partial \theta}}+{{\vec{e_{\phi}}}\over{\rho}}{{\partial}\over{\partial\phi}}]=

=\vec{e}_{\rho}{{\partial}\over{\partial \rho}}(\vec{e}_{\rho}{{\partial}\over{\partial \rho}})
+\vec{e}_{\rho}{{\partial}\over{\partial \rho}}({{e_{\theta}}\over{\rho\sin\phi}}{{\partial}\over{\partial \theta}})+
\vec{e}_{\rho}{{\partial}\over{\partial \rho}}({{\vec{e_{\phi}}}\over {\rho}}{{\partial}\over{\partial\phi}})+
+{{\vec{e_{\theta}}}\over{\rho\sin\phi}}{{\partial}\over{\partial\theta}}({\vec{e}_{\rho}}{{\partial }\over{\partial \rho}})+{{\vec{e_{\theta}}}\over{\rho\sin\phi}}{{\partial}\over{\partial \theta}}({{\vec{e_{\theta}}}\over{\rho\sin\phi}}{{\partial}\over{\partial \theta}})+{{\vec{e_{\theta}}}\over{\rho\sin\phi}}{{\partial}\over{\partial \theta}}({{\vec{e_\phi}}\over{\rho}}{{\partial}\over{\partial\phi}})+
+{{\vec{e_{\phi}}}\over{\rho}}{{\partial}\over{\partial\phi}}(\vec{e}_{\rho}{{\partial}\over{\partial \rho}})+
{{\vec{e_\phi}}\over{\rho}}{{\partial}\over{\partial\phi}}({{e_{\theta}}\over{\rho\sin\phi}}{{\partial}\over{\partial\theta}})+{{\vec{e_{\phi}}}\over{\rho}}{{\partial}\over{\partial\phi}}({{ \vec{e_{\phi}}}\over{\rho}}{{\partial}\over{\partial\phi}})=

={{\partial^2}\over{\partial \rho^2}}+\underbrace{\vec{e}_{\rho}{{\partial \vec{e}_{\rho}}\over{\partial \rho}}{{\partial}\over{\partial \rho}}}_{0}+\underbrace{\vec{e}_{\rho}\vec{e_{\theta}}{{\partial}\over{\partial \rho}}({{1}\over{\rho\sin\phi}}{{\partial}\over{\partial \theta}})}_{0}+\underbrace{\vec{e}_{\rho}{{\partial\vec{e_{\theta}}}\over{\partial \rho}}{{1}\over{\rho\sin\phi}}{{\partial }\over{\partial\theta}}}_{0}
+\underbrace{\vec{e}_{\rho}\vec{e_{\phi}}{{\partial }\over{\partial \rho}}({{1}\over{\rho}}{{\partial}\over{\partial \phi}})}_{0}+\;
\underbrace{\vec{e}_{\rho}{{\partial \vec{e_{\phi}}}\over{\partial \rho}}{{1}\over{\rho}}{{\partial}\over{\partial\phi}}}_{0}+\underbrace{{{\vec{e_{\theta}}}\over{\rho\sin\phi}}\vec{e}_{\rho}{{\partial^2}\over{\partial \rho\partial\theta}}}_{0}+{{\vec{e_{\theta}}}\over{\rho\sin\phi}}\underbrace{{{\partial \vec{e}_{\rho}}\over{\partial\theta}}}_{\sin\phi \vec{e_{\theta}}}{{\partial}\over{\partial \rho}}+
{{\vec{e_{\theta}}\vec{e_{\theta}}}\over{\rho^2\sin^2\phi}}{{\partial^2}\over{\partial\theta^2}}+
\underbrace{{{\vec{e_{\theta}}}\over{\rho^2\sin^2\phi}}{{\partial\vec{e_{\theta}}}\over{\partial\theta}}{{\partial}\over{\partial\theta}}}_{0}+\;
\underbrace{{{\vec{e_{\theta}}\vec{e_{\phi}}}\over{\rho^2\sin\phi}}{{\partial^2}\over{\partial\theta\partial\phi}}}_{0}+{{{1}\over{\rho^2\sin\phi}}\underbrace{\vec{e_{\theta}}{{{\partial \vec{e_{\phi}}}\over{\partial\theta}}}}_{\cos\phi}{{\partial}\over{\partial\phi}}}+\underbrace{{{{\vec{e_{\phi}}}\vec{e_{\rho}}}\over{\rho}}{{\partial^2}\over{\partial\phi\partial \rho}}}_{0}+{{\vec{e_{\phi}}}\over{\rho}}\underbrace{{{\partial \vec{e_{\rho}}}\over{\partial \phi}}}_{\vec{e_{\phi}}}{{\partial}\over{\partial \rho}}+\underbrace{{{\vec{e_{\phi}}\vec{e_{\theta}}}\over{\rho^2}}{{\partial}\over{\partial \phi}}{{1}\over{\sin\phi}}{{\partial}\over{\partial\theta}}}_{0}+\;
+\underbrace{{{\vec{e_{\phi}}}\over{\rho^2\sin\phi}}{{\partial \vec{e_{\theta}}}\over{\partial \phi}}{{\partial}\over{\partial \theta}}}_{0}
+{{\vec{e_{\phi}}\vec{e_{\phi}}}\over{\rho^2}}{{\partial^2}\over{\partial\phi^2}}+\underbrace{{{\vec{e_{\phi}}}\over{\rho^2}}{{\partial \vec{e_{\phi}}}\over{\partial\phi}}{{\partial}\over{\partial \phi}}}_{0}={{\partial^2}\over{\partial \rho^2}}+{{2}\over{\rho}}{{\partial}\over{\partial \rho}}+{{1}\over{\rho^2\sin^2\phi}}{{\partial^2}\over{\partial\theta^2}}+\;
+{{1}\over{\rho^2}}\operatorname{ctg}\phi{{\partial}\over{\partial\phi}}+{{1}\over{\rho^2}}{{\partial^2}\over{\partial\phi^2}}
(7.37)

Aby przestawić końcowy wzór wynikających z obliczeń (7.37) musimy przekształcić pewne tożsamości, zatem dokonajmy obliczeń na wzorach ogólnych:

{{1}\over{\sin\phi}}{{\partial}\over{\partial\phi}}\sin\phi{{\partial}\over{\partial\phi}}=
{{1}\over{\sin\phi}}\cos\phi{{\partial}\over{\partial\phi}}+{{1}\over{\sin\phi}}\sin\phi{{\partial^2}\over{\partial\phi^2}}
=\operatorname{ctg}\phi{{\partial}\over{\partial\phi}}+{{\partial^2}\over{\partial\phi^2}}
(7.38)

A teraz wyznaczmy drugą tożsamość operatorową wykorzystując twierdzenie o pochodnej iloczynu i z faktu istnienia jedynki operatorowej, zatem to drugie przekształcenie operatorowe możemy napisać sposobem:

{{1}\over{\rho}}{{\partial^2}\over{\partial \rho^2}}(\rho)={{1}\over{\rho}}{{\partial}\over{\partial \rho}}{{\partial}\over{\partial \rho}}(\rho)={{1}\over{\rho}}{{\partial}\over{\partial \rho}}(r{{\partial}\over{\partial \rho}}+\hat{1})={{\partial^2}\over{\partial \rho^2}}+{{2}\over{\rho}}{{\partial}\over{\partial \rho}}
(7.39)

Operator Δ napisanej początkowo w punkcie (7.37) przy przekształceniach przeprowadzonych według (7.38) i (7.39) na pewnych wyrażeniach operatorowych, to wzór na operator Δ we współrzędnych kulistych piszemy wedle sposobu:

\Delta={{1}\over{\rho}}{{\partial^2}\over{\partial \rho^2}}(\rho)+{{1}\over{\rho^2}}\left({{1}\over{\sin^2\phi}}{{\partial^2}\over{\partial\theta^2}}+{{1}\over{\sin\phi}}{{\partial}\over{\partial\phi}}\sin\phi{{\partial}\over{\partial\phi}}\right)
(7.40)

Powyższe równanie na Δ (7.40) można inaczej przedstawić przy pomocy operatora Λ, gdzie ten ostatni operator zależy tylko od współrzędnych kątowych w kulistym układzie współrzędnym:

\Delta={{1}\over{\rho}}{{\partial^2}\over{\partial \rho^2}}(\rho)+{{1}\over{\rho^2}}\Lambda
(7.41)
  • gdzie definicja operatora Λ:
\Lambda={{1}\over{\sin^2\phi}}{{\partial^2}\over{\partial\theta^2}}+{{1}\over{\sin\phi}}{{\partial}\over{\partial\phi}}\sin\phi{{\partial}\over{\partial\phi}}
(7.42)

[edytuj] Rotacja we współrzędnych kartezjańskich, cylindrycznych i kulistych

[edytuj] Rotacja we współrzędnych kartezjańskiej

Rotacje operatora nabla przy działaniu na jej funkcję wektorową \vec{f}\; piszemy na podstawie definicji iloczynu wektorowego zapisanego w punkcie (1.16):

\nabla\times\vec{f}=\begin{vmatrix}
\vec{i}&\vec{j}&\vec{k}\\
{{\partial}\over{\partial x}}&{{\partial}\over{\partial y}}&{{\partial}\over{\partial z}}\\
f_x&f_y&f_z
\end{vmatrix}=
\vec{i}\left({{\partial f_z}\over{\partial y}}-{{\partial f_y}\over{\partial z}}\right)+\vec{j}\left({{\partial f_x}\over{\partial z}}-{{\partial f_z}\over{\partial x}}\right)+\vec{k}\left({{\partial f_y}\over{\partial x}}-{{\partial f_x}\over{\partial y}}\right)
(7.43)

[edytuj] Rotacja we współrzędnych cylindrycznych

Aby wyznaczyć we współrzędnych cylindrycznych wektor \vec{f}\;, w którym to w układzie współrzędnych obowiązują wektory ortogonalne:

\vec{f}=\sum_i f_i\vec{e}_i\;
(7.44)

Bardzo ważnym dla nas spotkaniem jest policzenie współrzędnych kartezjańskich w zależności od współrzędnych cylindrycznego układu współrzędnych, zatem korzystając ze wzorów na wektory bazowe cylindrycznym układzie współrzędnym, tzn. wektory (7.12), (7.15) i (7.18), wtedy możemy wyznaczyć trzy równania tworzące układ równań:

\begin{cases}
f_x=f_{\rho}\cos\theta-f_{\theta}\sin\theta\\
f_y=f_{\rho}\sin\theta+f_{\theta}\cos\theta\\
f_z=f_z
\end{cases}\;
(7.45)

Operatory jednostkowe w cylindrycznym układzie współrzędnych w zależności od wersorów w kartezjańskim układzie współrzędnych są:

\begin{cases}
\vec{i}\cos\theta+\vec{j}\sin\theta=\vec{e}_{\rho}\\
-\vec{j}\sin\theta+\vec{j}\cos\theta=\vec{e}_{\theta}\\
\vec{k}=\vec{e}_z
\end{cases}\;
(7.46)

Wyznaczmy wektory jednostkowe w kartezjańskiego układzie współrzędnych, wiedząc, że wyznacznik główny układu równań (7.46) jest równy jeden, wtedy możemy wyznaczyć te wektory, bo wspomniany układ jest układem Cramera:

\begin{cases}
\vec{i}=\vec{e}_{\rho}\cos\theta-\sin\theta\vec{e}_{\theta}\\
\vec{j}=\cos\theta\vec{e}_{\theta}+\sin\theta\vec{e}_{\rho}\end{cases}\;
(7.47)

Mając otrzymane wzory napisane w punkcie (7.47), które są przepisem na wektory jednostkowe w kartezjańskim układzie współrzędnych w zależności od wektorów ortogonalnej bazy w układzie cylindrycznym, a także korzystając z trzech tożsamości (7.45), wtedy możemy napisać rotację wektora \vec{f}\; używając jego formalnej definicji (7.43):

\nabla\times\vec{f}=\left(\vec{e}_{\rho}\cos\theta-\sin\theta\vec{e}_{\theta}\right)\left[\left(\sin\theta{{\partial}\over{\partial\rho}}+{{\cos\theta}\over{\rho}}{{\partial}\over{\partial\theta}}\right)f_z-\left({{\partial }\over{\partial z}}\right)\left(f_{\rho}\sin\theta+f_{\theta}\cos\theta\right)\right]+\;

+\left(\cos\theta\vec{e}_{\theta}+\sin\theta\vec{e}_{\rho}\right)\left[{{\partial}\over{\partial z}}\left(f_{\rho}\cos\theta-f_{\theta}\sin\theta\right)-\left(\cos\theta{{\partial}\over{\partial\rho}}-{{\sin\theta}\over{\rho}}{{\partial}\over{\partial\theta}}\right)f_z\right]+\;

+\vec{e}_z\Bigg[\left(\cos\theta{{\partial}\over{\partial\rho}}-{{\sin\theta}\over{\rho}}{{\partial}\over{\partial\theta}}\right)\left(f_{\rho}\sin\theta+\cos\theta f_{\theta}\right)-\;
-\left(\sin\theta {{\partial}\over{\partial\rho}}+{{\cos\theta}\over{\rho}}{{\partial}\over{\partial\theta}}\right)\left(f_{\rho}\cos\theta-f_{\theta}\sin\theta\right)\Bigg]=
=
\vec{e}_{\rho}\Bigg[\cos\theta\sin\theta{{\partial f_z}\over{\partial\rho}}+{{\cos^2\theta}\over{\rho}}{{\partial f_z}\over{\partial\theta}}-\sin\theta\cos\theta{{\partial f_{\rho}}\over{\partial z}}-\cos^2\theta {{\partial f_{\theta}}\over{\partial z}}+\sin\theta\cos\theta {{\partial f_{\rho}}\over{\partial z}}-\sin^2\theta {{\partial f_{\theta}}\over{\partial z}}+\;
-\sin\theta\cos\theta{{\partial f_z}\over{\partial\rho}}+{{\sin^2\theta}\over{\rho}}{{\partial f_z}\over{\partial\theta}}\Bigg]+\;
+
\vec{e}_{\theta}\Bigg[
-\sin^2\theta{{\partial f_z}\over{\partial\rho}}-{{\sin\theta\cos\theta}\over{\rho}}{{\partial f_z}\over{\partial\theta}}+\sin^2\theta{{\partial f_{\rho}}\over{\partial z}}+\sin\theta\cos\theta{{\partial f_{\theta}}\over{\partial z}}
+\cos^2\theta{{\partial f_{\rho}}\over{\partial z}}+\;
-\cos\theta\sin\theta{{\partial f_{\theta}}\over{\partial z}}-\cos^2\theta{{\partial f_z}\over{\partial\rho}}+{{\cos\theta\sin\theta}\over{\rho}}{{\partial f_z}\over{\partial\theta}}\Bigg]+

\vec{e}_z\Bigg[\cos\theta\sin\theta{{\partial f_{\rho}}\over{\partial\rho}}+\cos^2\theta{{\partial f_{\theta}}\over{\partial \rho}}-{{\sin^2\theta}\over{\rho}}{{\partial f_{\rho}}\over{\partial\theta}}-{{\cos\theta\sin\theta}\over{\rho}}f_{r}-{{\sin\theta\cos\theta}\over{\rho}}{{\partial f_{\theta}}\over{\partial\theta}}+
+{{\sin^2\theta}\over{\rho}}f_{\theta}-\sin\theta\cos\theta{{\partial f_{\rho}}\over{\partial  \rho}}+\sin^2\theta{{\partial f_{\theta}}\over{\partial\rho}}-{{\cos^2\theta}\over{\rho}}{{\partial f_{\rho}}\over{\partial\theta}}+{{\cos\theta\sin\theta}\over{\rho}}f_{\rho}+\;
+{{\cos\theta\sin\theta}\over{\rho}}{{\partial f_{\theta}}\over{\partial \theta}}+{{\cos^2\theta}\over{\rho}}f_{\theta}
\Bigg]=
=
\vec{e}_{\rho}\left[{{1}\over{\rho}}{{\partial f_z}\over{\partial}\theta}-{{\partial f_{\theta}}\over{\partial  z}}\right]
+\vec{e}_{\theta}\left[{{\partial f_{\rho}}\over{\partial z}}-{{\partial f_z}\over{\partial \rho}}\right]
+\vec{e}_z\left[{{\partial f_{\theta}}\over{\partial\rho}}-{{1}\over{\rho}}{{\partial f_{\rho}}\over{\partial\theta}}+{{1}\over{r}}f_{\theta}\right]
(7.48)

Rotacja wektora \vec{f}\;, która jest zdefiniowana przy pomocy argumentów cylindrycznego układu współrzędnych jest napisana w troszeczkę uproszczonej postaci, ale równoważnej do rotacji obliczonego w punkcie (7.48), to w końcu dochodzimy do wniosku:

\operatorname{rot}\vec{f}=\nabla\times\vec{v}=
\vec{e}_{\rho}\left[{{1}\over{\rho}}{{\partial f_z}\over{\partial}\theta}-{{\partial f_{\theta}}\over{\partial  z}}\right]
+\vec{e}_{\theta}\left[{{\partial f_{\rho}}\over{\partial z}}-{{\partial f_z}\over{\partial \rho}}\right]
+\vec{e}_z{{1}\over{\rho}}\left[{{\partial(\rho f_{\theta})}\over{\partial\rho}}-{{\partial f_z}\over{\partial\theta}}\right]\;
(7.49)

[edytuj] Rotacja we współrzędnych kulistej

Aby wyznaczyć całkę we współrzędnych cylindrycznych, to wektor \vec{f}\;, w którym to układzie współrzędnych obowiązują wektory ortogonalizowane, piszemy wedle:

\vec{f}=\sum_i f_i\vec{e}_i\;
(7.50)

Bardzo ważnym dla spotkaniem jest policzenie współrzędnych kartezjańskich w zależności od współrzędnych kulistego układu współrzędnych, zatem korzystając ze wzorów na wektory bazowe w naszym układzie współrzędnym, tzn. wektory (7.23), (7.26) i (7.29), zatem możemy wyznaczyć trzy równania tworzące układ równań:


\begin{cases}
f_x=f_{\rho}\cos\theta\sin\phi -f_{\theta}\sin\theta  +f_{\phi}\cos\theta\cos\phi\\
f_y=f_{\rho}\sin\theta\sin\phi +f_{\theta}\cos\theta  +f_{\phi}\sin\theta\cos\phi\\
f_z=f_{\rho}\cos\phi                                  -f_{\phi}\sin\phi\\
\end{cases}\;
(7.51)

Wyznaczmy operatory jednostkowe w kartezjańskim układzie współrzędnych w zależności od wektorów bazy jednostkowej cylindrycznego układu współrzędnych:

\begin{cases}
\vec{e}_r=\vec{i}\cos\theta\sin\phi+\vec{j}\sin\theta\sin\phi+\vec{k}\cos\phi\\
\vec{e}_{\theta}=-\vec{i}\sin\theta+\vec{j}\cos\theta\\
\vec{e}_{\phi}=\vec{i}\cos\theta\cos\phi+\vec{j}\sin\theta\cos\phi-\vec{k}\sin\phi
\end{cases}
(7.52)

Wyznaczmy wyznacznik główny układu równań określonych w punkcie (7.52), którego definicja jest dla powyższego układu równań:

W=\begin{vmatrix}
\cos\theta\sin\phi&\sin\theta\sin\phi&\cos\phi\\
-\sin\theta&\cos\theta&0\\
\cos\theta\cos\phi&\sin\theta\cos\phi&-\sin\phi
\end{vmatrix}=\;
=\cos\phi\begin{vmatrix}
-\sin\theta&\cos\theta\\
\cos\theta\cos\phi&\sin\theta\cos\phi
\end{vmatrix}-\sin\phi\begin{vmatrix}
\cos\theta\sin\phi&\sin\theta\sin\phi\\
-\sin\theta&\cos\theta\\
\end{vmatrix}=\;

\cos\phi\left(-\sin^2\theta\cos\phi-\cos^2\theta\cos\phi\right)-\sin\phi\left(\cos^2\theta\sin\phi+\sin^2\theta\sin\phi\right)=
-\cos^2\phi-\sin^2\phi=-1\;
(7.53)

Na podstawie obliczeń przeprowadzonych w punkcie (7.53) wyznacznik główny układu równań (7.52) jest równy minus jeden, czyli jego wartość bezwzględna jest równa jeden, co nam ułatwi później bardzo obliczenia. Następnym krokiem dla naszego rozważanego układu równań (7.52) jest wyznaczenie wyznacznika:


W_x=\begin{vmatrix}
\vec{e}_r&\sin\theta\sin\phi&\cos\phi\\
\vec{e}_{\theta}&\cos\theta&0\\
\vec{e}_{\phi}&\sin\theta\cos\phi&-\sin\phi
\end{vmatrix}=\;
=
\cos\phi\begin{vmatrix}
\vec{e}_{\theta}&\cos\theta\\
\vec{e}_{\phi}&\sin\theta\cos\phi
\end{vmatrix}-\sin\phi\begin{vmatrix}
\vec{e}_r&\sin\theta\sin\phi\\
\vec{e}_{\theta}&\cos\theta
\end{vmatrix}=
=
\cos\phi\left(\vec{e}_{\theta}\sin\theta\cos\phi-\vec{e}_{\phi}\cos\theta\right)-\sin\phi\left(\vec{e}_r\cos\theta-\vec{e}_{\theta}\sin\theta\sin\phi\right)=

-\vec{e}_r\cos\theta\sin\phi+\vec{e}_{\theta}\left(\sin\theta\cos^2\phi+\sin\theta\sin^2\phi\right)-\vec{e}_{\phi}\cos\theta\cos\phi=

-\vec{e}_r\cos\theta\sin\phi+\vec{e}_{\theta}\sin\theta-\vec{e}_{\phi}\cos\theta\cos\phi
(7.54)

Następnym krokiem jest wyznaczenie wyznacznika Wy dla układu równań (7.52):


W_y=\begin{vmatrix}
\cos\theta\sin\phi&\vec{e}_r&\cos\phi\\
-\sin\theta&\vec{e}_{\theta}&0\\
\cos\theta\cos\phi&\vec{e}_{\phi}&-\sin\phi\\
\end{vmatrix}=

=\cos\phi\begin{vmatrix}
-\sin\theta&\vec{e}_{\theta}\\
\cos\theta\cos\phi&\vec{e}_{\phi}
\end{vmatrix}-\sin\phi\begin{vmatrix}
\cos\theta\sin\phi&\vec{e}_r\\
-\sin\theta&\vec{e}_{\theta}
\end{vmatrix}=

\cos\phi\left(-\sin\theta\vec{e}_{\phi}-\cos\theta\cos\phi\vec{e}_{\theta}\right)-\sin\phi\left(\cos\theta\sin\phi\vec{e}_{\theta}+\sin\theta\vec{e}_r\right)=

=-\vec{e}_r\sin\theta\sin\phi+\vec{e}_{\theta}\left(-\cos\theta\cos^2\phi-\cos\theta\sin^2\phi\right)+\vec{e}_{\phi}\left(-\sin\theta\cos\phi\right)=

=-\vec{e}_r\sin\theta\sin\phi-\vec{e}_{\theta}\cos\theta-\vec{e}_{\phi}\sin\theta\cos\phi
(7.55)

Następnym krokiem jest wyznaczenie wyznacznika Wz dla układu równań (7.52):


W_z=\begin{vmatrix}
\cos\theta\sin\phi&\sin\theta\sin\phi&\vec{e}_r\\
-\sin\theta&\cos\theta&\vec{e}_{\theta}\\
\cos\theta\cos\phi&\sin\theta\cos\phi&\vec{e}_{\phi}\end{vmatrix}=

=\vec{e}_r\begin{vmatrix}
-\sin\theta&\cos\theta\\
\cos\theta\cos\phi&\sin\theta\cos\phi\\
\end{vmatrix}-
\vec{e}_{\theta}\begin{vmatrix}
\cos\theta\sin\phi&\sin\theta\sin\phi\\
\cos\theta\cos\phi&\sin\theta\cos\phi\end{vmatrix}
+\vec{e}_{\phi}\begin{vmatrix}
\cos\theta\sin\phi&\sin\theta\sin\phi\\
-\sin\theta&\cos\theta
\end{vmatrix}=

\vec{e}_r\left(-\sin^2\theta\cos\phi-\cos^2\theta\cos\phi\right)-\vec{e}_{\theta}\left(\sin\theta\cos\theta\sin\phi\cos\phi-\sin\theta\cos\theta\sin\phi\cos\phi\right)+\;
+\vec{e}_{\phi}\left(\cos^2\theta\sin\phi+\sin^2\theta\sin\phi\right)=-\vec{e}_r\cos\phi+\vec{e}_{\phi}\sin\phi\;
(7.56)

Wyznaczmy czemu są równe wektory jednostkowe w kartezjańskim układzie współrzędnych w zależności od wektorów w kulistym układzie odniesienia wykorzystując fakt, że macierz główna układu W, czyli układu (7.53) jest równa minus jeden, i wyznaczniki Wi, które są już wyznaczone w punktach (7.54), (7.55) i (7.56), zatem te wersory obowiązujące w układzie kartezjańskim w zależność od wersorów w układzie kulistymi są napisane:

\begin{cases}
\vec{i}=\vec{e}_r\cos\theta\sin\phi-\vec{e}_{\theta}\sin\theta+\vec{e}_{\phi}\cos\theta\cos\phi\\
\vec{j}=\vec{e}_r\sin\theta\sin\phi+\vec{e}_{\theta}\cos\theta+\vec{e}_{\phi}\sin\theta\cos\phi\\
\vec{k}=\vec{e}_r\cos\phi-\vec{e}_{\phi}\sin\phi
\end{cases}\;
(7.57)

Otrzymane wzory napisane w punkcie (7.57), które są przepisem na wektory jednostkowe w kartezjańskim układzie współrzędnych w zależności od wektorów ortogonalnej bazy w układzie kulistym, a także korzystając z trzech tożsamości (7.51), zatem możemy napisać rotację wektora \vec{f}\; używając jego formalnej definicji w układzie współrzędnych kartezjańskich (7.43):

\operatorname{rot}\vec{f}=\nabla\times\vec{f}=
\left(\vec{e}_r\cos\theta\sin\phi-\vec{e}_{\theta}\sin\theta+\vec{e}_{\phi}\cos\theta\cos\phi\right)\left({{\partial f_z}\over{\partial y}}-{{\partial f_y}\over{\partial z}}\right)+\;
+\left(\vec{e}_r\sin\theta\sin\phi+\vec{e}_{\theta}\cos\theta+\vec{e}_{\phi}\sin\theta\cos\phi\right)\left({{\partial f_x}\over{\partial z}}-{{\partial f_z}\over{\partial x}}\right)+\;
+\left(\vec{e}_r\cos\phi-\vec{e}_{\phi}\sin\phi\right)\left({{\partial f_y}\over{\partial x}}-{{\partial f_x}\over{\partial y}}\right)=\;

\vec{e}_r\left[\cos\theta\sin\phi\left({{\partial f_z}\over{\partial y}}-{{\partial f_y}\over{\partial z}}\right)+\sin\theta\sin\phi\left({{\partial f_x}\over{\partial z}}-{{\partial f_z}\over{\partial x}}\right)+\cos\phi\left({{\partial f_y}\over{\partial x}}-{{\partial f_x}\over{\partial y}}\right)\right]+\;

+\vec{e}_{\theta}\left[-\sin\theta\left({{\partial f_z}\over{\partial y}}-{{\partial f_y}\over{\partial z}}\right)+\cos\theta\left({{\partial f_x}\over{\partial z}}-{{\partial f_z}\over{\partial x}}\right)\right]+\;
+\vec{e}_{\Phi}\left[\cos\theta\cos\phi\left({{\partial f_z}\over{\partial y}}-{{\partial f_y}\over{\partial z}}\right)+\sin\theta\cos\phi\left({{\partial f_x}\over{\partial z}}-{{\partial f_z}\over{\partial x}}\right)-\sin\phi\left({{\partial f_y}\over{\partial x}}-{{\partial f_x}\over{\partial y}}\right)\right]
(7.58)

Podamy teraz końcowy wzór na rotację wektora \vec{f}\;, wyprowadzonych przy pomocy wzorów (7.30), a także (7.51) i (7.57), to dochodzimy do końcowego wzoru wynikający z (7.58):

\nabla\times\vec{f}={{1}\over{\rho\sin\phi}}\left[{{\partial(\sin\phi f_{\theta})}\over{\partial\phi}}-{{\partial f_{\phi}}\over{\partial\theta}}\right]\vec{e}_r+{{1}\over{\rho}}\left[{{\partial(\rho f_{\phi})}\over{\partial r}}-{{\partial f_{\rho}}\over{\partial\phi}}\right]\vec{e}_{\theta}+{{1}\over{\rho}}\left[{{1}\over{\sin\phi}}{{\partial f_r}\over{\partial\theta}}-{{\partial(\rho v_{\theta})}\over{\partial\rho}}\right]
(7.58)

[edytuj] Pochodne iloczynów

[edytuj] Tożsamość pierwsza

Tutaj będziemy wyznaczać niektóre tożsamości, korzystając z właności operatora ∇, zatem przejdźmy do naszych dowodów:

\nabla\left(\vec{A}\vec{B}\right)=\vec{A}\times\left(\nabla\times\vec{B}\right)+\vec{B}\times(\nabla\times\vec{A})+(\vec{A}\nabla)\vec{B}+(\vec{B}\nabla)\vec{A}\;
(7.59)

Oto dowód pierwszej tożsamości przedstawia się:

\vec{A}\times\left(\nabla\times\vec{B}\right)+\vec{B}\times(\nabla\times\vec{A})+(\vec{A}\nabla)\vec{B}+(\vec{B}\nabla)\vec{A}=\;
=
\epsilon_{ijk}\epsilon_{klm}A_j\nabla_lB_m+\epsilon_{ijk}\epsilon_{klm}A_j\nabla_lB_m+(A_s\nabla_s)B_i+(B_s\nabla_s)A_{i}=\;

=(\delta_{il}\delta_{jm}-\delta_{im}\delta_{jl})A_j\nabla_lB_m+\left(\delta_{il}\delta_{jm}-\delta_{im}\delta_{jl}\right)A_j\nabla_lB_m+(A_s\nabla_s)B_i+(B_s\nabla_s)A_{i}=\;

=A_m\nabla_iB_m-A_j\nabla_j B_i+B_m\nabla_iA_m-B_j\nabla_j A_i+(A_s\nabla_s)B_i+(B_s\nabla_s)A_{i}=\;
=A_m\nabla_iB_m+B_m\nabla_iA_m=\nabla_i(A_mB_m)=\nabla(\vec{A}\vec{B})\;

[edytuj] Tożsamość druga

Tożsamość druga przedstawia się wzorem:

\nabla(f\vec{A})=f(\nabla\vec{A})+\vec{A}(\nabla f)\;
(7.60)

Oto dowód drugiej tożsamości przedstawia się:

\nabla(f\vec{A})=\nabla i(f A_i)=f\nabla_i A_i+A_i\nabla f=f(\nabla\vec{A})+\vec{A}(\nabla f)\;

[edytuj] Tożsamość trzecia

Tożsamość trzecia przedstawia się wzorem:

\nabla(\vec{A}\times\vec{B})=\vec{B}\times(\nabla\times\vec{A})-\vec{A}\cdot(\nabla\times\vec{B})\;
(7.61)

Oto dowód trzeciej tożsamości przedstawia się:

\nabla(\vec{A}\times\vec{B})=\nabla_i\epsilon_{ijk}A_jB_k=A_j\epsilon_{ijk}\nabla_iB_k+B_k\epsilon_{ijk}\nabla_iB_k=-A_j\epsilon_{jik}\nabla_iB_k+B_k\epsilon_{kij}\nabla_iB_k=\;
=\vec{B}\times(\nabla\times\vec{A})-\vec{A}\cdot(\nabla\times\vec{B})\;

[edytuj] Tożsamości czwarta

Tożsamość czwarta przedstawia się wzorem:

\nabla\times(f\vec{A})=f(\nabla\times\vec{A})-\vec{A}\times\left(\nabla f\right)\;
(7.62)

Oto dowód czwartej tożsamości przedstawia się:

\nabla\times(f\vec{A})=\epsilon_{ijk}\nabla_jfA_k=\epsilon_{ijk}(f\nabla_jA_k+A_k\nabla_jf)=\epsilon_{ijk}\nabla_jA_k-\epsilon_{ikj}A_k\nabla_jf)=\;
=f(\nabla\times\vec{A})-\vec{A}\times\left(\nabla f\right)\;

[edytuj] Tożsamość piąta

Tożsamość piąta przedstawia się wzorem:

\nabla\times\left(\vec{A}\times\vec{B}\right)=(\vec{B}\nabla)\vec{A}-(\vec{A}\nabla)\vec{B}+\vec{A}(\nabla\vec{B})-\vec{B}(\nabla\vec{A})\;
(7.63)

Oto dowód piątej tożsamości przedstawia się:

\epsilon_{ijk}\epsilon_{klm}\nabla_j A_lB_m=\left(\delta_{il}\delta_{jm}-\delta_{im}\delta_{jl}\right)\nabla_jA_lB_m=
\nabla_m A_iB_m-\nabla_mA_mB_i=\;
=A_i\nabla_mB_m+B_m\nabla_mA_i-A_m\nabla_mB_i-B_i\nabla_m A_m=\vec{A}(\nabla\vec{B})+(\vec{B}\nabla)\vec{A}-(\vec{A}\nabla)\vec{B}-\vec{B}(\nabla\vec{A})\;

[edytuj] Twierdzenia całkowe

Tutaj podamy pewne twierdzenia całkowe z dowodami, tzn. twierdzenie gradientów, prawo Gaussa i Stokesa, którego to dowody przestawimy poniżej.

[edytuj] Twierdzenie dla gradientów

Twierdzenie dla gradientów przedstawia całkowanie funkcji ∇f od punktu \vec{a}\; do punktu \vec{b}\; i otrzymujemy podobny wzór jak przy całkowaniu na lini prostej, zatem to twierdzenie przedstawiamy:

\int_{\vec{a}}^{\vec{b}}\left(\nabla f\right)d\vec{l}=f(\vec{b})-f(\vec{a})\;
(7.64)

Aby udowodnić wzór (7.64) należy policzyć wyrażenie przy założeniu, że \vec{n}\; jest wektorem jednostkowym skierowanych w kierunku różniczkowania w przestrzeni trójwymiarowej:

{{df(\vec{x})}\over{\partial l}}={{\partial f(\vec{x})}\over{\partial x_i}}{{dx_i}\over{dl}}=\nabla f(\vec{x})\vec{n}\Rightarrow d{f}(x)=\nabla{f}(\vec{x})\vec{n}dl\Rightarrow df(\vec{x})=\nabla f(\vec{x})d\vec{l}\;
(7.65)

Na podstawie końcowego wniosku wynikających z obliczeń (7.65), które całkujemy obustronnie całką oznaczoną od punktu \vec{a}\; do punktu \vec{b}\;, zatem stąd wniosek, że twierdzenie dla gradientów (7.64) jest spełnione.

[edytuj] Twierdzenie Gaussa (tzn. twierdzenie dywergencji)

Załóżmy, że mamy pewną objętość zamkniętą ograniczoną powierzchnią zamkniętą, gdzie d\vec{S}\; jest infinitezymalnym elementem tejże powierzchni, zatem to nasze wspomniane wyżej twierdzenie przyjmuje postać:

\int(\nabla\cdot\vec{A})dV=\oint\vec{A}d\vec{S}\;
(7.66)

Aby udowodnić wzór (7.66) musimy podać wzór na dywergencją wektora \vec{A}\;, którą nazywamy w analizie matematycznej wielkość określona:

\operatorname{div}\vec{A}=\lim_{V\rightarrow 0}{{\oint\vec{A}d\vec{S}}\over{V}}\;
(7.67)

Wyobraźmy sobie teraz pewien sześcian o objętości dążącej do zera, dla którego wyznaczymy dywergencję wektora\vec{A}\;, zatem niech w środku tego sześcianu istnieje pewien wektor \vec{A}\;, w takim przypadku:

\operatorname{div}\vec{A}dxdydz=\left(\vec{A}+{{\partial\vec{A}}\over{\partial z}}{{1}\over{2}}dz\right)dxdy+\left(-\vec{A}+{{\partial\vec{A}}\over{\partial y}}{{1}\over{2}}dy\right)dxdz+\left(\vec{A}+{{\partial\vec{A}}\over{\partial y}}{{1}\over{2}}dy\right)dxdz+\;
+\left(-\vec{A}+{{\partial\vec{A}}\over{\partial z}}{{1}\over{2}}dz\right)dxdy+\left(\vec{A}+{{\partial\vec{A}}\over{\partial x}}{{1}\over{2}}dx\right)dydz+\left(-\vec{A}+{{\partial\vec{A}}\over{\partial x}}{{1}\over{2}}dx\right)dydz=\;
=



\left({{\partial \vec{A}}\over{\partial x}}+{{\partial\vec{A}}\over{\partial y}}+{{\partial\vec{A}}\over{\partial z}}\right)dxdydz=\left({{\partial \vec{A}}\over{\partial x}}+{{\partial\vec{A}}\over{\partial y}}+{{\partial\vec{A}}\over{\partial z}}\right)dxdydz\Rightarrow\nabla\vec{A}=\operatorname{div}\vec{A}\;
(7.68)

Na podstawie obliczeń przeprowadzonych w punkcie (7.67) dywergencja wektora \vec{A}\; jest to działanie operatora ∇ na wspomnianą wcześniej funkcję wektorową, zatem na podstawie definicji dywergencji pewnej funkcji wektorowej (7.67) prawo Gaussa (7.66) jest twierdzeniem udowodnionym.

[edytuj] Twierdzenie Stokesa (tj. dla rotacji)

Załózmy, że mamy powierzchnię ograniczoną pewnym zamkniętym konturem, wtedy prawo Stokesa przedstawiamy:

\int\left(\nabla\times\vec{A}\right)\cdot d\vec {S}=\oint\vec{A}d\vec{l}\;
(7.69)

Rzut na wektor jednostkowy rotacji pewnej funkcji wektorowej, tzn. ten rzut jest dodatni gdy pokrywa się ten rzut z kierunkiem wektora jednostkowego _{\vec{n}}\;, w którym, to definicji wprowadzimy powierzchnię S nieskończenie małą, którego ogranicza pewny kontur obiegany odwrotnie względem ruchu wskazówek zegara, którego zwrot naszego wektora jednostkowego jest do góry tej powierzchni (nad zegarem), nazywamy wielkością określoną:

\left(\operatorname{rot}\vec{A}\right)_n=\lim_{S\rightarrow 0}{{\oint \vec{A}d\vec{l}}\over{S}}\;
(7.70)

We wzorze (7.70) rotacją wektora \vec{A}\;, nazywamy rotacją wzdłuż wektora normalnego \vec{n}\;, którego wartość jest określona wspomnianym wyżej wzorem, jeśli będziemy określać współrzędną iksową rotacji, to należy obrać prostokąt prostopadły do osi iksowej, ale ten wektor normalny powinien mieć ten sam zwrot co ta nasza oś, wtedy iloczyn współrzędnej iksowej rotacji i współrzędnej malutkiego elementy powierzchni wektora prostopadłego do tego wycinka powierzchni względem osi iksowej określamy przez:

\left(\operatorname{rot}\vec{A}\right)_xdydz=\left(A_z+{{\partial A_z}\over{\partial y}}{{1}\over{2}}dy\right)dz+\left(-A_z+{{\partial A_z}\over{\partial y}}{{1}\over{2}}dy\right)dz-\left(A_y+{{\partial A_y}\over{\partial z}}{{1}\over{2}}dz\right)dy+\;
-\left(-A_y+{{\partial A_y}\over{\partial z}}{{1}\over{2}}dz\right)dy=\left({{\partial A_z}\over{\partial y}}-{{\partial A_y}\over{\partial z}}\right)dzdy\Rightarrow\left(\operatorname{rot}\vec{A}\right)_x={{\partial A_z}\over{\partial y}}-{{\partial A_y}\over{\partial z}}\;
(7.71)

Aby wyznaczyć współrzędną igrekową i zetową rotacji wektora \vec{A}\; możemy policzyć zmieniając w sposób cykliczny zmienne z zestawu zmiennych x,y,z w powyższych obliczeniach, to rotacja wspomnianego wektora:

\operatorname{rot}\vec{A}=\left({{\partial A_z}\over{\partial y}}-{{\partial A_y}\over{\partial z}}\right)\vec{i}+\left({{\partial A_x}\over{\partial z}}-{{\partial A_z}\over{\partial x}}\right)\vec{j}+\left({{\partial A_y}\over{\partial x}}-{{\partial A_x}\over{\partial y}}\right)\vec{k}=\nabla\times\vec{A}\;
(7.72)

Mając już zdefiniowaną rotację naszego wektora, która jest równa iloczynowi wektorowemu operatora ∇ i naszego wektora. Znając wzór (7.70) definicją rotacji możemy zapisać dla bardzo małego prostokącika w przybliżeniu:

\operatorname{rot}\vec{A}\vec{S}\simeq\oint_S\vec{A}d\vec{l}\;
(7.73)

Całą powierzchnię ograniczoną konturem zamkniętym dzielimy na malutkie prostokąciki, by te prostokąciki były równoległe wobec siebie na tej zamkniętej powierzchni, zatem cyrkulacja dla krzywej ograniczającej wielką powierzchnię jest równa sumie cyrkulacji po małych powierzchniach wcześniej określonych, można tak powiedzieć, bo cyrkulacja po małym wycinku danej powierzchni redukuje się częściowo z całką, które różnią się znakiem na tym samym wspólnym boku, czyli należącego do dwóch malutkich powierzchni. Na podstawie powyższych rozważań piszemy wzór (7.73) dla S bardzo małego, którego to biorąc całkę na obu stronach naszej przybliżonej tożsamości po małych prostokącikach, co stąd wynika wzór (7.69). Co kończy dowód.

[edytuj] Wprowadzenie do funkcji zespolonej

Będziemy się tutaj zajmować funkcjami, którego argumenty mają wartości zespolone, a wartością tejże opisywanej funkcji jest wartość należącej do zbioru liczb zespolonych.

[edytuj] Przestawienie algebraiczne liczb zespolonych

Płaszczyzna zespolona.

Wprowadźmy jednostkę liczb urojoną "i", którego kwadrat jest równy minus jeden, zatem każdą liczbę zespoloną piszemy:

z=\operatorname{Re}(z)+i \operatorname{Im}(z)=x+i y\;
(8.1)

Część rzeczywista liczby zespolonej zapisanej wzorem (8.1) oznaczamy symbolem Re(z), a część urojoną symbolem Im(z).

[edytuj] Płaszczyzna zespolona

Każdą liczbę zespoloną możemy przestawić w postaci punktu na płaszczyźnie zespolonej, bo liczby zespolone według wzoru (8.1) mają część rzeczywistą i urojoną, a część urojona występuje przy symbolu i. Wszystkie liczby zespolone wypełniają całą płaszczyznę zespoloną, co przestawiamy rysunkiem z prawej strony.

[edytuj] Przestawienie liczb zespolonych w postaci trygonometrycznej i eksponencjalnej

[edytuj] Przestawienie trygonometryczne

Postać trygonometryczna liczby zespolonej

Jeśli oś iksowa jest osią części rzeczywistej liczby zespolonej w przedstawieniu (8.1), a część igrekowa jest osią części urojonej wspomnianego przestawienia liczby zespolonej, co jest napisane według rysunku obok, liczbą zespoloną w przestawieniu zespolonej nazywamy przestawienie:

z=\rho\left(\cos\phi+i\sin\phi\right)\;
(8.2)
  • Gdzie modułem ρ liczby zespolonej nazywamy przestawienie zapisane przy pomocy części rzeczywistej i urojonej liczby zespolonej w postaci:
\rho=\sqrt{Re(z)^2+Im(z)^2}\;
(8.3)

[edytuj] Przestawienie eksponencjalne liczby zespolonej

Przestawieniem eksponencjalne liczby zespolonej nazywamy przestawienie w postaci wzoru:

z=\rho e^{i\phi}\;
(8.4)
  • gdzie kąt φ jest to ten sam kąt napisaną w przestawieniu trygonometrycznym we wzorze (8.2).

Aby wyznaczyć równoważność między oba przestawieniami liczby zespolonej, tzn. między (8.2) i (8.4) należy wyznaczyć wyrażenie poniżej, korzystając przestawienia funkcji kosinus i sinus w jego przedstawieniu według Taylora, wtedy:

\cos\phi+i\sin\phi=\left(1-{{\phi^2}\over{2!}}+{{\phi^4}\over{4!}}-...\right)+i\left(\phi-{{\phi^3}\over{3!}}+{{\phi^5}\over{5!}}+...\right)=\;
=
1+i\phi-{{\phi^2}\over{2!}}-i{{\phi^3}\over{3!}}+{{\phi^4}\over{4!}}+i{{\phi^5}\over{5!}}+...=1+(i\phi)+{{(i\phi)^2}\over{2!}}+{{(i\phi)^3}\over{3!}}+{{(i\phi)^4}\over{4!}}+{{(i\phi)^5}\over{5!}}+...=e^{i\phi}\;
(8.5)

Na podstawie obliczeń (8.5) wykazaliśmy równoważność wzorów (8.4) i (8.2).

[edytuj] Operacje różniczkowania na funkcjach zespolonych a funkcje holomorficzne

Jeśli funkcję zespoloną przestawimy jako funkcję jednej zmiennej zespolonej, czyli jako funkcje dwóch zmiennych rzeczywistych, wtedy z twierdzenia o różniczce zupełnej dla liczby zespolonej różniczkę funkcji f możemy napisać:

df={{\partial f}\over{\partial x}}dx+{{\partial f}\over{\partial y}}dy\;
(8.6)

Wzór (8.6) możemy zapisać w sposób równoważny (ale jego równoważność udowodnimy później) wedle sposobu:

df={{1}\over{2}}\left[{{\partial f}\over{\partial x}}-i{{\partial f}\over{\partial y}}\right]\left(dx+idy\right)+{{1}\over{2}}\left[{{\partial f}\over{\partial x}}+i{{\partial f}\over{\partial y}}\right]\left(dx-idy\right)\;
(8.7)

Aby przeprowadzić równoważność pomiędzy przestawieniami tej samej różniczki df, czyli wzorów (8.6) i (8.7) przy pomocy rozpisywania jej na części rzeczywistą i urojonej, co wynika z przestawienia liczby zespolonej (8.1).

df=\left\{{{1}\over{2}}\left[{{\partial f}\over{\partial x}}-i{{\partial f}\over{\partial y}}\right]+{{1}\over{2}}\left[{{\partial f}\over{\partial x}}+i{{\partial f}\over{\partial y}}\right]\right\}dx+i\left\{\left[{{\partial f}\over{\partial x}}-i{{\partial f}\over{\partial y}}\right]-{{1}\over{2}}\left[{{\partial f}\over{\partial x}}+i{{\partial f}\over{\partial y}}\right]\right\}dy=\;

={{\partial f}\over{\partial x}}dx+{{\partial f}\over{\partial y}}dy
(8.8)

Udowodniliśmy, że na podstawie obliczeń (8.8) równoważność wzorów (8.6) i (8.7), co było nam do udowodnienia.

Policzmy teraz dla funkcji zespolonej pochodną funkcją f względem liczby z, a także pochodną tej samej funkcji co poprzednio, ale względem liczby zespolonej sprzężonej do niego, co matematycznie te dwie pochodne piszemy:

{{\partial f}\over{\partial z}}={{1}\over{2}}\left[{{\partial f}\over{\partial x}}-i{{\partial f}\over{\partial y}}\right]\;
(8.9)
{{\partial f}\over{\partial\overline{z}}}={{1}\over{2}}\left[{{\partial f}\over{\partial x}}+i{{\partial f}\over{\partial y}}\right]\;
(8.10)

Wprowadzając oznaczenia (8.9) i (8.10) do wzoru (8.7), wtedy on przechodzi w:

df={{\partial f}\over{\partial z}}dz+{{\partial f}\over{\partial\overline{z}}}d\overline{z}\;
(8.11)

Funkcją holomorficzną nazywamy funkcję, który jest pochodną funkcji f względem \overline{z}\;, czyli wyrażenie (8.10) jest równe zero. Przestawmy funkcję zespoloną f(z) w postaci zespolonej przy pomocy funkcji u(x,y), która jest częścią rzeczywistą wspomnianej funkcji zespolonej, a także funkcji v(x,y), która jest częścią urojoną funkcji zespolonej, zatem tą naszą funkcję przestawiamy na podstawie (8.1) w postaci:

f(z)=u(x,y)+iv(x,y)\;
(8.12)

Pochodną cząstkową (8.10) piszemy przy pomocy wzoru (8.12) wedle sposobu:

{{\partial f}\over{\partial\overline{z}}}={{1}\over{2}}\left[\left({{\partial u}\over{\partial x}}+i{{\partial v}\over{\partial x}}\right)+i\left({{\partial u}\over{\partial y}}+i{{\partial v}\over{\partial y}}\right)\right]={{1}\over{2}}\left[{{\partial u}\over{\partial x}}-{{\partial v}\over{\partial y}}+i\left({{\partial v}\over{\partial x}}+{{\partial u}\over{\partial y}}\right)\right]\;
(8.13)

Aby funkcja f była funkcją holomorficzną, to na podstawie wzoru końcowego (8.13) muszą być spełnione związki:

{{\partial u}\over{\partial x}}={{\partial v}\over{\partial y}}\;
(8.14)
{{\partial u}\over{\partial y}}=-{{\partial v}\over{\partial x}}\;
(8.15)

[edytuj] Całkowanie we przestrzeni funkcji zespolonych

Całkowanie funkcji (8.12) po konturze w przestrzeni zespolonej nazywamy całkowaniem, które zapisujemy wedle wzoru:

\int_Cf(z)dz=\int_C(u+iv)(dx+idy)=\int_C\left(udx-vdy\right)+i\int_C\left(vdx+udy\right)\;
(8.16)

Jesli wykorzystamy twierdzenie Greena znanej z analizy matematycznej, otrzymujemy:

\int_C f(x,y)dx+g(x,y)dy=\int_S\left({{\partial g}\over{\partial x}}-{{\partial f}\over{\partial y}}\right)dxdy\;
(8.17)

Całkę (8.12), korzystając przy tym z twierdzenia całki okrężnej funkcji Greena, zapisujemy:

\oint_Cf(z)dz=\int_S\left(-{{\partial u}\over{\partial y}}-{{\partial v}\over{\partial x}}\right)dxdy+i\int_S\left({{\partial u}\over{\partial x}}-{{\partial v}\over{\partial y}}\right)dxdy\;
(8.18)

Dla funkcji holomorficznej całka okrężna (8.18), a stąd również (8.16), czyli na podstawie wzorów (8.14) i (8.15), przyjmuje wartość zero.

[edytuj] Wyprowadzenie wzoru całkowego Cauchy'ego

Jest to formuła dla funkcji napisanych w przestrzeni zespolonej, która jest pewną całką zapisaną w przestrzeni zespolonej, którego schemat:

f(z)={{1}\over{2\pi i}}\oint {{f(t)}\over{t-z}}dt\;
(8.19)

Całkowanie występujące we wzorze (8.19) możemy tak przekształcić, by po dokonaniu do niego podstawienia _{t-z=re^{i\phi}}\;, co stąd możemy napisać wzór na dt, czyli _{dt=ire^{i\phi}dt}\;, by otrzymać w ostateczności przekształcone wyrażenie całkowe:

\oint{{f(t)}\over{t-z}}dt=\oint{{f(t+re^{i\phi})}\over{re^{i\phi}}}ire^{i\phi}d\phi=i\oint f(z+re^{\phi})d\phi\;
(8.20)

Możemy wybrać takie całkowanie wokół punktu osobliwego z, by promień okręgu okalająca wspomniany punkt osobliwy by dążył do zera, zatem całkę (8.18) piszemy wedle:

i\oint f(z+re^{\phi})d\phi=i\int_0^{2\pi} f(z_0)d\phi=if(z_0)\int_0^{2\pi} d\phi=2\pi i f(z_0)\;
(8.21)

Na podstawie wzorów (8.21), (8.20) dochodzimy do wniosku, że spełniony jest wzór (8.19).

[edytuj] Definicja szeregu Laurenta i wyznaczenie czynników w tym szeregu

Szeregiem Laurenta nazywamy szereg określony wzorem poniżej, względem potęg jego dodatnich i ujemnych wraz z potęgą zero, zapisanej za pomocą współczynników a-n i bn, czyli we wspomnianym wzorze występuje wszelkie potęgi wyrazu (z-z0), zatem na tej podstawie nasz szereg:

f(z)=\sum_{n=1}^{\infty}a_{-n}(z-z_0)^{-n}+\sum_{l=1}^{\infty}b_l(z-z_0)^{l}\;
(8.22)

Następnym krokiem jest wyznaczenie wyrażenia poniżej całkując wokół pewnego punktu z0, dokonując podstawienia z-z_0=re^{i\phi}\;, otrzymujemy:

\oint(z-z_0)^kdz=\oint r^ke^{ik\phi}ire^{i\phi}d\phi=ir^{k+1}\int_0^{2pi}e^{i(k+1)\phi}d\phi\;
(8.23)

We wzorze (8.23), gdy k=-1, wtedy wspomniany wzór jest równy 2πi;, ale gdy k≠-1, wtedy wspomniany wcześniej wzór jest równoważny całce:

ir^{k+1}\int_0^{2\pi}e^{i(k+1)\phi}d\phi=ir^{k+1}{{1}\over{i(k+1)}}e^{i(k+1)\phi}\Bigg|_0^{2\pi}=\;
=ir^{k+1}{{1}\over{i(k+1)}}\left(e^{i(k+1)2\pi}-1\right)=ir^{k+1}{{1}\over{i(k+1)}}(1-1)=0\;
(8.24)

Na podstawie obliczeń przeprowadzonych w punkcie (8.24) i dla k=-1 dochodzimy do wniosku, że dla poszczególnych k, mamy:

\oint_C(z-z_0)^kdz=\begin{cases}
0&\mbox{ dla }  k\neq -1\\
2\pi i&\mbox{ dla } k=-1\\
\end{cases}\;
(8.25)

Dalszym krokiem jest wyznaczenie czynników a-n i bn, zatem wyznaczmy teraz ten pierwszy czynnik, zatem w obliczeniach poniżej występuje po odpowiednich obliczeniach suma całek, w której wszystkie całki oprócz jednej są równe zero, tzn. oprócz s=n, zatem te całki, które są równe zero od razu pomijamy w trzecim przekształceniu, zatem końcowa całka jest już poznana, bo ona omawiana była w punkcie (8.17):

{{1}\over{2\pi i}}\oint(z-z_0)^{n-1}f(z)={{1}\over{2\pi i}}\oint(z-z_0)^{n-1}\left(\sum_{s=1}^{\infty}a_{-s}(z-z_0)^{-s}+\sum_{l=1}^{\infty}b_l(z-z_0)^{l}\right)=\;

{{1}\over{2\pi i}}a_{-n}\oint {{1}\over{(z-z_0)}}dz={{1}\over{2\pi i}}a_{-n}2\pi i=a_{-n}\;
(8.26)

Dalszym krokiem jest wyznaczenie czynników bn, zatem w obliczeniach poniżej występuje po odpowiednich obliczeniach suma całek, w której wszystkie całki oprócz jednej są równa zero, tzn. oprócz l=n, zatem te całki, które są równe zero od razu pomijamy w trzecim przekształceniu, to końcowa całka jest już znana, bo ona omawiana była w punkcie (8.19), wtedy możemy napisać:

{{1}\over{2\pi i}}\oint{{f(z)}\over{(z-z_0)^{m+1}}}={{1}\over{2\pi i}}\oint{{1}\over{(z-z_0)^{m+1}}}\left(\sum_{s=1}^{\infty}a_{-s}(z-z_0)^{-s}+\sum_{l=1}^{\infty}b_l(z-z_0)^{l}\right)=\;

{{1}\over{2\pi i}}b_{n}\oint {{1}\over{(z-z_0)}}dz={{1}\over{2\pi i}}b_{n}2\pi i=b_{n}\;
(8.27)

Na podstawie końcowych obliczeń współczynniki szeregu Laurenta (8.22) w przeprowadzonych obliczeniach, w celu ich wyznaczenia w punktach (8.26) i (8.27), są równe:

a_{-n}={{1}\over{2\pi i}}\oint_C(z-z_0)^{n-1}f(z)dz\;
(8.28)
b_m={{1}\over{2\pi i}}\oint_C {{f(z)}\over{(z-z_0)^{m+1}}}dz\;
(8.29)

[edytuj] Zastosowanie definicji residuum funkcji

Przeprowadźmy całkowanie funkcji zespolonej w przestrzeni zespolonej po linii zamkniętej, wtedy ta funkcja podcałkowa, jeśli ją przestawimy szeregiem Laurenta, to wszystkie całki wyrazów oprócz wyrazu z czynnikiem a-1 znikają, czyli są równe zero, zatem zostaje tylko wyraz ze wspomnianym czynnikiem. Jeśli funkcja podcałkowa f(z) ma kilka residuów, to szereg Laurenta jest sumą szeregów Laurenta dla różnych x0, czyli (8.22), zatem dochodzimy do wniosku z właściwości (8.25), że jeśli gdy ma jedno residuum, to wtedy

\oint f(z)=2\pi i \operatorname{Res} f(z_0)\;
(8.20)

A dla kilku residuum, tzn. funkcja f(z) ma kilka osobliwych punktów, to z własności funkcji Laurenta dla kilku punktów osobliwych mamy:

\oint_C f(z)dz=2\pi i\sum_j \operatorname{Res} f(z_j)\;
(8.31)

[edytuj] Wyznaczanie residuum funkcji

Niech szereg Laurenta (8.22) posiada wyraz, który to w mianowniku (z-zj) wykładnik potęgi ma nawiększą wartość w porównaniu z wykładnikami potęgi w mianowniku z innymi wyrazami należącego do tego szeregu:

f(z)={{a_{-m}}\over{(z-z_j)^m}}+{{a_{-m+1}}\over{(z-z_j)^{m-1}}}+...
(8.32)

Wtedy residuum funkcji (8.32) wyznaczamy przy pomocy wzoru poniżej, przy punkcie osobliwym zj.

\operatorname{Res} f(z_j)={{1}\over{(m-1)!}}\lim_{z\rightarrow z_j}\left[(z-z_j)^mf(z)\right]^{(m-1)}\;
(8.33)

Zaraz wytłumaczymy wzór (8.33), zatem do dzieła. Szereg (8.32) mnożymy obustronnie przez (z-zj)m, w ten sposób likwidujemy wszystkie wyrazy ujemne z-zj. Przy czynniku a-1 pojawi się potęga (z-zj)m-1. Tak otrzymany szereg różniczkujemy m-1 razy likwidując tym samym współczynnik a-n z wyjatkiem a-1, aby wyszedł czynnik a-1 należy tak otrzymane wyrażenie podzielić przez (m-1)!. Na samym końcu przechodzimy do granicy przy _{z\rightarrow z_j}\;, by potem otrzymać wzór (8.33). Co kończy dowód tego twierdzenia.

[edytuj] Dalszy ciąg badania funkcji holomorficznych

Niech mamy dwa wektory określone jako pochodne wektorów wodzących w kartezjańskim układzie współrzędnym, które określamy jako pochodną cząstkową z tych wektorów względem pewnych parametrów charakteryzujących te nasze omawiane wektory.

\vec{T}_1={{\partial\vec{r}_1}\over{\partial s_1}}\;
(8.34)
\vec{T}_2={{\partial\vec{r}_2}\over{\partial s_2}}\;
(8.35)

Kat między wektorami (8.34) a (8.35) określamy ze wzoru na iloczyn skalarny, zatem znając długości wektorów \vec{T}_1\;,\vec{T}_2\; i ich iloczyn skalarny, to możemy policzyć kosinus kąta pomiędzy naszymi omawianymi wektorami.

\cos\alpha={{(\vec{T}_1,\vec{T}_2)}\over{||\vec{T}_1|| ||\vec{T}_2||}}\;
(8.36)

Określmy macierz pierwszych pochodnych cząstkowych funkcji (8.16) względem zmiennych x i y, zatem tą macierz określamy wedle sposobu poniżej, przekształcimy tą macierz z warunku na holomorficzność funkcji (8.12), czyli ze wzoru określająca tą właściwość funkcji, tj. (8.14) i (8.15).

F=\begin{bmatrix}
{{\partial u}\over{\partial x}}&{{\partial u}\over{\partial y}}\\
{{\partial v}\over{\partial x}}&{{\partial v}\over{\partial y}}\end{bmatrix} =\begin{bmatrix}

{{\partial u}\over{\partial x}}&{{\partial u}\over{\partial y}}\\
-{{\partial u}\over{\partial y}}&{{\partial u}\over{\partial x}}\end{bmatrix}\;
(8.37)

Okreslmy teraz wektor \vec{Y}\; w nowych zmiennych (u, v) określany podobnie jak w punkcie dla wektora \vec {r}_1\; i \vec{r}_2\;, czyli przy pomocy (8.34) i (8.35):

\vec{Y}={{d\vec{w}}\over{\partial s}}={{\partial(u,v)}\over{\partial (x,y)}}{{d(x,y)}\over{ds}}=F^'\vec{T}\;
(8.38)

Kąt pomiędzy dwoma różnymi wektorami (8.38) wyznaczamy z definicji iloczynu skalarnego dla przestrzeni euklidesowej przestawionej w postaci macierzowej znanej z algebry, zatem jak się przekonamy, że porównując kąty pomiędzy wektorami określanymi według wzoru (8.36), a kątem pomiędzy wektorami (8.34) i (8.35), to jak się przekonamy są kątami sobie równymi.

\cos\beta={{(F^'\vec{T}_1,F^'\vec{T}_2)}\over{||F^'\vec{T}_1|| ||F^'\vec{T}_2||}}={{\vec{T}_1^T(F^')^TF^'\vec{T}}\over{||\vec{T}_1^T(F^')^TF^'\vec{T}_1||||\vec{T}_2^T(F^')^TF^'\vec{T}_2||}}={{(\vec{T}_1,\vec{T}_2)}\over{||\vec{T}_1|| ||\vec{T}_2||}}=\cos\alpha\;
(8.39)

[edytuj] Wprowadzenie do wielomianów ortogonalnych

W tym rozdziale zapoznamy się z wielomianami, którego definicja jest przestawiana wzorem poniżej, jest ona kombinacją liniową funkcji potęgowych xn ze współczynnikami an i bn:

Q_n(x)=a_n x^n+b_nx^{n-1}+...\;
(9.1)

Będziemy się również zajmować wielomianami Legendre'a Pn, Hermite'a Hn i Laguerre'a Ln i na samym końcu Czebyszewa Tn. Każdy z tych wielomianów ma swoją dziedzinę zapisanych w przedziałach dla każdego wielomianu z osobna.

  • \begin{matrix}
P_n(x):&x\in (-1,1)\\
H_n(x):&x\in(-\infty,+\infty)\\
L_n(x):&x\in(0,\infty)\\
T_n(x):&x\in(-1,1)
\end{matrix}\;

[edytuj] Definicje ortogonalności wielomianów Qn

Zdefiniujmy iloczyn skalarny między dwoma funkcjami jednej zmiennej dwóch funkcji f(x) i g(x) wedle wzoru poniżej, którą definiujemy w przedziale (α,β).

(f,g)=\int_{\alpha}^{\beta}f(x)g(x)dx\;
(9.2)

Funkcje f(x) i g(x) są ortogonalne, jeśli zachodzi warunek (f,g)=0, jeśli do wzoru (9.2) wprowadzimy wagę ρ(x), to napiszemy definicję iloczynu skalarnego dwóch wielomianów:

(Q_n,Q_m)=\int_{\alpha}^{\beta}Q_n(x)Q_m(x)\rho(x)dx\;
(9.3)

Wielomiany (9.1) są z definicji ortogonalne, tzn. zachodzi wniosek (Qn,Qm)=δnm.

[edytuj] Wstęp do własności wielomianów ortogonalnych

Każdą potęgę xk możemy przestawić jako kombinację liniową wielomianów ortogonalnych Q0, Q1,Q2,Q3,...,Qk, wtedy na podstawie tej własności funkcja potęgowa dla k<n jest ortogonalna z wielomianem Qn:

(x^k,Q_n)=0\mbox{    dla    }k=0,1,2,3,...,n-1\;
(9.4)

Funkcja ortogonalna Qn ma n pierwiastków, bo to wynika z tego, że ona jest iloczynem n czynników (x-xj), zatem nasz wspomniany wielomian piszemy wedle schematu:

Q_n(x)=a_n(x-x_1)(x-x_2)(x-x_3)\cdot ...\cdot(x-x_n)\;
(9.5)

Aby przeprowadzić dowód przedstawienia funkcji Qn w postaci iloczynów pewnych czynników (9.5) musimy przeprowadzić dowód nie wprost, zatem załóżmy, że nasz wielomian ma m<n pierwiastków, wtedy wielomian Qn zapisujemy:

Q_n=(x-x_1)(x-x_2)\cdot ...\cdot(x-x_m)W_{n-m}(x)\;
(9.6)

Iloczyn skalarny wielomianu ortogonalnego Qn(x) (9.6) i wielomianu zdefiniowane w punkcie (9.5) na mocy twierdzenia (9.4) jest równy zero, na podstawie definicji iloczynu skalarnego (9.3), zatem iloczyn skalarny napisany tuż niżej dla m<n jest po prostu równy zero:

I=(Q_n,(x-x_1)(x-x_2)(x-x_3)\cdot ...\cdot(x-x_m)=\;
=\int_{\alpha}^{\beta}Q_n(x)(x-x_1)(x-x_2)(x-x_3)\cdot ...\cdot(x-x_m))\rho(x)dx\;
(9.7)

Ale z drugiej jednak strony ten sam wielomian (9.5) możemy przepisać w postaci wielomianów o ustalonych znakach, zatem iloczyn skalarny (9.7), dla obranej odpowiedniej funkcji Qn wyżej zdefiniowaną, piszemy:

I=\int_{\alpha}^{\beta}(x-x_1)^2(x-x_2)^2...(x-x_m)^2W_{n-m}(x)\rho(x)dx\;
(9.8)

Na podstawie wzoru (9.7) całka jest równa zero, bo zachodzi m<n, a całka (9.8), w której występują czynniki podniesione do kwadratu, które są ustalonego znaku, ale 0<n-m<n, jest nie równa zero, zatem ten sam wynik (9.7) i (9.8) przyjmuje raz wyraz równy zero, a za drugim razem jest nierówny zero, wtedy mamy sprzeczność, tą sprzeczność możemy usunąć, gdy zachodzi n=m, wtedy dostajemy, że wielomian ortogonalny Qn ma n pierwiastków i da się przestawić wzorem (9.5).

[edytuj] Wielomiany ortogonalne jako rozwiązania pewnych równań różniczkowych

Tutaj będziemy rozpatrywać wielomiany ortogonalne spełniających warunki ortogonalności. Aby przeprowadzić dalsze obliczenia napiszmy wielomian wymierny napisaną wedle schematu poniżej, który to jest ilorazem pochodnej zmiennej ρ, która jest wagą przy całkowaniu przy iloczynie skalarnym (9.3), przez tą samą wagę, które to wyrażenie jest ilorazem wielomianu A przez B, zatem w takim przypadku ten iloraz spełnia tożsamość (pierwszy wzór), a także napiszmy warunek na równość w punktach brzegowych x=α,β, który to jest iloczynem wagi ρ(x) i wielomianu B(x), który jest równy zero w tymże punktach:

{{{\rho^'}\over{\rho}}={{A}\over{B}}}\;
(9.9)
\rho(x)B(x)=0\mbox{ dla  }  x=\alpha,\beta\;
(9.10)

Wyznaczmy funkcję V, która będzie nam bardzo potrzebna w toku dalszych obliczeń przy wyznaczeniu odpowiedniego typu równań różniczkowych, w tym celu należy skorzystać z równości (9.9), zatem:

V={{1}\over{\rho}}\left(\rho BQ^'_n\right)^'={{1}\over{\rho}}\left[\rho^' BQ_n^'+\rho B^'Q_n^'+\rho BQ_n^'\right]={{\rho^'}\over{\rho}}BQ_n^'+B ^'Q_n^'+ BQ_n^{''}=\;
={{A}\over{B}}BQ_n^'+B^'Q_n^'+BQ_n^{''}=\left(A+B^'\right)Q^'_n+BQ_n^{''}\;
(9.11)

Zbadajmy ortogonalność wielomianów V z funkcją potęgową xk dla k<n, wtedy obliczmy najpierw iloczyn skalarny funkcji V z funkcją potęgową, i sprawdzimy później czy te tutaj wspomniane wielomiany są do siebie ortogonalne, ale najpierw całkując w tak otrzymanym iloczynie skalarnym przez części, dochodzimy do wniosku:

(V,x^k)=\int_{\alpha}^{\beta}x^k(\rho BQ_n^')^'dx=x^k\rho BQ_n^'\Bigg|_{\alpha}^{\beta}-k\int_{\alpha}^{\beta}x^{k-1}\rho(x)B(x)Q_n^'(x)dx\;
(9.12)

Zakładamy, że iloczyn ρ(x)B(x) w punktach α i β jest równy zero, czyli zachodzi wzór (9.10), zatem pierwszy składnik we wzorze (9.12) znika, zatem pozostaje nam tylko drugi składnik, którego całkujemy przez części.

(V,x^k)=k\int_{\alpha}^{\beta}\left(x^{k-1}\rho(x)B(x))\right)^'Q_{n}(x)dx=\;
=k\int_{\alpha}^{\beta}\left[(k-1)x^{k-1}\rho(x)B(x)+x^{k-1}\left(\rho(x)B(x)\right)^{'}\right]Q_n(x)dx=\;

=k\int_{\alpha}^{\beta}\left[(k-1)x^{k-1}B(x)+x^{k-1}{{1}\over{\rho}}\left(\rho^'(x)B+\rho B^'\right)\right]Q_n(x)\rho(x) dx=\;
=
k\int_{\alpha}^{\beta}\left[(k-1)x^{k-1}B(x)+x^{k-1}\left(A+ B^'\right)\right]Q_n(x)\rho(x) dx
(9.13)

Ponieważ wyrażenia xk i xk-1 są wielomianami, dla których zachodzi k<n, zatem wielomian Qn jest prostopadły do funkcji potęgowej, stąd wynika, że wyrażenie (9.13) jest równe zero, zatem wielomian V zdefiniowany w punkcie (9.11) jest wielomianem prostopadłym do funkcji potęgowej xk, zatem w takim przypadku możemy napisać, że wielomian V jest wyrażamy wzorem V=γ Qn:

\left(A+B^'\right)Q^'_n+BQ_n^{''}=\gamma Q_n\;
(9.14)

Współczynnik γ wyznaczamy w równaniu różniczkowym (9.14) w taki sposób by porównać w nim wyrazy stojące przy xn, to w takim razie dostajemy:

\gamma=n\left[A_1+(n+1)B_2\right]\;
(9.15)

Mając równanie różniczkowe (9.14) na wielomian ortogonalny Qn zdefiniowanej w punkcie (9.1), zatem możemy napisać wzory różniczkowe na wielomiany Legendre'a Pn, Hermite'a Hn,Laguerre'a Ln i Czybyszewa Tn podstawiając za A i B pewne ściśle określone wielomiany:

Wielomian Legendre'a Pn
Wielomian Hermite'a Hn
(1-x^2)P_n^{''}-2xP^'_n+n(n+1)P_n=0
(9.16)
H_n^{''}-2xH^'_n+2n H_n=0\;
(9.17)
Wielomian Laguerre'a Ln
Wielomian Czebyszewa Tn
xL_n^{''}+(\lambda+1-x)L_n^'+nL_n=0\;
(9.18)
(1-x^2)T^{''}_n-xT^'_n+n^2T_n=0\;
(9.19)

[edytuj] Wzór Rodriguesa

Można wykazać, że wielomiany ortogonalne można zapisać nade wszystko w prostej postaci. Wielomiany Q_n(x); i \tilde{Q}_n\; są to wielomiany różniące się tylko stałym czynnikiem, wtedy wzór Rodriguesa wyrażamy:

Q_n-\tilde{Q}_n={{1}\over{\rho}}\left(\rho B^n\right)^{(n)}\;
(9.20)

Znając wzór (9.20) nie jesteśmy pewni, czy wielomian \tilde{Q}_n(x)\; jest w ogóle wielomianem, zatem zapiszmy wielomian poniżej i sprawdźmy czemu jest równy wielomian określony:

{{1}\over{\rho}}\left(\rho B^n\right)^k\;
(9.21)

Wyznaczmy wyrażenie (9.21) dla k=0, czyli dla pochodnej zerowego rzędu, zatem dochodzimy do wniosku:

{{1}\over{\rho}}\left(\rho B^n\right)^{(0)}=B^n\;
(9.22)

Teraz wyznaczmy wyrażenie (9.21) dla k=1, czyli dla pochodnej pierwszego rzędu, wtedy będziemy musieli wykorzystać wzór (9.9):

{{1}\over{\rho}}\left(\rho B^n\right)^1={{1}\over{\rho}}\left(\rho^' B^n+\rho nB^{n-1}B^'\right)={{\rho^'}\over{\rho}}B^n+nB^{n-1}B^'=\;
={{A}\over{B}}B^n+nB^{n-1}B^'=AB^n+B^{n-1}B^'=B^{n-1}\left(A+nB^'\right)\;
(9.23)

Patrząc na dwa wnioski, czyli (9.22) (przypadek zerowej pochodnej) i (9.23) (przypadek pierwszej pochodnej), możemy dojść do wniosku, że końcowy wynik (9.21) jest iloczynem wielomianu Bn-k i wielomianu Wk, zatem w takim przypadku dochodzimy do wniosku, że spełniona jest prawdopodobnie tożsamość:

{{1}\over{\rho}}\left(\rho B^n\right)^{(k)}=B^{n-k}W_k\;
(9.24)

Aby udowodnić tożsamość (9.24) należy skorzystać z metody indukcji zupełnej. Przypadek k=0,1, czyli przypadki (9.22) i (9.23) zostały już udowodnione, zatem w takim przypadku wykażmy, czy z zdania n wynika zdanie n+1, zatem przejdźmy do głównego nurtu dowodu:

{{1}\over{\rho}}\left(\rho B^n\right)^{(k+1)}={{1}\over{\rho}}\left[(\rho B^n)^{(k)}\right]^'={{1}\over{\rho}}\left[\rho B^{n-k}W_k\right]^'=\;

={{1}\over{\rho}}\left[\rho^' B^{n-k}W_k+\rho \left(B^{n-k}\right)^'W_k+\rho B^{n-k}W_k^'\right]=\;
=AB^{n-k-1}W_k+(n-k)B^{n-k-1}W_k+B^{n-k}W_k^'=B^{n-k-1}\left(AW_k+(n-k)W_k+BW_k^'\right)=\;
=B^{n-k-1}\left(W_k(A+n-k)+BW_k^'\right)\;
(9.25)

Jeśli porównamy wynik końcowy wynikowy (9.25) i wzór (9.24), wtedy mamy tożsamość iteracyjną:

W_{k+1}=BW_k^'+(A+(n-k)B^')W_k\;
(9.26)

Jest to równanie różniczkowo-róznicowe na wielkość Wn, któremu odpowiada wartość początkowa iteracji:

W_0=1\;
(9.27)

Gdy mamy n=k, przypadek wielomianu Wn zgodnie ze wzorem (9.20) pokrywa się z wielomianem \tilde{Q}_n\;, zatem problem znalezienia wielomianów ortogonalnych sprowadza się do problemu znalezienia wielomianu Wn. Ten wielomian będziemy zapisywali go podobnie jak we wzorze (9.1) dla wielomianu Qn, czyli określmy nasz wielomian Wn jako:

W_n(x)=w_nx^m+v_nx^{m-1}+...\;
(9.28)

[edytuj] Wielomiany Legendre'a

Wielomiany Lgendre'a są opisywane przez równanie różniczkowe opisane przez wzór (9.16), gdzie B=1-x^2 i A=0, wtedy równanie iteracyjne (9.26) przyjmuje postać iteracyjną:

W_{k+1}=(1-x^2)W_k^'-2x(n-k) W_k\;
(9.29)

Porównując współczynniki stojące przy potędze xk+1 w (9.29), zatem możemy dojść do wzoru mówiącego o iteracji współczynnika wk:

w_{k+1}=-w_kk-2(n-k)w_k\Rightarrow w_{k+1}=-2w_k(n-k)-k=\;
=-w_k(2n-2k+k)w_k=-(2n-k)w_k\Rightarrow w_{k+1}=-(2n-k)w_k\;
(9.30)

Napiszmy w sposób zwarty współczynniki wn dla wielomianu Wn:

w_n=(n-1-2n)(n-2-2n)(n-23-2n)\cdot...(0-2n)=(-n-1)(-n-1)(-n-2)\cdot...\cdot(-2n)=\;
=(-1)^n{{(2n)!}\over{n!}}\;
(9.31)

Jeśli będziemy porównywać współczynnikami stojące przy potędze xk w (9.42) dostajemy tożsamość iteracyjną:

v_{k+1}=-(k-1)v_k+(2k-2n)v_{k}=(k+1-2n)v_k\;
(9.32)

Gdy zadamy warunek brzegowy v0=0, wtedy na podstawie warunku (9.32) dostajemy wniosek, że vn=0.

Wielomiany Legendre'a Pn(x) dla n=0,...,5

Wielomiany Legrendre'a jako rozwiązanie równania różniczkowego (9.16) piszemy:

P_n={{(-1)^n}\over{2^nn!}}\tilde{P}_n={{(-1)^n}\over{2^nn!}}\left[\left(1-x^2\right)^n\right]^{(n)}\;
(9.33)

Czynniki stojące przy dwóch ostatnich wyrazach dla wielomianów Legendre'a (9.33) są równe:

a_n={{(2n)!}\over{2^n(n!)^2}}\;
(9.34)
b_n=0\;
(9.35)

[edytuj] Wielomiany Hermite'a

Wykres pierwszych czterech wielomianów Hermite'a

Rozpatrzmy równanie iteracyjne dla wielomianów iteracyjnych Wk, który jest odpowiednikiem równania różniczkowego Hermite'a (9.17).

W_{k+1}=W_k^'-2xW_k\;
(9.36)

Porównując współczynniki stojące przy potędze xk i xk-1, i przyjmując odpowiednie warunki brzegowe, tzn. w0=1 i v0=0, wtedy dostajemy wnioski iteracyjne dla tych dwóch najwyższych współczynników. Jak się przekonamy współczynnik vn jest równy zawsze zero, bo współczynnik v0 jest równy zero. Współczynniki wn i vn są równe:

w_{k+1}=-2w_k\wedge w_0=1\Rightarrow w_n=(-2)^n\;
(9.37)
v_{k+1}=-2v_k\wedge v_0=0\Rightarrow v_n=0\;
(9.38)

Wielomiany Hermite'a nazywamy wielomianami napisane jako:

H_n=(-1)^n\tilde{H}_n=(-1)^ne^{x^2}\left(e^{-x^2}\right)^{(n)}\;
(9.39)

Czynniki stojący w ostatnich wyrazach we wzorze na wielomiany Legendre'a Hn (9.39) są równe:

a_n=2^n\;
(9.40)
b_n=0\;
(9.41)

[edytuj] Wielomiany Laguerre'a

Wykresy pierwszych czterech wielomianów Laguerre'a

Równaniem iteracyjnym równania różniczkowego Hermitte'a nazywamy wielomian, który jest odpowiednikiem równania różniczkowego (9.18), który wyrażamy wzorem iteracyjnym:

W_{k+1}=xW_k^'+(\lambda-x+n-k)W_k\;
(9.42)

Porównując współczynniki stojące przy potędze xk+1 w (9.42) możemy dojść do wzoru mówiącego o iteracji współczynnika wk, stąd z warunkiem brzegowym w0=1 otrzymujemy wn:

w_{k+1}=-w_k\Rightarrow w_k=(-1)^k\Rightarrow w_n=(-1)^n\;
(9.43)

Porównując współczynniki stojące przy potędze xk w (9.42) możemy dojść do wzoru mówiącego o iteracji współczynnika vk, stąd z warunkiem brzegowym v0=0 otrzymujemy vn:

v_{k+1}=kw_k+(\lambda+n-k)w_k-v_{k}=(\lambda+n)w_k-v_k=(\lambda+n)(-1)^k-v_k\Rightarrow\;
\Rightarrow v_n=(-1)^{n-1}(\lambda+n)n\;
(9.44)

Wielomianem Laguerre'a nazywamy wielomianem ortogonalnym, który piszemy:

L_n=\tilde{L}_n=x^{-1}e^x\left(x^{\lambda+n}e^{-x}\right)^{(n)}\;
(9.45)

Najwyższe dwa współczynniki stojące przy wielomianie Laguerre'a Ln są to współczynniki opisujące wielomian:

a_n=(-1)^n\;
(9.46)
b_n=(-1)^{n-1}n(n+\lambda)\;
(9.46)

[edytuj] Wielomian Czebyszewa

Równaniem iteracyjnym równania różniczkowego Hermitte'a nazywamy wielomian, który jest odpowiednikiem (9.19), który wyrażamy wzorem iteracyjnym:

W_{k+1}=(1-x^2)W^'_k+\left[x-2(n-k)x\right]W_k\;
(9.47)

Porównując współczynniki stojące przy potędze xk+1 w (9.47) możemy dojść do wzoru mówiącego o iteracji współczynnika wk, stąd z warunkiem brzegowym w0=1 otrzymujemy wn:

w_{k+1}=-kw_k-(2n-2k-1)w_k=-w_k\left(2n-k-1\right)]\Rightarrow w_{k}=-w_{k-1}(2n-k)\Rightarrow\;
 w_n=(-1)^n{{(2n-1)!}\over{(n-1)!}}\;
(9.48)

Porównując współczynniki stojące przy potędze xk w (9.47) możemy dojść do wzoru mówiącego o iteracji współczynnika vk, stąd z warunkiem brzegowym v0=0 otrzymujemy vn:

v_{k+1}=-v_k(k-1)+[1-2(n-k)]v_k=(1-2n+2k-k+1)v_k=(2-2n+k)v_k\Rightarrow v_n=0\;
(9.49)
Wykresy wielomianu Czebyszewa dla n=0 do n=5

Wielomianem Czebyszewa nazywamy wielomianem, która jest rozwiązaniem równania różniczkowego Czebyszewa (9.19):

T_n=(-1)^n{{(n-1)!}\over{(2n-1)!}}\tilde{T}_n=\;
=(-1)^n{{(n-1)!}\over{(2n-1)!}}\sqrt{1-x^2}\left[(1-x^2)^{n-{{1}\over{2}}}\right]^{(n)}\;
(9.50)

Przy wielomianach Czebyszewa Tn współczynniki stojące przy dwóch najwyższych jego potęgach są to współczynniki wyrażone wzorami:

a_n=1\;
(9.51)
b_n=0\;
(9.52)

[edytuj] Definicja normy wielomianów ortogonalnych

Wielomiany ortogonalne nie stanowią zwykle bazy ortogonalnej, ponieważ ich normy są nierówne jeden, zatem normą wielomianu ortonormalnego nazywamy normą zapisywanej wzorem przy korzystaniu z definicji iloczynu skalarnego dla dwóch wielomianów ortonormalnych (9.3):

||Q_n||^2=(Q_n,Q_n)=(a_nx^n+b_nx^{n-1}+...,Q_n)\;
(9.53)

Wiadomo, że wielomian xk jest ortonormalny do wielomianu Qn dla k<n, wtedy norma wielomianu ortogonalnego dla ściśle określonego n w (9.53) sprowadza się do postaci poniżej, wprowadzając jeszcze współczynnik fn, który jest wprost proporcjonalności pomiędzy Q_n\; a \hat{Q}_n\;, i całkując tak otrzymaną całkę n razy przez części, dostajemy stąd wniosek:

||Q_n||^2=a_n(x^n,Q_n)=a_n(x^n,Q_n)=a_nf_n\int_{\alpha}^{\beta}x^n{{1}\over{\rho}}(\rho B^n)^{(n)}\rho dx=(-1)^nn!a_nf_n\int_{\alpha}^{\beta}\rho B^ndx\;
(9.54)

Napiszmy teraz normy dla poszczególnych rozważanych tutaj wielomianów ortonormalnych w tymże module.

[edytuj] Norma dla wielomianu Legendre'a

Przy liczeniu normy wielomianu Legendre'a (9.33), korzystamy z definicji normy wielomianu Qn (9.54), i z definicji wagi równą ρ=1:

||P_n||^2=(-1)^n n!\underbrace{{{(2n)!}\over{2^n(n!)^2}}}_{a_n}\underbrace{{{(-1)^n}\over{2^n n!}}}_{f_n}\int^1_{-1}(1-x^2)^ndx\;
(9.55)

Obliczmy tę całkę dokonując podstawienia t=(x+1)/2, czyli x=2t-1, w ten sposób możemy piszemy (9.55):

||P_n||^2={{(2n)!}\over{2^{2n}(n!)^2}}\int_{0}^1\left(1-\left(2t-1\right)^2\right)^n2dt={{(2n)!}\over{2^{2n}(n!)^2}}\int_0^1\left(1-4t^2+4t-1\right)2dt=\;
=
{{(2n)!}\over{2^{2n}(n!)^2}}\int_0^1\left(-4t^2+4t\right)^ndt={{(2n)!}\over{2^{2n}(n!)^2}}2^{2n+1}\int_0^1t^n(1-t)^ndt=\;
=
{{(2n)!}\over{2^{2n}(n!)^2}}2^{2n+1}B(n+1,n+1)=2{{(2n)!}\over{(n!)^2}}{{\Gamma(n+1)\Gamma(n+1)}\over{\Gamma(2n+2)}}=2{{(2n)!}\over{(n!)^2}}{{n!n!}\over{(2n+1)!}}=\;
={{2}\over{2n+1}}\;
(9.56)

[edytuj] Norma dla wielomianu Hermite'a

Przy liczeniu normy wielomianu Hermite'a (9.39), korzystamy z definicji normy wielomianu Qn (9.54), zatem ta nasza rozważaną normę piszemy wedle schematu poniżej przy definicji ρ=e-x2 i B=1, zatem:

||P_n||^2=(-1)^n n! 2^n(-1)^n\int_{-\infty}^{\infty} e^{-x^2}dx=2^nn!\sqrt{\pi}\;
(9.57)

[edytuj] Norma dla wielomianu Laguerre'a

Przy liczeniu normy wielomianu Hermite'a (9.39), korzystamy z definicji normy wielomianu Qn (9.54), to ta nasza rozważaną normę piszemy wedle przepisu poniżej przy definicjach _{\rho=x^{\lambda} e^{-x}}\; i B=x, korzystając przy tym z definicji funkcji Γ Eulera drugiego rodzaju (5.13):

||L_n||^2=(-1)^nn!(-1)^n\int_0^{\infty}e^{\lambda+n}e^{-x}dx=n!\Gamma(\lambda+n+1)\;
(9.58)

[edytuj] Norma dla wielomianu Czebyszewa

Przy liczeniu normy wielomianu Czebyszewa (9.50), korzystamy z definicji normy wielomianu Qn (9.54), zatem ta nasza rozważaną normę piszemy wedle schematu poniżej przy definicji _{\rho={{1}\over{\sqrt{1-x^2}}} }\;, B=1-x2 korzystając przy tym z definicji funkcji Γ Eulera drugiego rodzaju (5.12):

||T_n||^2=(-1)^nn! (-1)^n{{(n-1)!}\over{(2n-1)!}}\int_{-1}^1(1-x^2)^{n-{{1}\over{2}}}dx=\;
=n!{{(n-1)!}\over{(2n-1)!}}\int_{0}^1\left[1-\left(2t-1\right)^2\right]^{n-{{1}\over{2}}}dx=n!{{(n-1)!}\over{(2n-1)!}}\int_{0}^1\left(1-4t^2-1+4t\right)^{n-{{1}\over{2}}}dt=\;

=n!{{(n-1)!}\over{(2n-1)!}}2^{2n}\int_{-1}^1t^{n-{{1}\over{2}} }(1-t)^{n-{{1}\over{2}}}dt=
n!{{(n-1)!}\over{(2n-1)!}}2^{2n}B\left(n+{{1}\over{2}},n+{{1}\over{2}}\right)=\;
=
n!{{(n-1)!}\over{(2n-1)!}}2^{2n}{{\Gamma(n+{{1}\over{2}})\Gamma(n+{{1}\over{2}})}\over{\Gamma(2n+1)}}=\;

=n!{{(n-1)!}\over{(2n-1)!}}2^{2n} {{\left(n-{{1}\over{2}}\right)^2\left(n-{{3}\over{2}}\right)^2\cdot...\cdot\left({{3}\over{2}}\right)^2\left({{1}\over{2}}\right)^2\Gamma\left({{1}\over{2}}\right)^2}\over{(2n)!}}=\;
=n!{{(n-1)!}\over{(2n-1)!}}\pi{{\left((2n-1)!!\right)^2}\over{(2n)!}}=
{{n!(n-1)!}\over{(2n-2)!!}}\pi{{(2n-1)!!(2n)!!}\over{(2n)!(2n)!!}}=\;

{{n!(n-1)!}\over{(2n-2)!!}}\pi{{(2n)!}\over{(2n)!(2n)!!}}={{n!(n-1)!}\over{(2n-2)!!}}\pi{{1}\over{(2n)!!}}=\;

={{n!(n-1)!2n}\over{(2n)!!^2}}\pi={{n!(n-1)!2n}\over{2^{2n}(n!)^2}}\pi={{n!n!2n}\over{n2^{2n}(n!)^2}}\pi={{1}\over{2^{2n-1}}}\pi={{\pi}
\over{2^{n-1}}}\;
(9.60)

Następnym krokiem jest wyznaczenie normy wielomianu Czebyszewa Tn dla n=0, korzystając z definicji normy dowolnego wielomianu (9.54) dla tego n, zatem możemy policzyć tą wielkość wedle poniższego sposobu:

||T_0||^2=\int^{1}_{-1}\left(1-x^2\right)^{-{{1}\over{2}}}dx=\int_0^{1}\left[1-\left(2t-1\right)^2\right]=\int_0^{1}t^{-{{1}\over{2}}}(1-t)^{-{{1}\over{2}}}=\;
={{\Gamma^2\left({{1}\over{2}}\right)}\over{\Gamma(1)}}=\left(\sqrt{\pi}\right)^2=\pi\;
(9.61)

[edytuj] Związki rekurencyjne dla wielomianów ortogonalnych

Przestawmy wielomian xQn w postaci rekurencyjnej, który jest jakoby wielomianem n+1 stopnia, który jest kombinacją wielomianów Q0, Q1, Q2,...,Qn+1:

xQ_n=\sum_{j=0}^{n+1}c_jQ_j\;
(9.62)

Na wielomian xQn(9.62) podziałajmy iloczynem skalarnym zdefiniowany w punkcie (9.2) względem wielomianu Qj, zatem w takim przypadku możemy napisać, że współczynnik ci jest iloczynem skalarnym członu xQn przez człon Qi podzielonej przez kwadrat modułu wielomianu Qi:

(xQ_n,Q_i)=\left(\sum_{j=0}^{n+1}c_jQ_j,Q_i\right)=\sum_{j=0}^{n+1}c_j(Q_j,Q_i)=c_i||Q_i||\Rightarrow c_i={{(xQ_n, Q_i)}\over{||Q_i||^2}}=\;

={{\int_{\alpha}^{\beta}xQ_nQ_idx}\over{||Q_i||^2}}={{\int_{\alpha}^{\beta}xQ_iQ_n\rho dx}\over{||Q_i||^2}}=\left(xQ_i,Q_n\right){{1}\over{||Q_i||^2}}\;
(9.63)

Na podstawie definicji współczynnika ci możemy powiedzieć, że wielomian xQn jest kombinacją wielomianów Qn+1, Qn i Qn-1, czyli w ten w sposób określamy współczynniki cn+1, cn i cn-1, a pozostałe współczynniki ci na podstawie związku (9.63) są równe zero, zatem wielomian (9.62) jest równy wyrażeniu:

xQ_n=c_{n+1}Q_{n+1}+c_nQ_n+c_{n-1}Q_{n-1}\;
(9.64)

W wielomianie (9.64) zapisaną w sposób rekurencyjny, w którym porównując współczynniki stojące przy potęgach xn+1 dostajemy tożsamość:

a_n=c_{n+1}a_{n+1}\Rightarrow c_{n+1}={{a_n}\over{a_{n+1}}}\;
(9.65)

Następnym krokiem jest porównanie współczynników stojących przy xn, w takim wypadku:

b_n=a_nc_n+b_{n+1}c_{n+1}\;
(9.66)

Przy liczeniu współczynnika cn, który wynika ze związku (9.66) wykorzystamy definicję współczynnika cn+1 (9.65), co wyniku czego otrzymujemy:

c_n={{b_n}\over{c_n}}-{{b_{n+1}c_{n+1}}\over{a_n}}={{b_n}\over{c_n}}-{{b_{n+1}a_n}\over{a_n a_{n+1}}}={{b_n}\over{c_n}}-{{b_{n+1}}\over{a_{n+1}}}\;
(9.67)

Jeśli skorzystamy ze wzoru końcowego wynikowego (9.63) dochodzimy do związku na współczynnik cn-1 rozpisując go korzystając z (9.65).

c_{n-1}=(xQ_n,Q_{n-1}){{1}\over{||Q_{n-1}||^2}}={{\int_{\alpha}^{\beta}xQ_nQ_{n-1}}\over{||Q_{n-1}||^2}}={{\int_{\alpha}^{\beta}xQ_{n-1}Q_n}\over{||Q_{n-1}||^2}}=\;
=
{{(xQ_{n-1},Q_n)}\over{||Q_{n-1}||^2}}={{(xQ_{n-1},Q_n)}\over{||Q_n||^2}}{{||Q_n||^2}\over{||Q_{n-1||^2}}}={a_{n-1}{}\over{a_n}}{{||Q_n||^2}\over{||Q_{n-1||^2}}}\;
(9.68)

[edytuj] Wielomiany ortogonalne a jego funkcje tworzące

Funkcjami tworzącymi nazywamy funkcje dwóch zmiennych, które po rozłożeniu w szereg potęgowy względem jednej zmiennej, przy którym w każdym składniku występuje pewien ściśle określony wielomian ortogonalny. Teraz napiszmy funkcję tworzącą Ψ dla wielomianów \tilde{Q}_n\;:

\psi(x,w)=\sum_{n=0}^{\infty}{{\tilde{Q}_n(x)}\over{n!}}w^n\;
(9.69)

Jeśli skorzystamy ze wzoru całkowego Cauchy'ego (9.17), wtedy wzór zapisany w punkcie (9.69) można zapisać w troszeczkę w innej postaci, ale równoważnej do poprzedniego:

\Psi(x,w)=\sum_{n=0}^{\infty}{{w^n}\over{n!}}{{1}\over{\rho(x)}}{{d^n}\over{dx^n}}\left[\rho(x) B^n(x)\right]={{1}\over{\rho(x)}}\sum_{n=0}^{\infty}{{w^n}\over{n!}}{{d^n}\over{dx^n}}\left[\rho(x)B^n(x)\right]\;
(9.70)

Jeśli wykorzystamy wzór całkowy Cachy'ego (8.17), wtedy możemy napisać tożsamość całkową:

\rho(x)B^n(x)={{1}\over{2\pi i}}\oint_C{{\rho(z)B^n(z)}\over{z-x}}dz\;
(9.71)

Wzór (9.70) na podstawie własności (9.71), która jest całką Cachy'ego w pewnym sensie, przekształcamy do postaci:

\Psi(x,w)={{1}\over{2\pi i\rho(x)}}\sum_{n=0}^{\infty}{{w^n}\over{n!}}{{d^n}\over{dx^n}}\oint_Cdz{{\rho(z)B^n(z)}\over{z-x}}=\;

={{1}\over{2\pi i\rho(x)}}\sum_{n=0}^{\infty}{{w^n}\over{n!}}\oint_Cdz \rho(z)B^n(z){{n!}\over{(z-x)^{n+1}}}={{1}\over{2\pi i\rho(x)}}\oint_C{{\rho(z)dz}\over{z-x}}\sum_{n=0}^{\infty}{{w^nB^n(z)}\over{(z-x)^n}}=
(9.72)

W wyrażeniu na Ψ(z,w) pod sumą mamy szereg geometryczny o ilorazie _{q={{wB}\over{(z-x)}}}\;, wtedy wyrażenie (9.72) piszemy:


\Psi(x,w)={{1}\over{2\pi i\rho(x)}}\oint_C{{\rho(z)dz}\over{z-x}}{{1}\over{1-{{wB(z)}\over{(z-x)}}}}={{1}\over{2\pi i\rho(x)}}\oint_C{{\rho(z)dz}\over{z-x}}{{(z-x)}\over{z-x-wB(z)}}=\;
={{1}\over{2\pi i\rho(x)}}\oint_C{{\rho(z)dz}\over{z-x-wB(z)}}dz
(9.73)

Funkcję Ψ(x,w) (9.73) z zasadami liczenia residuum wyznaczamy względem puntu osobliwego z1 wynikający z tożsamości:

z_1-x-wB(z_1)=0\;
(9.74)

Wokół punktu z1 w całce (9.73) mianownik dąży do zera, zatem możemy skorzystać z reguły de l'Hospitala, wtedy tą naszą całkę piszemy wedle schematu poniżej. Nasza całka przebiega po linii zamkniętej w przestrzeni zespolonej o promieniu dążącej do zera (można udowodnić, że ten sam wynik wyjdzie, gdy policzymy całkę (9.73) po dowolnej linii zamkniętej w płaszczyźnie zespolonej okalający ten właśnie punkt, punkt osobliwy), a także w tych samych przekształceniach wykorzystamy metodę liczenia residuum (8.32).

\Psi(x,w)={{1}\over{2\pi i\rho(x)}}\oint{{\rho^'(z)dz}\over{1-wB^'(z)}}={{1}\over{2\pi i\rho(x)}}{{1}\over{1-wB^'(z_1)}}\oint\rho^'(z)dz=\;
=
{{1}\over{2\pi i\rho(x)}}{{1}\over{1-wB^'(z_1)}}2\pi i \rho(z_1)={{1}\over{\rho(x)}}{{\rho(z_1)}\over{1-wB^'(z_1)}}\;
(9.75)

[edytuj] Funkcje tworzące dla wielomianów Legendre'a

Równanie (9.74) dla wielomianu Legendre'a (9.33), dla którego zachodzi _{B(x)=1-x^2}\; i ρ=1, przyjmuje postać:

z_1-x-w(1-z_1^2)=0\Rightarrow 0=z_1-x-w+wz_1^2\Rightarrow wz_1^2+z_1-x-(x+w)=0\Rightarrow\;
\Rightarrow z_1={{-1\pm\sqrt{1+4w(x+w)}}\over{2w}}={{-1\pm{{\sqrt{1+4wx+4w^2}}}\over{2w}}}
(9.76)

Rozwiązanie (9.76) z minusem odrzucamy, ponieważ z1 jest poza przedziałem zmienności wielomianu Legendre'a, natomiast rozwiązanie z plusem przyjmujemy, bo jest w granicach przedziału zmienności naszego wielomianu, zatem funkcję tworzącą (9.75) określamy:

\Psi(x,w)={{1}\over{1+2wz_1}}={{1}\over{1+2w{{-1+\sqrt{1+4wx+4w^2}}\over{2w}}}}={{1}\over{\sqrt{1+4wx+4w^2}}}=\sum_{n=0}^n{{w^n}\over{n!}}\tilde{P}_n(x)\;
(9.77)

Jeśli dodatkowo we wniosku (9.77) napiszemy _{w=-{{\nu}\over{2}}}\;, to dojdziemy do następującej tożsamości:

{{1}\over{\sqrt{1-2x\nu+\nu^2}}}=\sum_{n=0}^{\infty}(-1)^n{{\nu^n}\over{2^nn!}}\tilde{P}(x)=\sum_{n=0}^{\infty}(-1)^n{{\nu^n}\over{2^nn!}}{{2^nn!}\over{(-1)^n}}P_n(x)\Rightarrow\;
\Rightarrow {{1}\over{\sqrt{1-2x\nu+\nu^2}}}=\sum_{n=0}^{\infty}\nu^nP_n(x)\;
(9.78)

[edytuj] Funkcje tworzące dla wielomianów Hermite'a

Równanie (9.74) dla wielomianów Hermite'a (9.39), dla którego mamy B(x)=1, _{\rho(x)=e^{-x^2}}\;, jest napisane:

z_1-x-w=0\;
(9.79)

Funkcja tworząca (9.75) dla wielomianów Hermite'a, po wykorzystaniu residuum policzonego w (9.79), piszemy w postaci zwartej:

\Psi(x,w)={{1}\over{e^{-x^2}}}{{e^{-\left(x+w\right)^2}}\over{1-w\cdot 0}}=e^{x^2}e^{-x^2-w^2-2xw}=e^{-w^2-2xw}\;
(9.80)

Zatem możemy napisać (9.80), korzystając przy tym z (9.69), w postaci rozwinięcia:

e^{-w^2-2xw}=\sum_{n=0}^{\infty}{{w^2}\over{n!}}\tilde{H}_n(x)\;
(9.81)

Jeśli przyjmować będziemy w=-v w tożsamości (9.81), wtedy na podstawie definicji wielomianów Hermite'a H(x) przy pomocy \tilde{H}(x)\; (9.39) funkcję tworzącą wielomianu Hn możemy napisać w postaci rozwinięcia:

e^{-\nu^2+2x\nu}=\sum_{n=0}^{\infty}{{\nu^n}\over{n!}}(-1)^n\tilde{H}_n(x)\Rightarrow e^{-\nu^2+2x\nu}=\sum_{n=0}^{\infty}{{\nu^n}\over{n!}}H_n(x)\;
(9.82)

[edytuj] Funkcje tworzące dla wielomianu Laguerre'a

Równanie (9.74) dla wielomianu Laguerre'a (9.45), dla którego zachodzi B(x)=x, _{\rho(x)=x^{\lambda}e^{-x}}\;, przyjmuje postać:

z_1-x-wz_1=0\Rightarrow z_1(1-w)=x\Rightarrow z_1={{x}\over{1-w}}\;
(9.83)

Funkcja tworząca (9.75) dla wielomianów Laguerre'a, po wykorzystaniu residuum policzonego w (9.83), piszemy w postaci rozwinięcia:

{{1}\over{x^{\lambda}e^{-x}}}{{{{x^{\lambda}}\over{(1-w)^{\lambda}}}e^{-{{x}\over{1-w}}}}\over{1-w}}=\sum_{n=0}^{\infty}{{w^n}\over{n!}}L_n(x)\Rightarrow
{{e^{-{{x}\over{1-w}}+{{x(1-w)}\over{(1-w)}}}}\over{(1-w)^{\lambda+1}}}=\sum_{n=0}^{\infty}{{w^n}\over{n!}}L_n(x)\Rightarrow
\;

\Rightarrow{{e^{-{{xw}\over{1-w}}}}\over{(1-w)^{\lambda+1}}}=\sum_{n=0}^{\infty}{{w^n}\over{n!}}L_n(x)
(9.84)


[edytuj] Funkcji sferyczne w matematyce

W tym rozdziale zajmować się będziemy funkcjami sferycznymi, która ta funkcja zależy od dwóch współrzędnych kątowych, którego to zapis Y=Ylm. Funkcje Ylm są wzajemnie ortogonalne do siebie, tzn. to zachodzi związek mówiącej o tej ortogonalności.

(Y_{lm},Y_{l^'m^'})=\delta_{ll^'}\delta_{mm^'}\;
(10.1)

Iloczynem skalarnym dwóch funkcji zależnych od funkcji kątowych określamy wedle warunku:

(f,g)=\int_V \tilde{f}(\phi,\psi)g(\phi,\psi)dV=\int_0^{2\pi}d\theta\int_0^{\pi}\tilde{f}(\theta,\phi)g(\theta,\phi)\sin\phi d\phi\;
(10.2)

[edytuj] Równanie różniczkowe, którego rozwiązaniem są funkcje sferyczne

Równaniem, które się tutaj zajmować się tutaj będziemy, jest to równanie zależne od zmiennych kulistego układu współrzędnych, czyli zależy od zmiennych (r,φ.ξ), określmy przez równanie:

{{\partial^2f}\over{\partial r^2}}+{{2}\over{r}}{{\partial f}\over{\partial r}}+{{1}\over{r^2}}{{\partial}\over{\partial\xi}}\left(\left(1-\xi^2\right){{\partial f}\over{\partial\xi}}\right)+{{1}\over{r^2(1-\xi^2)}}{{\partial^2f}\over{\partial\theta}}=0\;
(10.3)

Funkcję f piszemy jako iloczyn funkcji potęgowej rl i funkcji kulistej Y(θ,φ):

f(r,\xi,\theta)=r^{l}Y(\xi,\theta)\;
(10.4)

Tożsamość (10.4) podstawiamy do równości różniczkowej (10.3), wtedy dostajemy następnie równanie różniczkowe, to dowód tego przejścia pokazujemy:

{{\partial^2}\over{\partial r^2}}(r^lY)+{{2}\over{r}}{{\partial (r^lY)}\over{\partial r}}+{{1}\over{r^2}}{{\partial}\over{\partial\xi}}\left(\left(1-\xi^2\right){{\partial (r^lY)}\over{\partial\xi}}\right)+{{1}\over{r^2(1-\xi^2)}}{{\partial^2(r^lY)}\over{\partial\theta^2}}=0\Rightarrow\;
\Rightarrow
l(l-1)r^{l-2}Y+2lr^{l-2}Y+r^{l-2}{{\partial}\over{\partial\xi}}\left(\left(1-\xi^2){{\partial Y}\over{\partial\xi}}\right)\right)+r^{l-2}{{1}\over{(1-\xi^2)}}{{\partial^2 Y}\over{\partial\theta^2}}=0\Rightarrow
\Rightarrow
l(l+1)Yr^{l-2}+r^{l-2}{{\partial}\over{\partial\xi}}\left(\left(1-\xi^2\right){{\partial Y}\over{\partial\xi}}\right)+r^{l-2}{{1}\over{(1-\xi^2)}}{{\partial^2 Y}\over{\partial\theta^2}}=0\Rightarrow

l(l+1)Y+{{\partial}\over{\partial\xi}}\left(\left(1-\xi^2\right){{\partial Y}\over{\partial\xi}}\right)+{{1}\over{(1-\xi^2)}}{{\partial^2 Y}\over{\partial\theta^2}}=0
(10.5)

Takie samo równanie, co równanie końcowe wynikające przeprowadzonej w punkcie (10.5) otrzymamy z (10.3), tzn. gdy weżniemy dla ujemnych potęg rl-1, czyli dla rozwiązania:

Y(\xi,\theta)=r^{-l-1}Y(\xi,\theta)\;
(10.6)

Co pokazują obliczenia, które wynikają z dodawania czynników wynikające z dwóch pierwszych pochodnych (pierwsza i druga pochodna funkcji) przy czynniku rl-3:

-l(-l-2)-l-1=l^2+2l-l=l^2+l=l(l+1)\;

Funkcja Laplace'a jest funkcją, która jest kombinacją dwóch wyrazów z potęgą ujemną oraz dodatnią, czyli jest kombinacją liniową funkcji (10.4) i funkcji (10.6). Funkcja Y(θ,φ) jest iloczynem dwóch wyrazów, tzn. T(θ) i Φ(φ), co opis tego rozwiązania zapisujemy:

Y(\theta,\theta)=T(\theta)\Theta(\theta)\;
(10.7)

Możemy podstawić rozwiązanie równania kulistego (10.7) do równania różniczkowego (10.5), w takim przypadku możemy napisać od razu po dokonaniu tejże opisywanej operacji:

l(l+1)T\Theta+{{\partial}\over{\partial \xi}}\left(\left(1-\xi^2\right){{\partial T\Theta}\over{\partial\xi}}\right)+{{1}\over{1-\xi^2}}{{\partial T\Theta}\over{\partial\theta^2}}=0\;
(10.8)

Równanie różniczkowe (10.8) dzielimy obustronnie przez wyrażenie zapisane wzorem (10.7), następnie po krótkich przekształceniach i po krótkich przenosinach pewnych wyrazów w taki sposób by po na prawej i lewej stronie rozważanego równania znajdowały się różne funkcje zależne od różnych zmiennych, wtedy dostajemy tożsamość:

(1-\xi^2)\left(l(l+1)+{{1}\over{T}}{{\partial}\over{\partial\xi}}\left[(1-\xi^2){{\partial T}\over{\partial\xi}}\right]\right)=-{{1}\over{\Theta}}{{\partial^2\Theta}\over{\partial\theta^2}}\;
(10.9)

Funkcje znajdujące się po obu stronach równania (10.9) są zależne od innych zmiennych, obie te funkcje są tożsamościowo równe sobie, zatem obie jego strony możemy przyrównać do stałej. Aby tak się stało musimy napisać:

C^2=-{{1}\over{\Theta}}{{\partial^2\Theta}\over{\partial^2\theta}}\Rightarrow \Theta=e^{iC\theta}\;
(10.10)

Aby końcowa tożsamość wynikowa (10.10) była poprawnie sformułowana, to ona na pewno powinna mieć takie same wartości dla φ=0 i 2π:

e^{iC2\pi}=e^0\Rightarrow iC\pi=\pi m\Rightarrow C=m=0,\pm 1,\pm 2,\pm 3,..\;
(10.11)

Wedle obliczeń przeprowadzonych w punkcie (10.11) funkcja (10.10) przyjmuje ostateczną końcową postać:

\Theta(\theta)=e^{im\theta}\;
(10.12)

Jeśli równanie na Θ(θ) (10.12) podstawimy do równania (10.9), otrzymujemy następne równanie różniczkowe na funkcję T, w takim przypadku:

(1-\xi^2)\left(l(l+1)+{{1}\over{T}}{{d}\over{d\xi}}\left[(1-\xi^2){{d T}\over{d\xi}}\right]\right)=m^2\Rightarrow\;
\Rightarrow
(l(l+1)T+{{d}\over{d\xi}}\left[(1-\xi^2){{d T}\over{d\xi}}\right]={{m^2}\over{1-\xi^2}}T\Rightarrow\;
\Rightarrow
{{d}\over{d\xi}}\left[(1-\xi^2){{d T}\over{d\xi}}\right]+\left(l(l+1)-{{m^2}\over{1-\xi^2}}\right)T=0\;
(10.13)

W równaniu (10.13), która określa pewną funkcję T w zależności od parametru m i zmiennej ξ. dokonujemy podstawienia, która jest definicją wyrazu (1-ξ2)m/2 i pewnej funkcji Plm.

T=(1-\xi^2)^{{{m}\over{2}}}P_{lm}\;
(10.14)

Następnym naszym krokiem jest policzenie składnika pierwszego, która znajduje się w równaniu końcowym wynikowym (10.13), zatem policzmy ten wyraz korzystając z definicji funkcji T poprzez iloczyn dwóch funkcji zależnych od ξ (10.14):

{{d}\over{d\xi}}\left[(1-\xi^2){{d T}\over{d\xi}}\right]={{d}\over{d\xi}}\left[(1-\xi^2){{d \left[(1-\xi^2)^{ {{m}\over{2}} }P_{lm}\right]}\over{d\xi}}\right]=\;

={{d}\over{d\xi}}\left\{(1-\xi^2)\left[{{m}\over{2}}(1-\xi^2)^{{{m}\over{2}}-1}(-2\xi)P_{lm}+\left(1-\xi^2\right)^{{{m}\over{2}}}{{dP_{lm}}\over{d\xi}}\right]\right\}=\;
={{d}\over{d\xi}}\left\{
-m\xi(1-\xi^2)^{{{m}\over{2}}}P_{lm}+(1-\xi^2)^{{{m}\over{2}}+1}{{dP_{lm}}\over{d\xi}}\right\}=

=-m(1-\xi^2)^{{{m}\over{2}}}P_{lm}-m\xi(1-\xi^2)^{{{m}\over{2}}-1}{{m}\over{2}}(-2\xi )P_{lm}-m\xi(1-\xi^2)^{{{m}\over{2}}}{{dP_{lm}}\over{d\xi}}
+\;
+({{m}\over{2}}+1)(1-\xi^2)^{{{m}\over{2}}}(-2\xi){{dP_{lm}}\over{d\xi}}+(1-\xi^2)^{{{m}\over{2}}+1}{{d^2P_{lm}}\over{d\xi^2}}=
=(1-\xi^2)^{{{m}\over{2}}+1}{{d^2P_{lm}}\over{d\xi^2}}-2{{dP_{lm}}\over{d\xi}}\xi(1-\xi^2)^{{{m}\over{2}}}(m+1)+(1-\xi^2)^{{{m}\over{2}}-1}\left(m^2\xi^2-m(1-\xi^2)\right)P_{lm}\;
(10.15)

Za pierwszy składnik sumy występującej w sumie po lewej stronie równania różniczkowego (10.13) podstawiamy wyrażenie wynikłe z obliczeń (10.15), to:

(1-\xi^2)^{{{m}\over{2}}+1}{{d^2P_{lm}}\over{d\xi^2}}-2{{dP_{lm}}\over{d\xi}}\xi(1-\xi^2)^{{{m}\over{2}}}(m+1)+(1-\xi^2)^{{{m}\over{2}}-1}\left(m^2\xi^2-m(1-\xi^2)\right)P_{lm}+\;
+\left(l(l+1)-{{m^2}\over{1-\xi^2}}\right)(1-\xi^2)^{{m}\over{2}}P_{lm}=0\;
(10.16)

W celu dalszego przekształcenia równania (10.16) należy dokonać obliczeń dla wyrazów stojących przy czynniku Plm, ale będziemy liczyć bez tego czynnika, co jest dla nas oczywiste dlaczego tak robimy.

(1-\xi^2)^{{{m}\over{2}}-1}\left(m^2\xi^2-m(1-\xi^2)\right)+\left(l(l+1)-{{m^2}\over{1-\xi^2}}\right)(1-\xi^2)^{{m}\over{2}}=\;

=(1-\xi^2)^{{{m}\over{2}}-1}\left(m^2\xi^2-m(1-\xi^2)-m^2\right)+l(l+1)(1-\xi^2)^{{m}\over{2}}=\;
=(1-\xi^2)^{{{m}\over{2}}-1}\left[m^2(\xi^2-1)-m(1-\xi^2)\right]=\;
=-(1-\xi^2)^{{{m}\over{2}}-1}\left(1-\xi^2\right)m(m+1)+l(l+1)(1-\xi^2)^{{m}\over{2}}=\;
=(1-\xi^2)^{{{m}\over{2}}}\left(l(l+1)-m(m+1)\right)
(10.17)

Do równania (10.16) możemy podstawić wynik obliczeń przeprowadzonych w punkcie (10.17) dla wyrazów stojących przy Plm, wtedy mamy wniosek:

(1-\xi^2)^{{{m}\over{2}}+1}{{d^2P_{lm}1}\over{d\xi^2}}-2{{dP_{lm}}\over{d\xi}}\xi(1-\xi^2)^{{{m}\over{2}}}(m+1)+(1-\xi^2)^{{{m}\over{2}}}\left(l(l+1)-m(m+1)\right)P_{lm}=0\;
(10.18)

Równanie różniczkowe (10.18) dzielimy obustronnie przez wyrażenie _{\left(1-\xi^2\right)^{{{m}\over{2}}}}\;, co można tak zrobić przy założeniu, że mamy _{\xi\neq \pm 1}\;, w takim przypadku równanie (10.18) przyjmuje postać:

(1-\xi^2){{d^2P_{lm}}\over{d\xi^2}}-2{{dP_{lm}}\over{d\xi}}\xi(m+1)+\left(l(l+1)-m(m+1)\right)P_{lm}=0\;
(10.19)

W równaniu (10.19), gdy m zastąpimy przez zero, wtedy otrzymamy równanie Legendre'a wprowadzone w punkcie (9.16), zatem możemy powiedzieć, że Pl0 są to wielomiany Legendre'a. Równanie różniczkowe (10.19) możemy zróżniczkować względem zmiennej ξ, w takim przypadku mamy równość wynikową w porównaniu do poprzedniej równości:

-2\xi P_{lm}^{''}+(1-\xi^2)P_{lm}^{'''}-2P_{lm}^{'}(m+1)-2P_{lm}^{''}\xi(m+1)+\left(l(l+1)-m(m+1)\right)P^'_{lm}=0\Rightarrow\;

\Rightarrow(1-\xi^2)P_{lm}^{'''}-2\xi(m+2)P^{''}+\left(l(l+1)-m(m+1)-2(m+1)\right)P^{'}_{}=0\Rightarrow\;

(1-\xi^2)\left(P_{lm}^{'}\right)^{''}-2\xi(m+2)\left(P^{'}\right )^'+\left(l(l+1)-m(m+1)-2(m+1)\right)\left(P_{lm}\right)^'=0\;
(10.20)

Ze wzoru końcowego możemy powiedzieć, że spełniona jest tożsamość:

P_{l,m+1}=P^'_{lm}\;
(10.21)

Wykorzystując wzór na wielomiany Legendre'a, które są zdefiniowane wzorem (9.33) oraz wzór na funkcje sferyczne (10.21) dochodzimy wtedy do wniosku, że wielomiany, które są rozwiązaniami równania (10.19), które to ogólnie przedstawienie przez Plm możemy napisać:

P_{lm}=P_l^{(m)}={{(-1)^l}\over{2^'l!}}\left[(1-\xi^2)^l\right]^{(l+m)}\;
(10.22)

Z otrzymanego wzoru (10.22) dochodzimy do wniosku, że parametr m występujący we wzorze na równanie różniczkowe (10.19) przebiega wartości:

m=-l,-l+1,-l+2,...,l-2,l-1,l\;
(10.23)

Końcowy wzór na rozwiązanie równania (10.13) jest w postaci:

Y_{lm}\left(\xi,\theta\right)=N(1-\xi^2)^{{{|m|}\over{2}}}\left(P_l(\xi)\right)^{(m)}e^{im\theta}\;
(10.24)

[edytuj] Funkcje sferyczne a jego ortogonalność

Mając funkcje sferyczne (10.24), można udowodnić, że te funkcje wraz z odpowiednio dobraną stałą N jest funkcją ortogonalną, zatem z definicji iloczynu skalarnego i wspomnianej funkcji Ylm możemy napisać tożsamość:

(Y_{lm},Y_{'^'m^'})=N_{lm}N_{l'^'m^'}\int^1_{-1}d\xi(1-\xi^2)^{{{|m|}\over{2}}+{{|m^'|}\over{2}}}P_{l}^{|m|}(\xi)P_{l^'}^{(m^')}(\xi)\int_0^{2\pi}e^{(-m+m^')\theta}d\theta\;
(10.25)

Ostatnia całka oznaczona występująca we wzorze na iloczyn skalarny dwóch funkcji kulistych jest równa zero, gdy m\neq m^'\;, a jest różna od zera, gdy m=m' i jest ona równa 2π, w takim razie (10.25) możemy przepisać w postaci:

(Y_{lm}, Y_{l^'m^'})=2\pi N_{lm}N_{l'^'m}\delta_{mm^'}\int^1_{-1}d\xi\left[(1-\xi^2)^{|m|}P_{l}^{m}\right](\xi)P_{l^'}^{(m)}(\xi)\;
(10.26)

Wyrażenie (10.25) całkujemy przez części i wyrazy stojące pod całką są równe zero dla ξ=-1,1, zatem takim bądź razem dostajemy wniosek:

(Y_{lm},Y_{l^'m^'})=2\pi N_{lm}N_{l'^'m}\delta_{m^'m}(-1)^m\int_{-1}^{1}d\xi\left(\left(1-\xi^2\right)^mP_l^{(m)}\right)^{(m)}P_{l^'}\;
(10.27)

We wzorze (10.27), gdy zachodzi l'>l, toteż całka oznaczona występująca w tym samym wzorze jest równa zero, co wynika że każdy wielomian ortogonalny P_l^'\; ma iloczyn skalarny równy zero, dla stopnia niższego niż posiadany stopień przez wielomian Pl, w takim przypadku całka występująca we wzorze (10.27) jest różna od zera, zatem w takim razie możemy napisać tożsamość, czemu jest równe (10.25):

(Y_{lm}, Y_{l^'m^'})=\operatorname{const}\cdot \delta_{l^'l}\delta_{mm^'}\;
(10.28)

[edytuj] Normowanie funkcji sferycznych

Gdy we wzorze (10.26) podstawimy l=l' i m=m', wtedy ten wspomniany wzór przedstawia się:

||Y_{lm}||=2\pi N_{lm}^2(-1)^m\int_{-1}^{1}d\xi\left(\underbrace{\left(1-\xi^2\right)^mP_l^{(m)}}_{W(\xi)}\right)^{(m)}P_{l}\;
(10.29)

Pod całką wystepuje wielomian _{\left(1-\xi^2\right)^mP_l}\;, który jest rzędu l, ale również wielomian Pl, też jest takiego rzędu, w takim razie całka występująca we wzorze (10.27) nie jest równa zero. Rozważmy wielomian W(ξ) występujący we wzorze (10.29), zatem jest taki, że potęgi mniejsze niż l, są wycinane przez wielomian Legendre'a P_{l}\;, bo to jest wielomian ortogonalny, w takim przypadku w całce należy posługiwać się tylko największą potęgą tegoż wielomianu, bo pozostałe potęgi są wycinane.

Możemy teraz określić największy wyraz stojący przy wielomianie W(ξ), w takim przypadku możemy napisać czynnik stojący przy największej potędze w wspominanym wielomianie, zatem ten współczynnik:

w=(-1)^ma_{l}\left[l(l-1)(l-2)\cdot...\cdot(l-m+1)\right]\left[\left(l+m\right)\left(l+m\right)\left(l+m-1\right)\cdot...\cdot(l+1)\right]\;
(10.30)

Liczby całkowite występujące w pierwszym wyrazie pochodzą z różniczkowania wielomianu Pl, a liczby całkowite w drugim czynniku pochodzą z różniczkowania całego wyrażenia w dużym nawiasie. Wzór (10.30) możemy napisać w postaci zwartej:

w=(-1)^ma_l{{(l+m)!}\over{(l-m)!}}\;
(10.31)

Zatem norma funkcji kulistej Ylm (10.29), wiedząc że w iloczynie skalarnym iloczyn alξl można uzupełnić do pełnego wielomianu Pl i zarazem znając normę wielomianu Legendre'a (9.56), określamy według:

||Y_{lm}||^2=2\pi N_{lm}^2{{(l+m)!}\over{(l-m)!}}\int_{-1}^1a_l\xi^lP_l(\xi)d\xi=2\pi N_{lm}^2{{(l+m)!}\over{(l-m)!}}{{2}\over{2l+1}}=N_{lm}^2{{4\pi}\over{2l+1}}{{(l+m)!}\over{(l-m)!}}\;
(10.32)

Ze wzoru wynikającego z (10.32) możemy napisać stałą Nlm, bo norma funkcji kulistej jest równa jeden, jako:

N_{lm}=\sqrt{{{2l+1}\over{4\pi}}{{(l-m)!}\over{(l+m)}}}\;
(10.33)

Pełny wzór (10.24) uzyskujemy podstawiając do niego tożsamość za stałą Nlm (10.33):

Y_{lm}\left(\xi,\phi\right)=\sqrt{{{2l+1}\over{4\pi}}{{(l-m)!}\over{(l+m)}}}(1-\xi^2)^{{{|m|}\over{2}}}\left(P_l(\xi)\right)^{(m)}e^{im\phi}=\;

=\sqrt{{{2l+1}\over{4\pi}}{{(l-m)!}\over{(l+m)}}}\sin^{|m|}\phi {{d^{|m|}P_l(\cos\phi)}\over{d(\cos\phi)^{|m|}}}e^{im\theta}
(10.34)

[edytuj] Funkcje Bessela

Będziemy się tutaj zajmować funkcjami Bessela, którego to on znany jest bardzo w matematyce i fizyce. Argumentem funkcji Bessela będziemy oznaczać przez x, a wskaźnikiem funkcji są to współczynniki rzeczywiste. Funkcje Bessela oznaczamy je przez Jν.

[edytuj] Równanie różniczkowe Bessela i jego rozwiązania

Równanie różniczkowe, które definiuje funkcje Bessela jest to równanie określone:

x^2J_{\nu}^{''}+xJ_{\mu}^{'}+(x^2-\nu^2)J_{\nu}=0\;
(11.1)

Poszukujemy rozwiązania równania różniczkowego (11.1) w postaci funkcji, w której wolny wyraz a0 jest różny od zera, w takim bodź razem możemy to otrzymać, gdy szereg potęgowy pomnożymy przez funkcję xλ tak jak poniżej, zatem ostatecznie w takim razie funkcje Bessela piszemy:

J_{\nu}=x^{\lambda}\sum_{n=0}^{\infty}a_nx^n=\sum_{n=0}^{\infty}a_nx^{n+\lambda}\;
(11.2)

Wyznaczmy pierwszą i drugą pochodną funkcji Bessela (11.2), która jest proponowanym rozwiązaniem równania różniczkowego (11.1):

J^{'}=\sum_{n=0}^{\infty}a_n (\lambda+n)x^{n+\lambda-1}\;
(11.3)
J^{''}=\sum_{n=0}^{\infty}a_n(\lambda+n)(\lambda+n-1)x^{n+\lambda-1}\;
(11.4)

Możemy podstawić funkcję Bessela (11.2), a także pierwszą i drugą pochodną funkcji Bessela (11.3) i (11.4) do równania różniczkowego Bessela (11.1), otrzymujemy:

x^2\left[\sum_{n=0}^{\infty}a_n(\lambda+n)(\lambda+n-1)x^{n+\lambda-2}\right]+x\sum_{n=0}^{\infty}a_n (\lambda+n)x^{n+\lambda-1}+(x^2-v^2)\sum_{n=0}^{\infty}a_nx^{n+\lambda}=0\;
(11.5)

Po krótkich przekształceniach, tzn. czynników stojących przed sumami jako czynniki włączamy pod tą sumę i po przegrupowaniu wyrazów:

\sum_{n=0}^{\infty}\left[(n+\lambda)^2-\nu^2\right]a_nx^n+\sum_{n=0}^{\infty}a_nx^{n+2}=0\;
(11.6)

Współczynnik a0 jest tak zdefiniowane w szeregu (11.2) by był różny od zera, w takim razie z równania (11.6) możemy otrzymać wyraz stojący przy potędze o wykładniku zerowym z liczby x:

(\lambda^2-\nu^2)a_0=0\;
(11.7)

Z równości (11.7) otrzymujemy dwa rozwiązania na parametr λ, jedno z plusem a drugie z minusem, którego to piszemy za pomocą jednego ogólnego wzoru:

\lambda=\pm\nu\;
(11.8)

Jedno rozwiązaniu z plusem we wzorze zapisywanej ogólnie w punkcie (11.8) odpowiada rozwiązaniu regularnemu, a drugie z minusem odpowiada rozwiązaniu osobliwemu, które to w punkcie x=0 funkcja Besella (11.2) ma wartość osobliwą.

Współczynnik stojący w tożsamości (11.6) stojący przy pierwszej potędze, tzn. przy x1 dla naszego wspomnianego równanie ma postać:

0=\left[(1+\lambda)^2-\nu^2\right]a_1=\left[(1\pm\nu)-\nu^2\right]a_1=\left[1+\nu^2\pm\nu-\nu^2\right]a_1=\left[1\pm2\nu\right]a_1\Rightarrow
\Rightarrow 0=\left(1\pm 2\nu\right)a_1\;
(11.9)

Patrząc na warunek na liczbę λ według (11.8), to z (11.9) wynika, że a1 jest równa zero. Równanie (11.6) możemy przekształcić do tożsamości:

\sum_{n=0}^{\infty}\left[(n+\nu)^2-\lambda^2\right]a_nx^n+\sum_{n=2}^{\infty}a_{n-2}x^{n}=0\;
(11.10)

W takim bodź razem w równaniu różniczkowym (11.10) otrzymujemy wniosek na współczynniki an we funkcji Bessela w zależności od współczynników an-2, zatem poszczególne współczynniki:

\sum_{n=0}^{\infty} n(n+2\lambda)x^{n}+\sum_{n=2}^{\infty}a_{n-2}x^{n}=0\Rightarrow a_n=-a_{n-2}{{1}\over{n(n+2\lambda)}}\;
(11.11)

Ale ponieważ a1 jest równy zero co wcześniej wykazaliśmy w punkcie (11.9), to również na podstawie (11.11) ma miejsce warunek:

a_{2l+1}=0, \mbox{ dla } 0,1,2,...\;
(11.12)

Dla indeksów parzystych można udowodnić, że istnieje ogólny wzór na współczynniki a2l, który zapisujemy przy pomocy wzoru poniżej wynikający ze wzoru ogólnego na współczynniki (11.11):

a_{2l}={{1}\over{2l(2l+2\lambda)}}a_{2l-2}=(-1)^l{{a_0}\over{2^{2l}l!(l+\lambda)(l-1+\lambda)...(1+\lambda)}}\;
(11.13)

Mając na uwadze uproszczenie ogólnych formuł przyjmijmy, że współczynnik a0 przyjmuje szczególna formę zapisywaną przy pomocy funkcji Γ(x) definiowana w punkcie (5.12):

a_0={{1}\over{2^{\lambda}\Gamma(1+\lambda)}}\;
(11.14)

Biorąc na uwadze wzór (11.14) na współczynnik a0, wtedy wzór (11.13) na współczynnik a2l przy wykorzystywaniu wzoru zapisany w punkcie (5.24) piszemy w formie:

a_{2l}=(-1)^l{{1}\over{2^{2l+\lambda}l!\Gamma(l+\lambda+1)}} \mbox{  dla  }(l=0,1,2,3,...)\;
(11.15)

Ponieważ przyjmujemy rozwiązanie regularne, więc z tożsamości (11.8) wybieramy rozwiązanie z plusem, w takim przypadku szereg Bessela przyjmuje ostateczną formę:

J_{\nu}(x)=\sum_{l=0}^{\infty}(-1)^l{{1}\over{l!\Gamma(l+\nu+1)}}\left({{x}\over{2}}\right)^{2l+\nu}\;
(11.16)

[edytuj] Funkcje Bessela o indeksie całkowitym i jego funkcja tworząca

Jeśli w funkcji (11.16) parametr ν jest liczbą naturalną ν=n=0,1,2,3,.., to funkcja Bessela możemy napisać dla tak określonego ν z definicji funkcji Jν, w której występuje funkcją Γ zależna od całkowitego parametru, którego postać jest Γ(l+n+1)=(l+n)!:

J_{\nu}(x)=\sum_{l=0}^{\infty}(-1)^l{{1}\over{l!(n+l)!}}\left({{x}\over{2}}\right)^{2l+n}\;
(11.17)

Następnym krokiem jest udowodnienie, że funkcją tworzącą wielomianu Bessela (11.17) jest funkcją w postaci wzoru _{e^{{{x}\over{2}}(w-{{1}\over{w}})}}\;:

\Psi(w,x)=e^{{{x}\over{2}}(w-{{1}\over{w}})}=e^{{{xw}\over{2}}}e^{-{{x}\over{2w}}}=\sum_{m=0}^{\infty}{{1}\over{m!}}\left({{xw}\over{2}}\right)^m\sum_{l=0}^{\infty}(-1)^{l}{{1}\over{l!}}\left({{x}\over{2w}}\right)^l=\;
=\sum_{m=0}^{\infty}\sum_{l=0}^{\infty}(-1)^l{{1}\over{l!m!}}\left({{x}\over{2}}\right)^{l+m}w^{m-l}\;
(11.18)

We wzorze (11.18) wprowadźmy parametr l+m zamiast parametru m, wtedy wspomniane równanie piszemy:

\Psi(w,x)=\sum_{m=-\infty}^{\infty}\left[\sum_{l=0}^{\infty}(-1)^l{{1}\over{l!(l+n)!}}\left({{x}\over{2}}\right)^{2l+1}\right]w^n\;
(11.19)

Wyrażenie stojące w nawiasie we wzorze (11.19) są to funkcje Bessela, wtedy funkcja tworząca:

\Psi(w,x)=e^{{{x}\over{2}}\left(w-{{1}\over{w}}\right)}=\sum_{m=-\infty}^{\infty}J_n(x)w^n\;
(11.19)

[edytuj] Funkcje Bessela z indeksem i jego przestawienie całkowe

We wzorze (11.19) dokonajmy podstawienia pod funkcję tworzącą Bessela w postaci w=e:

\Psi(w,x)=e^{{{x}\over{2}}\left(w-{{1}\over{w}}\right)}=e^{{{x}\over{2}}\left(e^{i\phi}-e^{-i\phi}\right)}=e^{{{x}\over{2}}i 2\sin\phi}=e^{ix\sin\phi}\;
(11.20)

Obie strony tak otrzymanej równości (11.20) mnożymy obustronnie przez eimφ, a następnie całkujemy obustronnie przez zmienną φ w granicach 0 do 2π, wtedy piszemy tożsamość:

\int_{0}^{2\pi}e^{i(x\sin\phi-m\phi)}d\phi=\sum_{n=-\infty}^{\infty}J_n(x)\int_0^{2\pi}e^{i(n-m)}d\phi\;
(11.21)

Prawa strona równości (11.21) jest równa zero, gdy n jest nie równe m, a jest różna od zera i równa 2π, gdy n=m, wtedy możemy napisać wzór na funkcję Bessela wynikającą ze wspomnianego wzoru:

J_{m}(x)={{1}\over{2\pi}}\int_0^{2\pi}e^{i(x\sin\phi-m\phi)}d\phi\;
(11.22)

W szczególnym przypadku, gdy w równaniu (11.22) współczynnik m jest równy zero, więc to ostatnie równanie na funkcję Bessela J0, tak by po drugiej równości dokonać podstawienia φ:=π/2+φ, i ze względu na okresowość funkcji cosφ, piszemy jako:

J_0(x)={{1}\over{2\pi}}\int_0^{2\pi}e^{ix\sin\phi}d\phi={{1}\over{2\pi}}\int^{2\pi-{{\pi}\over{2}}}_{-{{\pi}\over{2}}
}e^{ix\cos\phi}d\phi=\left(\int_0^{2\pi}-\int_{2\pi-{{\pi}\over{2}}}^{2\pi}+\int_{-{{\pi}\over{2}}}^0\right)e^{ix\cos\phi}d\phi=\;
={{1}\over{2\pi}}\int_0^{2\pi}e^{ix\cos\phi}d\phi\;
(11.23)

[edytuj] Funkcje Bessela o wskaźniku równej 1/2

Funkcje Bessela (11.16) dla ν=1/2, dla którego zapis o indeksie równej połowie jedynki, są równe:

J_{{{1}\over{2}}}=\sum_{l=0}^{\infty}(-1)^l{{1}\over{l!\Gamma\left(l+{{3}\over{2}}\right)}}\left({{x}\over{2}}\right)^{2l+{{1}\over{2}}}\;
(11.24)

Z teorii funkcji Γ możemy napisać tożsamość, którego można rozpisać funkcję Γ przy wykorzystaniu definicji funkcji Γ dla ν równego 1/2:

\Gamma\left(l+{{3}\over{2}}\right)=(l+{{1}\over{2}})(l-{{1}\over{2}})\cdot...\cdot \Gamma\left({{1}\over{2}}\right)=\sqrt{\pi}{{(2l+1)!!(2l+2)!!}\over{2^{l}(2l+2)!!}}=\;
=
\sqrt{\pi}{{(2l+2)!}\over{2^{l}2^{l+1}(l+1)!}}=\sqrt{\pi}{{(2l+2)!}\over{l^{2l+1}(l+1)!}}=\sqrt{{\pi}\over{2}}{{(2l+1)!}\over{l!2^{2l+{{1}\over{2}}}}}\;
(11.25)

Na podstawie tożsamości wyprowadzonej w obliczeniach w punkcie (11.25) wzór na funkcję Bessela zapisane w punkcie (11.24) piszemy wedle:

J_{{{1}\over{2}}}=\sqrt{{{2}\over{\pi x}}}\sum^{\infty}_{0}(-1)^l{{x^{2l+1}}\over{(2l+1)!}}\;
(11.26)

Szereg zapisanej w punkcie (11.26) jest to szereg funkcji sinus z liczby x, zatem ta nasza tutaj rozważana funkcja Bessela jest to po prostu:

J_{{{1}\over{2}}}(x)=\sqrt{{2}\over{\pi x}}\sin x\;
(11.27)

Funkcje Bessela (11.16) dla ν=-1/2 zapisujemy wedle sposobu, którego zapis jest o indeksie równym minus połowie jedynki:

J_{-{{1}\over{2}}}(x)=\sum^{\infty}_{l=0}{{1}\over{l!\Gamma\left(l+{{1}\over{2}}\right)}}\left({{x}\over{2}}\right)^{2l-{{1}\over{2}}}\;
(11.28)

Z teorii funkcji Gamma możemy napisać tożsamość, którego jest rozwinięciem funkcji Γ dla ν połówkowego i równego 1/2, którą piszemy:

\Gamma\left(l+{{1}\over{2}}\right)=\left(l-{{1}\over{2}}\right)\left(l-{{3}\over{2}}\right)...\Gamma\left({{\pi}\over{}2}\right)=
\sqrt{\pi}{{(2l-1)!!(2l)!!}\over{2^{l-1}(2l)!!}}=\;
=\sqrt{\pi}{{(2l)!}\over{2^{2l-1}l!}}=\sqrt{{{\pi}\over{2}}}{{(2l)!}\over{l!2^{2l-{{3}\over{2}}}}}\;
(11.29)

Na podstawie tożsamości wyprowadzonej w obliczeniach w punkcie (11.28) wzór na funkcję Bessela zapisaną w punkcie (11.26) piszemy poniżej:

J_{-{{1}\over{2}}}\left(x\right)=\sqrt{{{2}\over{\pi x}}}\sum_{l=1}^{\infty}{{2^{2l-{{3}\over{2}}}}\over{(2l)!}}{{x^{2l}}\over{2^{2l}}}=
\sqrt{{{2}\over{\pi x}}}\sum_{l=0}^{\infty}(-1)^l{{l!2^{2l-{{3}\over{2}}}}\over{l!(2l)!}}{{x^{2l}}\over{2^{2l-{{3}\over{2}}}}}
=\sqrt{{{2}\over{\pi x}}}\sum^{\infty}_{l=0}(-1)^l{{x^{2l}}\over{(2l)!}}
(11.30)

Szereg zapisany w punkcie (11.30) jest to szereg funkcji kosinus z liczby x, zatem tą naszą tutaj rozważaną funkcję Bessela piszemy:

J_{-{{1}\over{2}}}(x)=\sqrt{{2}\over{\pi x}}\cos x\;
(11.31)

[edytuj] Funkcje Bessela jako rozwiązania wzorów rekurencyjnych

Pokażemy, że wzór rekurencyjny dla funkcji Bessela o wskaźniku o wartości ν+1 wyraża się w zależności od współczynnika ν wzorem za pomocą operacji różniczkowania funkcji Bessela względem wskaźnika ν, dla której pod różniczkowaniem względem "x" jest iloczyn funkcji potęgowej x i funkcji Bessela (11.16):

J_{\nu+ 1}=- x^{\nu}{{d}\over{dx}}\left(x^{-\nu}J_{\nu}\right)\;
(11.32)

Wzór (11.32) udowodniamy przez bezpośrednio przez wstawianie do niego funkcji Bessela Jν zdefiniowaną w punkcie (11.16):

{{d}\over{dx}}J_{\nu}={{d}\over{dx}}x^{-\nu}\left(\sum_{l=0}^{\infty}(-1)^l{{1}\over{l!\Gamma(l+\nu+1)}}{{x^{2l}}\over{2^{2l+\nu}}}\right)=\;
=
-\sum_{l=1}^{\infty}{{1}\over{(l-1)!\Gamma(l-1+\nu+1+1)}}{{x^{2l-1}}\over{2^{2(l-1)+\nu+1}}}=-\sum_{l=0}^{\infty}(-1)^l{{1}\over{l!\Gamma(l+\nu+1+1)}}{{x^{2l+1}}\over{2^{2l+\nu+1}}}
(11.33)

Zatem na podstawie obliczeń przeprowadzonej w punkcie (11.33) możemy zapisać wyrażenie, które jak udowodnimy w końcowych dysputach, że jest to po prostu rozważane wyrażenie, które jest funkcją Bessela o wskaźniku ν+1.

-x^{\nu}{{d}\over{dx}}J_{\nu}=-x^{\nu}\left(-\sum_{l=0}^{\infty}(-1)^l{{1}\over{l!\Gamma(l+\nu+1+1)}}{{x^{2l+1}}\over{2^{2l+\nu+1}}}\right)=\;
=\sum_{l=0}^{\infty}(-1)^l{{1}\over{l!\Gamma(l+\nu+1+1)}}\left({{x}\over{2}}\right)^{2l+\nu+1}=J_{\nu+1}\;
(11.34)

Udowodnijmy następną rekurencję, której to element Jν-1 jest pisany przy pomocy wzoru na Jν za pomocą operacji różniczkowania, którego to rekurencja jest:

J_{\nu-1}=x^{-\nu}{{d}\over{dx}}\left(x^{\nu}J_{\nu}\right)\;
(11.35)

Aby udowodnić wzór (11.35) musimy napisać wyrażenie różniczkowe, która jest iloczynem funkcji x i pochodnej z iloczynu funkcji xν i funkcji Bessela Jν, wtedy mamy problem:

x^{-\nu}{{d}\over{dx}}\left(x^{\nu}J_{\nu}\right)=x^{-\nu}{{d}\over{dx}}\left(\sum_{l=0}^{\infty}(-1)^l{{1}\over{l!\Gamma(l+\nu+1)}}\left({{x}\over{2}}\right)^{2l+2\nu}\right)=\;
=
\sum_{l=0}^{\infty}(-1)^l{{1}\over{l!\Gamma(l+\nu+1)}}(2l+2\nu){{x^{2l+\nu-1}}\over{2^{2l+\nu}}}=\sum_{l=0}^{\infty}(-1)^l{{1}\over{l!\Gamma(l+\nu-1+1)}}{{x^{2l+\nu-1}}\over{2^{2l+\nu-1}}}=J_{\nu-1}
(11.36)

Co kończy dowód tożsamości (11.35).

[edytuj] Jak się zachowuje funkcja Bessela w pobliżu punktu x=0

Mając wzór na funkcje Bessela zdefiniowaną w punkcie (11.16), który można zapisać dla punktu blisko zera pomijając wyrazy wyższego rzędu wedle potęg z liczby x, bo następne potęgi dla małego otoczenia w tymże punkcie są rzędu niższego niż ν, są bardzo malutkie w porównaniu ze wspomnianym wyrazem, w takim przypadku funkcja Bessela piszemy:

J_{\nu}(x)\simeq{{1}\over{2^{\nu}\Gamma(\nu+1)}}x^{\nu}\;
(11.37)

Niech wskaźnik ν jest liczbą całkowitą, w takim przypadku możemy przestawić funkcję J-n w zależności od Jn wedle sposobu poniżej, wiedząc, że funkcja Γ o współczynniku ujemnym przyjmuje wartość nieskończoną, a jego odwrotność jest zero.

J_{-n}(x)=\sum_{l=0}^{\infty}(-1)^l{{1}\over{l!\Gamma(l-n+1)}}\left({{x}\over{2}}\right)^{2l-n}\simeq (-1)^n{{x^{n}}\over{n!2^n}}=(-1)^nJ_n(x)\;
(11.38)

[edytuj] Asymptotyczne zachowania się funkcji Bessela ze wskaźnikiem ułamkowym

Wykażemy, że dla bardzo dużego x funkcja Jl+1/2(x) ma postać asymptotyczną, którego wygląd w zależności od parametru "l" jest on zdefiniowany jako:

J_{l+{{1}\over{2}}}(x)=\sqrt{{{2}\over{\pi x}}}\sin\left(x-l{{\pi}\over{2}}\right)\;
(11.39)

Teraz zastosujemy wzór (11.32), by udowodnić rozwiązanie asymptotyczne (11.39), w tym celu przy dowodzie dla l=0 dostajemy dokładny wzór (11.27). Następnym krokiem naszego dowodu, że musimy udowodnić przejście z twierdzenia l do twierdzenia l+1 dla asymptotycznego przypadku dla x bardzo dużego:

J_{l+{{3}\over{2}}}=-x^{l+{{1}\over{2}}}{{d}\over{dx}}\left(x^{-l-{{1}\over{2}}}J_{l+{{1}\over{2}}}\right)=
-x^{l+{{1}\over{2}}}{{d}\over{dx}}\left((x^{-l-{{1}\over{2}}}\sqrt{{{2}\over{\pi x}}}\sin\left(x-l{{\pi}\over{2}}\right)\right)'\;

-x^{l+{{1}\over{2}}}\sqrt{{{2}\over{\pi}}}{{d}\over{dx}}\left[{{\sin\left(x-l{{\pi}\over{2}}\right)}\over{x^{l+1}}}\right]=
-x^{l+{{1}\over{2}}}\sqrt{{{2}\over{\pi}}}\left[{{\cos\left(x-l{{\pi}\over{2}}\right)}\over{x^{l+1}}}-(l+1){{\sin\left(x-l{{\pi}\over{2}}\right)}\over{x^{l+2}}}\right]
(11.40)

Wykażemy że drugi wyraz występujący w drugim członie jak odjemnik w nawiasie jest wielkością pomijalną ze względu, że mianownik odjemnej jest rząd niższy niż mianownik odjemnika, zatem odjemnik możemy pominąć, w takim bądź razem możemy napisać wyprowadzenie (11.40):

J_{l+{{3}\over{2}}}=-\sqrt{{{2}\over{\pi x}}}\cos\left(x-l{{\pi}\over{2}}\right)=\sqrt{{{2}\over{\pi x}}}\sin\left(x-(l+1){{\pi}\over{2}}\right)\;
(11.41)

Co kończy dowód twierdzenia (11.39) na podstawie twierdzenia o indukcji zupełnej. Wykażemy, że dla bardzo dużego x funkcja Jl-1/2 ma postać asymptotyczną, którego wygląd w zależności od parametru "l" jest jako:

J_{-l-{{1}\over{2}}}(x)=(-1)^l\sqrt{{{2}\over{\pi x}}}\cos\left(x-l{{\pi}\over{2}}\right)\;
(11.42)

Teraz zastosujemy wzór (11.35), by udowodnić wzór (11.41), w tym celu udowodnimy nasz wzór dla l=0 dla którego dostajemy dokładny wzór (11.31). Następnym krokiem naszego dowodu, że musimy udowodnić przejście z twierdzenia l do twierdzenia l+1 dla asymptotycznego przypadku x bardzo dużego:

J_{-l-{{3}\over{2}}}(x)=x^{l+{{1}\over{2}}}{{d}\over{dx}}\left(x^{-l-{{1}\over{2}}}J_{\nu}\right)=x^{l+{{1}\over{2}}}{{d}\over{dx}}\left(x^{-l-{{1}\over{2}}}(-1)^l\sqrt{{{2}\over{\pi x}}}\cos\left(x-l{{\pi}\over{2}}\right)\right)=\;

=\sqrt{{2}\over{\pi}}(-1)^lx^{l+{{1}\over{2}} } {{d}\over{dx}} {{\cos\left(x-l{{\pi}\over{2}}\right)}\over{x^{l+1} }}=\;
=(-1)^l\sqrt{{2}\over{\pi}}x^{l+{{1}\over{2}} } \left(-{{\sin\left(x-l{{\pi}\over{2}}\right)}\over{x^{l+1}}}-(l+1){{\cos\left(x-l{{\pi}\over{2}}\right)}\over{x^{l+2}}}\right)\;
(11.43)

Wyraz drugi występujący w drugim członie jak odjemnik w nawiasie jest wielkością pomijalną ze względu, że mianownik odjemnej jest rząd niższy niż mianownik odjemnika, zatem odjemnik możemy pominąć, w takim bądź razem możemy napisać wyprowadzenie (11.43):

J_{-l-{{3}\over{2}}}(x)=(-1)^{l+1}\sqrt{{2}\over{\pi x}}\sin\left(x-l{{\pi}\over{2}}-{{1}\over{2}}\pi+{{1}\over{2}}\pi\right)=(-1)^{l+1}\sqrt{{2}\over{\pi x}}\cos\left(x-(l+1){{\pi}\over{2}}\right)\;
(11.44)

Co kończy dowód wzoru (11.41) na podstawie twierdzenia o indukcji zupełnej.

[edytuj] Funkcje Neumanna i Hankela a ich powiązanie z funkcjami Bessela

Funkcję Neumanna Nν, które sa bardzo związane z funkcjami Bessela, jak później powiemy. Te funkcje są osobliwe w punkcie x=0, jego definicja jest napisana wzorem wedle schematu:

N_{\nu}={{J_{v}\cos(\pi\nu)-J_{-\nu}}\over{\sin\pi \nu}}\mbox{  dla  }(v\neq 0,\pm 1,\pm 2,...)\;
(11.45)

Dla indeksów całkowitych funkcje Neumanna uzyskujemy w granicy dla ν, która jest liczbą określoną przy wzorze (11.45), której granica jest:

N_n=\lim_{\nu\rightarrow n} N_{\nu}\;
(11.46)

Jeśli przyjmować będziemy, że wielkość ν jest podana wzorem _{\nu=l+{{1}\over{2}}}\;, w takim przypadku wzór (11.45) przyjmować będziemy wzorem:

N_{l+{{1}\over{2}}}={{\cos\left(\left(l+{{1}\over{2}}\right)\pi\right)J_{\nu+{{1}\over{2}}}-J_{-l-{{1}\over{2}}}}\over{\sin\left(\left(l+{{1}\over{2}}\right)\pi\right)}}={{-\sin (l\pi)J_{\nu+{{1}\over{2}}} -J_{-l-{{1}\over{2}}}}\over{\cos l\pi}}=\;
={{-J_{-l-{{1}\over{2}}}}\over{(-1)^l}}=(-1)^{l+1}J_{-l-{{1}\over{2}}}\;
(11.47)

Funkcję Hankela przestawiamy jako kombinację funkcji Bessela (11.16) i Neumanna Nν (11.45) w postaci:

H^*_{\pm}=J_{\nu}\pm i N_{\nu}\;
(11.48)

[edytuj] Wprowadzenie do sferycznych funkcji Bessela

Sferyczne funkcje Bessela oznazczamy przez jl(x), a także funkcje Neumanna i Hankela piszemy jako:

j_l(x)=\sqrt{{\pi}\over{2x}}J_{l+{{1}\over{2}}}\;
(11.49)
n_j=(-1)^{l+1}\sqrt{{{\pi}\over{2x}}}J_{-l-{{1}\over{2}}}(x)\;
(11.50)
h^*_l=j_l\pm i n_l\;
(11.51)

Wyżej wymienione funkcje możemy zapisać w postaci asymptotycznej korzystając ze wzoru (11.39), dochodzimy do związków, że funkcja Bessela (11.49) jest napisana wzorem poniżej:

j_l(x)=\sqrt{{\pi}\over{2x}}\sqrt{{{2}\over{\pi x}}}\sin\left(x-l{{\pi}\over{2}}\right)={{1}\over{x}}\sin\left(x-l{{\pi}\over{2}}\right)\;
(11.52)

Wyżej wymienione funkcje możemy zapisać w postaci asymptotycznej korzystając ze wzoru (11.42) dochodzimy do związku, że funkcja Neumanna (11.50) ma wygląd:

n_l=(-1)^{l+1}\sqrt{{{\pi}\over{2x}}}(-1)^l\sqrt{{{2}\over{\pi x}}}\cos\left(x-l{{\pi}\over{2}}\right)=-{{1}\over{x}}\cos\left(x-l{{\pi}\over{2}}\right)\;
(11.53)

A na sam koniec podamy jak wygląda funkcja Hankela dla jej przypadku asymptotycznego, dochodzimy do związków, że wedle definicji tejże funkcji (11.51) jest narysowana ona:

h_l^*={{1}\over{x}}\sin\left(x-l{{\pi}\over{2}}\right)\pm i(-1){{1}\over{x}}\cos\left(x-l{{\pi}\over{2}}\right)={{1}\over{x}}\sin\left(x-l{{\pi}\over{2}}\right)\mp i{{1}\over{x}}\cos\left(x-l{{\pi}\over{2}}\right)=\;
=\mp{{i}\over{x}}\left(\left(x-l{{\pi}\over{2}}\right)\mp\sin\left(x-l{{\pi}\over{2}}\right)\right)=\mp{{i}\over{x}}e^{\mp i(x-l{{\pi}\over{2}})}=\mp{{i}\over{x}}e^{\mp ix}e^{\pm i l{{\pi}\over{2}}}=\;
=
\mp{{i}\over{x}}e^{\mp ix}i^{\pm l}=\mp{{i^{1\pm l}}\over{x}}e^{\mp ix}\;
(11.54)

[edytuj] Wzór Rayleigha, czyli rozwinięcie funkcji fali płaskiej w funkcjach kulistych

Rozłóżmy funkcje opisująca falę płaską we funkcjach Legendre'a (9.33), wtedy możemy rozpisać naszą funkcję eikx w pewien szereg, którego jest kombinacją liniową w funkcjach Legendre'a Pl, którego to współczynniki są funkcjami zależnymi od wskaźnika l i argumentu r:

e^{ikx}=\sum_{l=0}^{\infty}c_lR_{l}(r)P_l(\cos\phi)\;
(11.55)

Biorąc wzór na definicję Laplasjanu we współrzędnych kulistych (7.41) i wiedząc, że Yl=Pl0, która nie zależy od zmiennej radialnej, wtedy na podstawie wzoru (10.5), która jest definicją Laplasjanu, mamy:

\Delta Y_{l0}=-{{l(l+1)}\over{r^2}}Y_{l0}\;
(11.56)

Rozpiszmy wzór na Laplasjan wedle sposobu (7.41) i biorąc tylko jako działanie na ten operator funkcję R(r):

\Delta R(r)={{1}\over{r}}{{\partial^2}\over{\partial r^2}}\left(rR\right)={{1}\over{r}}{{\partial}\over{\partial r}}\left(R+r{{\partial R}\over{\partial r}}\right)={{1}\over{r}}{{\partial R(r)}\over{\partial r}}+{{\partial^2R}\over{\partial r^2}}+{{1}\over{r}}{{\partial R}\over{\partial r}}=
{{\partial^2R}\over{\partial r^2}}+{{2}\over{r}}{{\partial R}\over{\partial r}}\;
(11.57)

Zatem możemy podziałać Laplasjanem obie strony równania (11.55), a do lewej jego strony także dokonujemy różniczkować względem współrzędnych kartezjańskim, a z jego z prawej strony we współrzędnych kulistych, w takim przypadku mamy równanie poniżej:

-k^2e^{ikz}=-k^2\sum_{l=0}^{\infty}c_lR_{l}(r)P_l(\cos\phi)=\sum_{l=0}^{\infty}c_l\left[\left({{\partial^2R}\over{\partial r^2}}+{{2}\over{r}}{{\partial R}\over{\partial r}}\right)-{{1}\over{r^2}}l(l+1)R_l\right]P_l(\xi)\;
(11.58)

Ze wzoru (11.58) możemy napisać równanie różniczkowe, które jest tożsamościowo równe zero, w takim przypadku możemy napisać równanie, które w dalszych kroku mamy zamiar rozwiązać wykorzystując przy tym (11.55) do lewej strony ostatniego wzoru:

R^{''}_l+{{2}\over{r}}R^'_l+\left[k^2-{{l(l+1)}\over{r^2}}\right]R_l=0\;
(11.59)

Do równania (11.59) wprowadźmy nowe zmienne, które definiujemy następująco:

r\rightarrow\rho=kr
(11.60)
R_l\rightarrow S=\sqrt{\rho}R_l\;
(11.61)

Możemy wykorzystać wzory (11.60), która jest definicją zmiennej ρ, a wzór (11.61), która jest definicją S, i te ostatnie dwa wspomniane wzory wstawiamy do wspomnianego na samym początku równania różniczkowego, w ten sposób dokonajmy dwóch następnych kroków, by dalej wykorzystać równanie (11.59), ale najpierw policzmy jego pierwszą jego pochodną:

R^'=k{{\partial}\over{\partial \rho}}\left(S\rho^{-{{1}\over{2}}}\right)=k{{S^'}\over{\sqrt{\rho}}}-k{{S}\over{2}}\rho^{-{{3}\over{2}}}\;
(11.62)

Następnie jest policzenie drugiej pochodnej, piszemy tożsamość:

R^{''}=k^2{{\partial}\over{\partial \rho}}\left({{S^'}\over{\sqrt{\rho}}}-{{S}\over{2}}\rho^{-{{3}\over{2}}}\right)=
k^2{{S^{''}}\over{\rho^{{1}\over{2}}}}-{{S^'}\over{2\rho^{{{3}\over{2}}}}}k^2-k^2{{S^'}\over{2}}\rho^{-{{3}\over{2}}}+{{3}\over{2}}k^2{{S}\over{\rho^{{5}\over{4}}}}\;
(11.63)

Wzory udowodnione w puntach (11.62) i (11.63) są to wzory, które podstawimy do równania różniczkowego (11.59), w takim przypadku możemy napisać następne równanie różniczkowe:

k^2{{S^{''}}\over{\rho^{{1}\over{2}} }}-{{S^'}\over{2\rho^{{{3}\over{2}} } }}k^2
-k^2{{S^'}\over{2}}\rho^{-{{3}\over{2}}}+{{3}\over{4}}k^2{{S}\over{\rho^{{5}\over{2}}}}+{{2k}\over{\rho}}\left(k{{S^'}\over{\sqrt{\rho}}}-k{{S}\over{2}}\rho^{-{{3}\over{2}}}\right)+k^2\left(1-{{l(l+1)}\over{\rho^2}}\right){{S}\over{\sqrt{\rho}}}=0\;
(11.64)

Równanie różniczkowe (11.64) dzielimy obustronnie przez k2, a następnie mnożymy tak powstałe równanie przez \rho^{{{1}\over{2}}}\; i jednocześnie dalej redukując odpowiednie składniki do siebie z lewej strony rozważanego równania, w takim razie możemy dojść do wniosku:

S^{''}+{{S^'}\over{\rho}}+\left[{{1}\over{4\rho^2}}+1-{{l(l+1)}\over{\rho^2}}\right]S=0\Rightarrow 
S^{''}+{{2S^'}\over{\rho}}+\left[1-{{\left(l+{{1}\over{2}}\right)^2}\over{\rho^2}}\right]S=0\;

\rho^2S^{''}+S^'\rho+\left(\rho^2-\left(l+{{1}\over{2}}\right)^2\right)S=0
(11.65)

Równanie wynikłe z końcowych obliczeń przeprowadzonych w punkcie (11.65) jest to równanie na funkcję Bessela (11.1):

S(\rho)=J_{l+{{1}\over{2}}}(\rho)\;
(11.66)

Zatem wykorzystując wzory (11.60) i (11.61), to możemy napisać wzór (11.66) w postaci:

R_l(kr)={{S}\over{\sqrt{\rho}}}={{J_{l+{{1}\over{2}}}(kr)}\over{\sqrt{kr}}}\sim j_l(kr)\;
(11.67)

Funkcja Rl(kr) jest wprost proporcjonalna do funkcji sferycznej Bessela (11.52). Wzór (11.55) do którego podstawimy funkcję sferyczną Bessela, ale przedtem przy czym ewentualne stałe będziemy wkładać do stałej cl, i zakładając przy tym, że współrzędna zetowa wyraża się przy pomocy współrzędnej θ wzorem, tzn. ξ=r cosθ=rξ, w takim razie będziemy mogli powiedzieć:

e^{ikr\xi}=\sum_{l=0}^{\infty}c_lj_l(kr)P_l(\xi)\;
(11.68)

W celu wyznaczenia współczynników cl należy pomnożyć obie strony równania (11.68) przez wielomian Legendre'a Pn(ξ) i z całkować obie jego strony, i wiedząc, że norma wielomianu Legendre'a jest policzona tutaj (9.57), to:

\int_{-1}^{1}e^{ikr\xi}P_n(\xi)d\xi=c_nj_n(kr){{2}\over{2n+1}}\;
(11.69)

Weźmy sobie lewą stronę równania (11.69) i dokonajmy jego całkowania przez części, w takim razie otrzymujemy pewne wyrażenie, które jest wyrażone za pomocą wyrazu wolnego i za pomocą następnej całki:

\int_{-1}^{1}e^{ikr\xi}P_n(\xi)d\xi={{1}\over{ikr}}e^{ikr\xi}P_n(\xi)\Bigg|^{1}_{-1}-{{1}\over{ikr}}\int^1_{-1}e^{ikr\xi}P_n^'(x)d\xi\;
(11.70)

Wyraz wolny można napisać dla jego granic w punktach 1 i -1, w których wielomiany Legendre'a zapisujemy wedle Pn(1)=1 i Pn(-1)=(-1)n, którego to pierwszy wyraz w (11.70) piszemy:

{{1}\over{ikr}}e^{ikr\xi}P_{n}(\xi)\Bigg |^{1}_{-1}={{e^{ikr}-(-1)^ne^{-ikr}}\over{ikr}}={{e^{ikr}-e^{in\pi}e^{-ikr}}\over{ikr}}=e^{in{{\pi}\over{2}}}{{e^{i(kr-n{{\pi}\over{2}})}-e^{-i(kr-n{{\pi}\over{2}})}}\over{ikr}}\;
(11.71)

Do dalszych kroków jest wyznaczenie tożsamości, którą udowodnimy jako lemat, w takim przypadku mamy:

e^{in{{\pi}\over{2}}}=i^n\;
(11.72)

Dowód dla i=0 dla lematu twierdzeniem prawdziwym dla (11.72), zatem sprawdźmy co wyjdzie, gdy przejdziemy stwierdzenia z n do n+1, w takim bodź razie możemy pomnożyć równość (11.72), przez jednostkę urojoną równej jednostce urojonej i przestawienie jego w postaci e^{i\pi/2}\; i po wykorzystaniu twierdzenia o iloczynie funkcji potęgowych o tym samej podstawie, w takim przypadku możemy napisać:

e^{i(n+1){{\pi}\over{2}}}=i^{n+1}\;
(11.73)

Co kończy dowód lematu (11.72). Równość (11.71) możemy zapisać, korzystając przy tym z (11.73), i z definicji funkcji sinus:

{{1}\over{ikr}}\int^1_{-1}e^{ikr\xi}P_{n}(\xi)=2i^n{{\sin\left(kr-n{{\pi}\over{2}}\right)}\over{kr}}\;
(11.74)

Przy wyrażaniu (11.74) skorzystaliśmy, że drugi wyraz znajdujący się w punkcie wyrażenia (11.70) piszemy wedle sposobu poniżej, tzn. całkę poniżej całkujemy poprzez części, w takim przypadku udowodniliśmy, że ten wyraz jest wprost proporcjonalny do odwrotności kwadratu z liczby r, co uzasadnia w (11.70), że należy uciąć wyrazy rzędu więcej niż wyrazy proporcjonalne do odwrotności z odległości radialnej jako wyrażenia niecałkowego:

{{1}\over{ikr}}\int_{-1}^{1}e^{ikr\xi}P^{'}_n(\xi)d\xi={{1}\over{(ikr)^2}}e^{ikr\xi}P^'_n(\xi)\Bigg|^{1}_{-1}-{{1}\over{(ikr)^2}}\int_{-1}^{1}e^{ikr\xi}P^{''}(\xi)d\xi\sim{{1}\over{(ikr)^2}}\;
(11.75)


Jeszcze raz powracając do równania (11.69) możemy napisać tożsamość na funkcję zależną od x, czyli cnjn(x), która jest iloczynem współczynnika cn i asymptotycznej właściwości sferycznej funkcji Bessela jn(x) zdefiniowaną wzorem (11.52):

2i^n{{\sin\left(kr-n{{\pi}\over{2}}\right)}\over{kr}}=c_nj_n(kr){{2}\over{2n+1}}\Rightarrow c_nj_n(\xi)=i^n(2n+1){{\sin\left(kr-{{n\pi}\over{2}}\right)}\over{kr}}\;
(11.76)

Mając wzór na cnjn(x), który jest określony przez wzór końcowy wynikowy (11.76), wtedy wzór (11.68) piszemy w postaci:

e^{ikz}=\sum_{l=0}^{\infty}i^n(2n+1){{\sin\left(kr-l{{\pi}\over{2}}\right)}\over{kr}}P_l(\phi)\;
(11.78)

Jeśli wprowadzimy asymptotyczne sferyczne funkcje Bessela jn(x), które są zdefiniowane wzorem (11.52), w takim przypadku (11.78), który jest zarazem wzorem przybliżonym, przepisujemy:

e^{ikz}=\sum_{l=0}^{\infty}i^n(2l+1)j_l(kr)P_l(\cos\phi)\;
(11.79)

[edytuj] Wprowadzenie specyficznego wzoru na ortogonalizację funkcji Bessela

Funkcja Bessela nie spełnia ogólnych warunków ortogonalizacji, jak to ma miejsce w przypadku wielomianów ortogonalnych, tzn. całka _{\int_0^{2\pi}J_{\mu}J_{\nu}dx}\; nie jest równe zero, zatem znajdziemy inny właściwy warunek ortogonalizacji dla naszej tutaj rozważanej funkcji. Obierzmy sobie dwie funkcje, które nazwiemy jako y1 i y2, dla których "a" jest nierówne "b":

y_1=J_{\mu}(ax)\;
(11.80)
y_2=J_{\nu}(bx)\;
(11.81)

Funkcje, tzn. (11.80) i (11.81) podstawiamy do równania różniczkowego Bessela (11.1) i dzielimy obustronnie przez x2, to dla tych dwóch rozwiązań mamy przestawienia:

y_1^{''}+{{1}\over{x}}y_1^'+\left(a^2-{{\nu^2}\over{x^2}}\right)y_1=0\;
(11.82)
y_2^{''}+{{1}\over{x}}y_2^{'}+\left(b^2-{{\nu^2}\over{x^2}}\right)y_2=0\;
(11.83)

Wzór (11.82) mnożymy obustronnie przez y2, a wzór (11.83) mnożymy obustronnie przez y1 i tak powstałe wzory odejmujemy od siebie, w ten sposób dostajemy równość:

y_1^{''}y_2-y_2^{''}y_1+{{1}\over{x}}\left(y_1^'y_2-y^'y_1\right)=(b^2-a^2)y_1y_2\;
(11.84)

Wprowadźmy nową funkcję zdefiniowaną za pomocą funkcji y1 i y2, a także za pomocą tychże pochodnych, w takim przypadku mamy definicję nowej zmiennej_{u=y_1^{'}y_2-y_2^{'}y_1}\;, w ten sposób (11.84) przechodzi w równość:

u^'+{{u}\over{x}}=(b^2-a^2)y_1y_2\Rightarrow xu^'+u=(b^2-a^2)xy_1y_2\Rightarrow (xu)^'=(b^2-a^2)xy_1y_2\;
(11.85)

Końcową równość (11.85) musimy przecałkować w przedziale od (0,L), w ten sposób dostajemy tożsamość:

Lu(L)=(b^2-a^2)\int_0^Lxy_1(x)y_2(x)dx\;
(11.86)

Wedle definicji na zmienną u, funkcje poniżej powinny być równe zero dla x=a,b, które są różnymi parametrami, dla naszego przypadku musi być przynajmniej jeden warunek z dwóch spełniony, co piszemy je:

J_{\mu}(xL)=0\;
(11.87)
J^'_{\mu}(xL)=0\;
(11.88)

Jeśli jest spełniony odpowiednio warunek (11.87) (funkcja Bessela w punkcie xL dla x=a,b jest równa zero) lub (11.88) (pierwsza pochodna funkcji Bessela w punkcie xL dla x=a,b jest równa zero), to lewa strona równości (11.86) jest równa zero:

\int_0^LxJ_{\mu}(ax)J_{\nu}(bx)dx=0\;
(11.89)

[edytuj] Dystrybucje jako funkcje uogólnione

Wykres funkcji delta Diraca. Schematyczna reprezentacja funkcji Diraca dla x0 = 0. Linia ze strzałką jest zwykle używana do umownego zaznaczenia delty Diraca. Wysokość strzałki symbolizuje wartość stałej przemnożonej przez funkcję.

Funkcja Diraca jest jedną z podstawowych funkcji rozważanych w mechanice kwantowej. Poniżej podamy własności funkcji Diraca i ich dowody. Od naszej funkcji Diraca oczekujemy by w punkcie zerowym ona miała wartość niezerową, a w pozostałych punktach przyjmowała wartość równą zero, tak by całka tej funkcji po całej nieskończonej przestrzeni jednowymiarowej miała wartość równą jeden. Stąd wynika, że ta funkcja w punkcie zerowym ma wartość równą plus nieskończoność. Oczywiste jest, że całkowanie po całej przestrzeni rzeczywistej można zawęzić do całkowania do przedziału dowolnie małego zawierający nasz punkt zerowy:

\delta(x)=0\;\; dla x\neq 0\;\; oraz \int_{-\infty}^{\infty}\delta(x)dx=1\;\;
(12.1)

A zatem oczekujemy, by funkcja Diraca dążyła do osobliwości w punkcie x=0.

Podstawową własnością funkcji Diraca jest całkowanie iloczynu zwykłej funkcji f(x) i funkcji Diraca i na podstawie powyższych dowodów jest ta całka równa funkcji f(x), ale w punkcie x=0.

\int_{-\infty}^{\infty} f(x)\delta(x)dx=f(0)\;\;
(12.2)

A oto jego dowód jest, tzn. biorąc pod uwagę, że poza punktem zerowym funkcja Diraca przyjmuje wartość zero, a więc w całce (12.1) dla tych punktów nie wnosi nic do tego obiektu, a więc całkowanie możemy zawęzić do przedziału dążącego do zera, jak powiedzieliśmy powyżej, tzn. do przedziału \left(-h,h\right)\;, wtedy tą naszą całkę możemy zapisać wedle naszych wcześniejszych omówień:

\int_{-\infty}^{\infty} f(x)\delta(x)dx=\lim_{h\rightarrow 0}\int_{-h}^{h} f(x)\delta(x)dx=\lim_{h\rightarrow 0} f(-h\le\zeta\le h)\int_{-h}^{h}\delta(x)dx=\;
=\lim_{h\rightarrow 0} f(-h\le\zeta\le h)=f(0)\;
(12.3)

Co kończy dowód.

Oto następne wnioski wynikające z własności i twierdzeń udowodnionych wcześniej.

Wiadomo, że jest spełnione z własności przesunięcia równoległego, że jeśli funkcja Diraca jest równa nieskończoność w punkcie x_0=0\;, to w pozostałych punktach jest równa zero, zatem powinno zachodzić:

\delta(x-x_0)=0\; dla x\neq x_0\;
(12.4)

Wiadomo jednak, że na podstawie całki (12.3) zachodzą inne całki, też wynikającego z przesunięcia równoległego o wektor jednowymiarowy x_0\;, która jak wiadomo, nie zależy od tego przesunięcia dla funkcji normowania tejże funkcji, natomiast dla całki iloczynu funkcji f(x) i funkcji Diraca w punkcie osobliwym x_0\; jest równa funkcji f(x) w tejże punkcie:

\int\delta(x-x_0)dx=1\;
(12.5)
\int_{-\infty}^{\infty} f(x)\delta(x-x_0)dx=f(x_0)\;
(12.6)

Z jednych z podstawowych własności wynikających z wzoru (12.6), tzn. gdy funkcją f(x) jest funkcją Diraca, jest:

\int_{-\infty}^{\infty}\delta(x-x_1)\delta(x-x_2)dx=\delta(x_2-x_1)=\delta(x_1-x_2)\;
(12.7)

Udowodnijmy całkę (12.7) oraz wykażmy, że funkcja \delta(x)\; jest funkcją parzystą.

\int_{-\infty}^{\infty} \delta(x-x_1)\delta(x-x_2)dx=\begin{Bmatrix}x-x_1=t\\
dx=dt
\end{Bmatrix}=\int_{-\infty}^{\infty}\delta(t)\delta(t-(x_2-x_1))=\delta(x_2-x_1)\;
(12.8)

Dowodząc troszkę inaczej wzór (7.17) dochodzimy do wniosku, że tą naszą całkę można przedstawić troszkę innej ale równoważnej postaci:

\int_{-\infty}^{\infty} \delta(x-x_1)\delta(x-x_2)dx=\begin{Bmatrix}x-x_2=t\\
dx=dt
\end{Bmatrix}=\int_{-\infty}^{\infty}\delta(t-(x_1-x_2))\delta(t)=\delta(x_1-x_2)\;
(12.9)

Dochodzimy więc do wniosku, że funkcja \delta(x)\; na podstawie równości obliczeń (12.8) oraz (12.9) jest funkcją parzystą względem parametru x=0\;, bo wartość całki nie może się zmieniać od sposobu liczenia tejże całki.

[edytuj] Wprowadzenie do teorii funkcji próbnych w teorii dystrybucji

W teorii dystrybucji pierwszym krokiem jest wprowadzenie zbioru funkcji zwanych próbnych. Zgodnie z naszymi wymogami, funkcjami próbnymi nazywamy funkcje nieskończenie różniczkowalne i są one różne od zera na ograniczonym obszarze, zbiór tychże funkcji będziemy oznaczać symbolem _{C_0^{\infty}}\;.

Funkcja próbna _{\tilde{f}(x)}\;

Przykładem funkcji próbnych jest funkcja zdefiniowana:

\tilde{f}(x)=\begin{cases}
Ne^{{{1}\over{x^2-1}}}&\mbox{ dla }|x|<1\\
0&\mbox{ dla }|x|\geq 1
\end{cases}
(12.10)

Zdefiniujemy funkcję _{\phi_{\epsilon}(x)}\;, która jest splotem funkcji φ i funkcji _{{{1}\over{\epsilon}}\tilde{f}\left({{x}\over{\epsilon}}\right)}\;, zatem tą naszą funkcję piszemy wedle schematu:

\phi_{\epsilon}(x)=\int_{-\infty}^{\infty}\phi(x-y)\tilde{f}\left({{y}\over{\epsilon}}\right){{dy}\over{\epsilon}}\;
(12.11)

Jeśli w powyższej funkcji dokonamy podstawienia t=x-y, to natychmiast otrzymamy wzór poniżej, co na podstawie tego możemy udowodnić przemienność naszego splotu funkcji f i funkcji \tilde{\phi}\;, z której wynika różniczkowalność naszego splotu.

\phi_{\epsilon}(x)={{1}\over{\epsilon}}\int_{-\infty}^{\infty}\tilde{f}\left({{x-t}\over{\epsilon}}\right)\phi(t)dt\;

Na podstawie ostatniego równania, funkcja \tilde{\phi}_{\epsilon}\; jest nieskończenie wiele razy różniczkowalna, co wynika z faktu, że funkcja _{\tilde{f}}\; jest też nieskończenienie wiele razy różniczkowalna, bo ona jest zależna od "x", a funkcja \phi(t)\; już nie zależy od argumentu x, co tą różniczkowalność wynika z teorii o pochodnej na całce. We wzorze (12.11) dokonajmy podstawienia, które określamy przy pomocy parametru t, czyli y=εt, w takim razie powyższą funkcję piszemy wedle:

\phi_{\epsilon}(x)=\int_{-\infty}^{\infty}\phi(x-\epsilon t)\tilde{f}(t)dt\;
(12.12)

Następnym bardzo ważnym krokiem jest policzenie wyrażenia, która jest różnicą funkcji φε(x) i,φ(x), korzystając z faktu o normalizacji delty Diraca (12.1), w takim przypadku dostajemy tożsamość:

\phi_{\epsilon}(x)-\phi(x)=\int_{-\infty}^{\infty}\phi(x-\epsilon t)\tilde{f}(t)dt-\phi(x)\int_{-\infty}^{\infty}\tilde{f}(t)dt=
\int_{-\infty}^{\infty}\left(\phi(x-\epsilon t)-\phi(x)\right)\tilde{f}(t)dt\;
(12.13)

W przeprowadzonych obliczeniach (12.13) funkcja podcałkowa dla ε dążącego do zera dąży do zera, zatem cała całka dąży do zera, stąd wynika, że funkcja \tilde{f}\; dla której zdefiniowana jest norma (12.1) jest poprawną definicją tejże naszej rozważanej funkcji.

[edytuj] Ciągłość funkcji próbnych w teorii dystrybucji

W powyższym wzorze funkcja φn jest tak zdefiniowana, by te omawiane funkcje nie wychodziły poza pewien przedział, czyli mają ograniczone nośniki. Funkcje te dążą jednostajnie do funkcji φ0, a także to samo dotyczy ich pochodnych, w takim przypadku mamy:

\phi_n^{(k)}\xrightarrow[n\rightarrow\infty]{}\phi_0^{(k)},\mbox{  dla  } k=0,1,2,...\;
(12.14)

[edytuj] Matematyczna definicja funkcji próbnej w teorii dystrybucji

Funkcją próbną (dystrybucją) nazywamy funkcjonał liniowy ciągły w pewnej ściśle określonej przestrzeni. Wynik działania dystrybucji określać będziemy symbolem T[φ] lub symbolem <T,φ>:

T:\phi\rightarrow T[\phi]\;
(12.15)

Dystrybucja spełnia również warunki liniowości, którego zapisujemy:

T[a\phi_1+b\phi_2]=a T[\phi_1]+bT[\phi_2]\;
(12.16)

Na sam koniec wprowadźmy warunek ciągłości dla dystrybucji dla n dążącego do nieskończoności:

T[\phi_n]\rightarrow T[\phi_0]\;
(12.17)

[edytuj] Przykłady dystrybucji

  • Zdefiniujmy całkę, którą okreslamy za pomocą dystrybucji, którą określamy:
\langle{{1}\over{x}},\psi\rangle=\lim_{\epsilon\rightarrow 0}\left[\int_{-\infty}^{-\epsilon}{{1}\over{x}}\phi(x)dx+\int^{\infty}_{\epsilon}{{1}\over{x}}\psi(x)dx\right]\;
(12.18)

Sposób liczenia całki z odwrotności funkcji x przeprowadzonych w punkcie nazywamy wartością główną tejże całki. W tym celu aby z ilustrować wartość główną policzmy dwie same całki poniżej i przekonamy co to jest wartość główna przy liczeniu tej samej całki dwoma sposobami, w których wychodzą różne wyniki.

\lim_{\epsilon\rightarrow 0}\left[\int^{-\epsilon}_{-1}{{1}\over{x}}dx+\int_{\epsilon}^1{{1}\over{x}}dx\right]=\ln\epsilon-\ln\epsilon=0\;
(12.19)
\lim_{\epsilon\rightarrow 0}\left[\int_{-1}^{-\epsilon}{{1}\over{x}}dx+\int_{2\epsilon}^1{{1}\over{x}}dx\right]=\ln\epsilon-\ln2\epsilon=-\ln 2\;
(12.20)

Wartością główna całki _{\int_{-1}^1{{1}\over{x}}dx}\; jest całka policzona wedle schematu (12.19), a wartością główną nie jest całka obliczona wedle schematu (12.20).

  • Wzór, który jest jedną linijkę poniżej, udowodnijmy go za pomocą przeprowadzonych obliczeń jeszcze raz bardziej niżej, co tam przeprowadzimy nasze rachunki:
{{1}\over{x+i0}}={{1}\over{x}}-i\pi\delta\;
(12.21)

Dowód (12.21) przebiega na podstawie teorii o dystrybucjach, ale najpierw wyeliminujmy, by pod całką funkcja posiadała mianownik zawierający wyrażenie rzeczywiste:

\lim_{\epsilon\rightarrow 0}\langle{{1}\over{x+i\epsilon}},\psi\rangle=\lim_{\epsilon\rightarrow 0}
\int_{-\infty}^{\infty}{{\psi(x)}\over{x+i\epsilon}}=\lim_{\epsilon\rightarrow 0}\left[\int_{-\infty}^{\infty}{{x\psi(x)}\over{x^2+\epsilon^2}}dx-i\epsilon\int_{-\infty}^{\infty}{{\psi(x)}\over{x^2+\epsilon^2}}\right]\;
(12.22)

W pierwszej całce możemy przejść do granicy, a drugiej całce dokonujemy podstawienia x=εt, i wiedząc, że całka _{\int_{-\infty}^{\infty}{{1}\over{1+t^2}}dt}\; jest równa liczbie π, a także wykorzystując fakt (12.2), w takim razie możemy napisać:

\int_{-\infty}^{\infty}{{\psi(x)}\over{x}}dx-i\lim_{\epsilon \rightarrow 0}\int_{-\infty}^{\infty}{{\psi(\epsilon t)}\over{t^2+1}}dt=
\int_{-\infty}^{\infty}{{\psi(x)}\over{x}}dx-i\psi(0)\int_{-\infty}^{\infty}{{dt}\over{t^2+1}}=\;
=
\int_{-\infty}^{\infty}{{1}\over{x}}\psi(x)dx-i\pi\int_{-\infty}^{\infty}\psi(x)\delta(x)dx=\left\langle{{1}\over{x}}-i\pi\delta,\psi\right\rangle\;\;
(12.23)

[edytuj] Ciągi zależne od delty ε i zbieżne do pewnej funkcji f(x) przy ε dążącej do zera

Aby utworzyć ciąg deltopodobny należy skonstruować ciąg, który zależy od ε, które jak wiemy dąży do delty Diraca, w takim przypadku ten ciąg definiujemy:

f_{\epsilon}(x)={{1}\over{\epsilon}}f\left({{x}\over{\epsilon}}\right)\;
(12.24)

Udowodnimy, że w przypadku granicznym nasz ciąg fε(x) jest dystrybucją, czyli jest równa delcie Diraca. Wynik działania dystrybucji fε(x), który jest ciągiem deltopodobnym (12.17) w przedziale nieskończonym definiujemy wzorem poniżej. W tym samym punkcie w całce wprowadzimy nowe zmienne zapisane wzorem x=tε:

\langle f_{\epsilon},\phi\rangle=\int_{-\infty}^{\infty}{{1}\over{\epsilon}}f\left({{x}\over{\epsilon}}\right){\phi}(x)dx=\int^{\infty}_{-\infty}f(t){\phi}(\epsilon t)dt\;
(12.25)

Gdy przejdziemy do granicy ε dążącego do zera dla ciągu zależnego od parametru ε (12.24) i na samym końcu korzystając ze wzoru, którego spełnia funkcja f(x), czyli warunku, tzn. _{\int_{-\infty}^{\infty}f(x)dt=1}\;, którego jest własnością ogólnie dystrybucji (12.1), a szczegółowo delty Diraca, w takim przypadku możemy napisać przekształcenia:

\langle f_{\epsilon},\phi\rangle\xrightarrow[\epsilon\rightarrow 0]{}\phi(0)\int_{-\infty}^{\infty}f(t)dt=\phi(0)=\int_{-\infty}^{\infty}\delta(x)\psi(x)dx=\langle\delta,\psi(x)\rangle\;
(12.26)

[edytuj] Mnożenie dystrybucji przez dowolną funkcję o ograniczonym nośniku

Wprowadźmy sugestię, co do dystrybucji, którą określamy mnożenie dystrybucji przez funkcję należącej do dziedziny liczb zespolonych, zatem dystrybucja jest tak napisana by było spełniona równość:

\langle fT,\phi\rangle=\langle T,f\phi\rangle\;
(12.27)

Jako przykład rozpatrzmy funkcję f=x, która podstawiona do wzoru (12.27) przestawia się wzorem z definicji działania dystrybuanty T:

\langle x\delta,\phi\rangle=\langle\delta,x\phi\rangle=0\phi(0)=0\;
(12.28)

Z obliczeń przeprowadzonych w punkcie (12.28) możemy wywnioskować, że wyrażenie, która jest iloczynem liczby x i delty Diraca jest równe zero:

x\delta(x)=0\;
(12.29)

Rozpatrzmy następny przypadek, która to funkcja nie jest równa zero dla x=0, a w pozostałych przypadkach jest nierówna zero, w takim przypadku możemy napisać równość:

f(x)\delta(x)=f(0)\delta(x)\;
(12.30)

Gdy delta Diraca jest tylko nierówna zero w punkcie x=a, to równanie (12.30) z warunku przesunięcia równoległego przestawiamy wzorem:

f(x)\delta(x-a)=f(a)\delta(x-a)\;
(12.31)

Teraz wykażemy, że delta Diraca δ(x) z dokładnością do stałego czynnika jest rozwiązaniem równości:

xT=0\;
(12.32)

Aby udowodnić, że tak jest, należy liczbę <T,φ>, w której definiujemy funkcję ψ(x), która w punkcie x=0 jest równa jeden, co na tej podstawie w drugiej równości w poniższym rozpisaniu pierwszy wyraz jest równy zero, i wiedząc, że φ(x) zostało tak dobrane jako funkcja próbna, która dla punktu zerowego przyjmowała wartość zero, w takim przypadku to nasze wyrażenie piszemy:

\langle T,\phi\rangle=\langle T,\phi-\phi(0)\psi\rangle+\phi(0)\langle T,\psi\rangle=\phi(0)\underbrace{\langle T,\psi\rangle}_c=c\langle\delta,\phi\rangle=0\;
(12.33)

Na podstawie obliczeń przeprowadzonych w punkcie (12.33) rozwiązaniem równania (12.32) jest funkcja zdefiniowana wzorem:

T=c\delta(x)\;
(12.34)

Teraz rozpatrzmy jaka jest funkcja T, która jest rozwiązaniem równania, będącego iloczynem funkcji x i T, która jest równa dla naszego przypadku liczbie jeden:

xT=1\;
(12.35)

Rozwiązaniem równania (12.35), która jest niejednorodnym równaniem, którego rozwiązaniem szczególnym jest rozwiązanie _{T={{1}\over{x}} }\;, ale też korzystając z faktu, że (12.34) jest rozwiązaniem równania jednorodnego (12.32), w takim rozwiązaniem ogólnym równania wspomnianego na samym początku tego zdania jest funkcja w postaci:

T={{1}\over{x}}+c\delta(x)\;
(12.36)

[edytuj] Różniczkowanie funkcji uogólnionych

Pochodną dystrybucji nazywamy taką nową dystrybucję, która spełnia tożsamość:

\langle T^',\phi\rangle=-\langle T,\phi^'\rangle\;
(12.37)

Aby udowodnić tożsamość (12.37) należy _{\langle T^',\phi\rangle}\; przestawić na w sposób całki Riemmanna, i wiedząc, że dystrybucja T jest równa zero w nieskończonościach, zatem całkowanie dokonajmy poprzez części:

\langle T^',\phi\rangle=\int_{-\infty}^{\infty}T^{'}(x)\phi(x)dx=T\phi|^{\infty}_{-\infty}-\int_{-\infty}^{\infty}T(x)\phi^'(x)dx=-\langle T,\phi^'\rangle\;
(12.38)

[edytuj] Pochodna uogólniona trzech zmiennych i wykorzystanie w tym celu definicji Laplasjanu

Weźmy teraz funkcję T, która jest zależna od promienia ρ, którego to definicję T i ρ definiujemy wzorami:

T={{1}\over{\rho}}\;
(12.39)
\rho=\sqrt{x^2+y^2+z^2}\;
(12.40)

Mając definicję Laplasjanu, czyli definicję operatora Δ (7.36), to działaniem tegoż operatora na funkcję T (12.29) jest określone przez:

\Delta T=\Delta {{1}\over{r}}={{1}\over{\rho}}{{\partial}\over{\partial\rho^2}}\left(\rho T\right)={{1}\over{\rho}}{{\partial}\over{\partial\rho^2}}\left(\rho{{1}\over{x}}\right)={{1}\over{\rho}}{{\partial 1}\over{\partial\rho^2}}=0\;
(12.41)

Widzimy, że Laplasjan funkcji T zdefiniowaną w punkcie (12.39) jest równy zero dla ρ nierównej zero, zatem sprawdźmy jaki jest wynik działania operatora Δ, gdy ρ jest równy zero. W tym celu policzmy (12.38)

\langle\Delta{{1}\over{r}},\phi\rangle=-1\langle\nabla {{1}\over{r}},\nabla\phi\rangle=(-1)(-1)\langle {{1}\over{r}},\Delta \phi\rangle=\langle {{1}\over{r}},\Delta \phi\rangle=\int_{R^3}{{1}\over{r}}\Delta\phi dV\;
(12.42)

Całkowanie po całej objętości w przestrzeni trójwymiarowej zapisaną w punkcie (12.42) możemy zapisać jako całkowanie po kuli o promieniu R bez kuli zawartej wewnątrz tej kuli o promieniu ε, co jej promień dąży do zera, czyli w ten sposób wektor normalny dla kuli większej jest zwrócony na zewnątrz kuli, a wektor normalny dla kuli o promieniu ε jest zwrócony do środka tejże omawianej kuli, zatem ostatni wzór zapisujemy:

\int_{R^3}{{1}\over{r}}\nabla\phi dV=\lim_{\epsilon\rightarrow 0}\int_{K(0,R)-K(0,\epsilon)}{{1}\over{r}}\Delta\phi dV\;
(12.43)

Funkcję podcałkową występująca w wyrażeniu (12.43), korzystając z definicji o pochodnej iloczynu dwóch funkcji, możemy przestawić:

{{1}\over{r}}\Delta\phi={{1}\over{r}}\nabla\nabla\phi=\nabla \left[{{1}\over{r}}\nabla\phi\right]-\nabla {{1}\over{r}}\nabla\phi=
\nabla \left[{{1}\over{r}}\nabla\phi\right]-\nabla\left[\phi\nabla\left({{1}\over{r}}\right)\right]+\phi\Delta\left({{1}\over{r}}\right)\;
(12.44)

Ostatni człon w równaniu (12.44) jest równy zero na podstawie tożsamości udowodnionej w punkcie (12.41), wtedy całka (12.42), przy wykorzystaniu twierdzenia (7.66), przestawiamy:

\lim_{\epsilon\rightarrow 0}\int_{K(0,R)-K(0,\epsilon)}{{1}\over{r}}\Delta\phi dV=\int \nabla \left[{{1}\over{r}}\nabla\phi\right]dV-\int\nabla\left[\phi\nabla\left({{1}\over{r}}\right)\right]dV=\;
=\int_{S_{\epsilon}} {{1}\over{r}}\nabla\phi d\vec{S}-\int_{S_{\epsilon}} \phi\nabla\left({{1}\over{r}}\right) d\vec{S}\;
(12.45)

Przy całkowaniu pierwszej całki, przy definicji dS=r2dΩ i r=ε, to pierwsza całka w wyrażeniu (12.45) jest równa zero, w takim przypadku został nam do rozpatrzenia człon drugi:

\nabla\left({{1}\over{r}}\right)\vec{n}=-{{\partial}\over{\partial r}}\left({{1}\over{r}}\right)={{1}\over{r^2}}\;
(12.46)

W wyrażeniu przyjęliśmy, że wektor \vec{n}\; ma kierunek do środka kuli o promieniu ε i dlatego po prawej stronie w drugiej równości (12.46) występuje znak minus. Wtedy po pewnych rozważaniach równanie (12.45) przyjmuje postać:

\lim_{\epsilon\rightarrow 0}\int_{K(0,R)-K(0,\epsilon)}{{1}\over{r}}\Delta\phi dV=-\int_{S_{\epsilon}}\phi{{1}\over{r^2}}dS\;
(12.47)

Równanie (12.42), na podstawie późniejszych obliczeń i definicji wycinka powierzchni kuli, której powierzchnia jest iloczynem funkcji r2 i kata bryłowego dΩ, przestawia się:

\langle\Delta{{1}\over{r}},\phi\rangle=-\phi(0)\int {{1}\over{r^2}}r^2d\Omega=-\phi(0)\int d\Omega=-4\pi \phi(0)=-4\pi\langle\delta,\phi\rangle\;
(12.48)

Wedle rozważań przeprowadzonych powyżej dla dowolnych funkcji φ możemy napisać tożsamość wynikającą z przeprowadzonych obliczeń w punkcie (12.48):

\Delta\left({{1}\over{r}}\right)=-4\pi\delta(r)\;
(12.49)

[edytuj] Sploty funkcji uogólnionych

Jak wiadomo dystrybucji nie należy je mnożyć je przez siebie, ale można je określić działanie o charakterze splotu. Zatem splotem dwóch funkcji uogólnionych nazywamy funkcję oznaczoną za pomocą oznaczenia *, i którą definiujemy wzorami poniżej, które te wzory są ze sobą równoważne:

(f_1*f_2)(x)=\int_{-\infty}^{\infty}f_1(x-y)f_2(y)dy\;
(12.50)
(f_1*f_2)(x)=\int_{-\infty}^{\infty}f_1(y)f_2(x-y)dy\;
(12.51)

Sprawdźmy, czy splot zdefiniowany wzorem (12.50) lub wzorem (12.51) są działaniami przemiennymi, w tym celu dokonajmy podstawienia określonego wzorem t=x-y, aby tą przemienność udowodnić:

(f_1*f_2)(x)=\int_{-\infty}^{\infty}f_1(y)f_2(x-y)dy=\int_{-\infty}^{\infty} f_1(x-t)f_2(t)dt=\int_{-\infty}^{\infty}f_2(t)f_1(x-t)dt=f_2*f_1\;
(12.52)

Inną definicją naszego splotu nazywamy technikę dystrybucyjną napisaną wedle sposobu poniżej. Widzimy, że jest to całka dwóch zmiennych x i y, która określa działanie dystrybucji przy dowolnej funkcję próbnej φ(x) zależnej tylko od jednego parametru.

\langle f_1*f_2,\phi\rangle=\int_{-\infty}^{\infty}(f_1*f_2)(x)\phi(x)dx=\int_{-\infty}^{\infty}dx\int_{-\infty}^{\infty}dx f_1(x-y)f_2(y)\phi(x)\;
(12.53)

Jeśli w równaniu (12.53) dokonamy podstawienia określonego wzorem t=x-y, to tą wspomnianą równość można przepisać po tym podstawieniu wedle sposobu:

\langle f_1*f_2,\phi\rangle=\int_{-\infty}^{\infty}dt f_1(t)\int_{-\infty}^{\infty}dy f_2(y)\phi(t+y)\;
(12.54)

Widząc wzór (12.54) możemy napisać definicję splotu dwóch dystrybucji, czyli splotu dwóch funkcji uogólnionych wedle schematu:

\langle T_1*T_2,\phi\rangle=\langle T_1(x),\langle T_2(y),\phi(x+y)\rangle\rangle\;
(12.55)

[edytuj] Iloczyn funkcyjny delty Diraca z pewną ściśle określoną funkcją

Podzielmy funkcję f(x) na mniejsze przedziały, w których ta nasza funkcja jest monotoniczna, te przedziały monotoniczności oznaczamy przez (aj,bj). Dla nasz istotne są te przedziały, w którym funkcja f(x) zmienia znak. Jeśli na jakimś przedziale funkcja nie zmienia znaku, to dystrybucja, która jest złożeniem delty Diraca i funkcji f(x) jest równa zero. Z definicji działania względem dowolnej funkcji φ:

\langle\delta(f(x)),\phi\rangle=\sum_j\int_{a_j}^{b_j}\delta(f(x))\phi(x)dx;
(12.56)

Na każdej z przedziału funkcję f(x) możemy rozwinąć wokół punktu zerowego (miejsca zerowego) w szereg Taylora w sposób:

f(x)=f(x_j)+f^'(x_j)(x-x_j)=f^'(x_j)(x-x_j)\;
(12.57)

Naszym krokiem jest dokonanie podstawienia określonego przez t=f'(xj)(x-xj), wtedy wzór (12.56) po dokonaniu tegoż podstawienia możemy przepisać pamiętając, że granicę całkowania zmienią się wedle sposobów pj=|f'(xj)|(aj-xj), qj=|f'(xj)|(bj-xj):

\langle\delta(f(x)),\phi\rangle=\sum_j{{1}\over{|f^'(x_j)|}}\int_{p_j}^{q_j}\delta(t)\phi\left({{t}\over{f^'(x_j)}}+x_j\right)dt\;
(12.58)

Górna granica całkowania we wzorze (12.58) jest większa od zera, a dolna jest od jego mniejsza, zatem ta nasza rozważana całka jest równa funkcji φ(xj), w takim przypadku ostatnie obliczenia zapisujemy:

\langle\delta(f(x)),\phi\rangle=\sum_j{{1}\over{|f^'(x_j)|}}\phi(x_j)\Rightarrow \langle\delta(f(x)),\phi\rangle=\sum_j{{1}\over{|f^'(x_j)|}}\langle\delta(x-x_j),\phi(x)\rangle\;
(12.59)

Na podstawie obliczeń przeprowadzonych w punkcie (12.59), możemy napisać tożsamość na złożenie funkcji _{\delta(f(x))}\; i funkcji f(x):

\delta(f(x))=\sum_j{{1}\over{|f^'(x_j)|}}\delta(x-x_j)\;
(12.60)

Dla przykładu wykorzystując wzór (12.60) możemy napisać wzór na złożenie delty Diraca δ(x) i funkcji f(x)=x2-a2 wedle sposobu:

\delta(x^2-a^2)={{1}\over{2a}}\left(\delta(x-a)+\delta(x+a)\right)\;
(12.61)

[edytuj] Przykład funkcji (delty) Diraca

Funkcja rozważana przez Diraca, która jest często używana w mechanice kwantowej jest funkcja, którą jak udowodnimy jest też innym przedstawieniem funkcji Diraca.

\delta(x)=\lim_{a\rightarrow \infty}{{\sin ax}\over{\pi x}}\;
(12.62)

Funkcja Diraca (12.62) opiera się na całce, którą dowodzimy w analizie w teorii całki:

\int_{-\infty}^{\infty}{{\sin x}\over{x}}dx=\pi\;
(12.63)

Funkcja zdefiniowana w (12.62) na podstawie już obliczonej całki (12.63) jest funkcją unormowaną do jedynki, tak samo jak standardowa funkcja Diraca:

\int_{-\infty}^{\infty} \delta(x)=\int_{-\infty}^{\infty}\lim_{a\rightarrow \infty}{{\sin ax}\over{\pi x}}dx={{1}\over{\pi}}\int_{-\infty}^{\infty}\lim_{a\rightarrow \infty}{{\sin ax}\over{\pi ax}}dax=\begin{Bmatrix}
ax=t\\
dax=dt
\end{Bmatrix}=\;
={{1}\over{\pi}}\int^{+\infty}_{-\infty}{{\sin t}\over{t}}dt={{1}\over{\pi}}\pi=1\;
(12.64)

Sprawdźmy, czy funkcja przedstawiona przez Diraca (12.62) jest funkcją parzystą, tak jak zwykła definicja tej naszej funkcji:

\delta(-x)=\lim_{a\rightarrow \infty}{{\sin a(-x)}\over{\pi (-x)}}=\lim_{a\rightarrow \infty}{{\sin ax}\over{\pi x}}=\delta(x)\;
(12.65)

Funkcja rozważana przez Diraca na podstawie obliczeń (12.65) jest funkcją parzystą jak przypuszczaliśmy.

\delta(-x)=\delta(x)\;
(12.66)

A zatem przejdźmy do innego dowodu, tzn. że ona jest funkcją osobliwą dla punktu zerowego, czyli dla tego punktu przyjmuje wartość nieskończoną:

\delta(x)=\infty\; dla x=0\;
(12.67)

Udowodnijmy warunek (12.67) na podstawie przedstawienia naszej funkcji wedle (12.62), zatem:

\delta(0)=\lim_{x\rightarrow 0}\delta(x)=\lim_{x\rightarrow 0}\lim_{a\rightarrow \infty}{{\sin ax}\over{\pi x}}=\lim_{a\rightarrow \infty}\lim_{x \rightarrow 0}{{\sin ax}\over{\pi ax}}a=\lim_{a\rightarrow \infty}{{a}\over{\pi}}=\infty\;
(12.68)

Funkcja rozważana przez Diraca jest osobliwa w punkcie zerowym i ma okres _{{{2\pi}\over{a}}}\; znikającym wraz ze wzrostem wartości x, ale _{\lim_{a\rightarrow\infty}{{2\pi}\over{a}}=0}\;, czyli ma okres zerowy, czyli średnia wartość funkcji w dowolnym punkcie nierównym zeru jest wartość zero poza punktem x=0, dla którego dąży do nieskończoności, jak udowodniliśmy. Zatem funkcja (12.62) ma wszystkie własności funkcji Diraca, więc jest nią, co można używać ją w tymże sensie jako funkcję uogólnioną.

[edytuj] Funkcja Heaviside'a

Podamy jeszcze inne własności funkcji Diraca. Napiszmy funkcję schodkową i nazwijmy ją funkcją Heaviside'a oraz opisując tą funkcję, że dla liczb dodatnich funkcja przyjmuje wartość jeden, a dla liczb ujemnych wartość zero, a dla jedynki już jest równa połowie jedynki:

\theta(\tau)=\begin{cases}
1&\mbox{ dla }\tau>0\\
{{1}\over{2}}&\mbox{ dla }\tau=0\\
0&\mbox{ dla }\tau<0
\end{cases}\;
(12.69)

Pochodną funkcji schodkowej (12.69) jest to po prostu delta Diraca, którą jak widzimy, że pochodna naszej omawianej funkcji jest wszędzie równa zero, ale już dla punktu τ=0, dla której już jest równa nieskończoność.

{{d\theta(\tau)}\over{d\tau}}=\delta(\tau)\;
(12.70)

[edytuj] Szeregi Fouriera

Każdą funkcję, która zmienia się okresowo możemy rozłożyć w szereg sinusów i kosinusów. Takie postępowanie nosi nazwę procedury spektralnej lub harmonicznej. Naszą funkcję możemy rozłożyć w szereg funkcji wykładniczych o urojonych wykładniku potęgi. Takie rozłożenie w szereg Fouriera stosuje się zwykle dla przebiegów czasowych i przestrzennych.

[edytuj] Funkcje uogólnione periodyczne i funkcje próbne w teorii dystrybucji

Oczywiste jest, że dystrybucję f definiujemy przy użyciu funkcji próbnej φ. Funkcja zwana dystrybuantą jest definiowana przy pomocy funkcji próbnej, jeśli jest funkcją okresową i jej periodyczność jest określona wzorem f(x+l)=f(x), to działanie na funkcję próbną φ(x) będziemy określać w postaci całki, którą dzielimy na najmniejsze przedziały, w której już ta funkcja nie jest funkcją periodyczną i zamiast całki pojawia się suma całek. Korzystając przy tym z okresowości funkcji f, więc jego działanie określamy przez:

\langle f,\phi\rangle=\int_{-\infty}^{\infty}f(x)\phi(x)dx=\sum_{n=-\infty}^{\infty}\int_{nL}^{(n+1)L}f(x)\phi(x)dx=\;
=\begin{Bmatrix}x=y-nL\end{Bmatrix}=\sum_{n=-\infty}^{\infty}\int_0^L f(y-nL)\phi(y-nL)dy=\sum_{n=-\infty}^{\infty}\int_0^Lf(y-nL)\phi(y-nL)dy=\;
=\sum_{n=-\infty}^{\infty}\int_0^L f(y)\phi(y-nL)dy=\;
=
\int_0^Ldyf(y)\sum_{n=-\infty}^{\infty}\phi(y-nL)\;
(13.1)

Na sam koniec otrzymaliśmy nową funkcję próbną w obliczeniach (13.1), którą nazwiemy ψ(y), a jej definicją jest:

\psi(y)=\sum_{-\infty}^{\infty}\psi(y+nL)\;
(13.2)

Według obliczeń przeprowadzonych w punkcie (13.1) działanie funkcji możemy zredukować do postaci poniżej, używając ogólnego symbolu T dystrybuanty. Podwójny znak działania będziemy tutaj określać tutaj dla działania ograniczone do pierwszego okresu.

\langle T,\psi\rangle=\langle\langle T,\sum_{n=-\infty}^{\infty}\phi(x+nL)\rangle\rangle=\langle\langle T,\psi\rangle\rangle\;
(13.3)

[edytuj] Określenie współczynników Fouriera względem dystrybuanty T

Każdej dystrybucji możemy przepisać pewne współczynniki Fouriera, w której występuje dystrybuanta T(x) zależna tylko od jednej zmiennej iksowej:

c_n(T)={{1}\over{L}}\langle\langle T,e^{{{-2\pi inx}\over{L}}}\rangle\rangle={{1}\over{L}}\int_0^LT(x)e^{-{{2\pi inx}\over{L}}}\;
(13.4)

[edytuj] Definicja szeregu Fouriera

Szeregiem Fouriera F[T] o periodyczności T i o okresie L nazywamy szereg ze współczynnikami cn(T) określaną:

F[T]=\sum_{n=-\infty}^{\infty}c_n(T)e^{{{2\pi inx}\over{L}}}\;
(13.5)

Wykażemy, że szereg określony wzorem (13.5) jest równy samej dystrybucji określanej przez funkcję T, czyli zachodzi na pewno:

F[T]=T\;
(13.6)

Z analizy funkcjonalnej wiadomo, że każdą funkcję możemy przybliżać funkcjami typu _{\psi(y)=e^{-{{2\pi iny}\over{L}}}}\;, teraz określmy działanie F[T] na funkcją ψ(y) sposobem:

\langle\langle F[T],\psi\rangle\rangle=\sum_{n=-\infty}^{\infty}c_n(T)\langle\langle e^{{{2\pi iny}\over{L}}},e^{-{{2\pi imy}\over{L}}}\rangle\rangle=
\sum_{n=-\infty}^{\infty}c_n(T)\delta_{nm}L=c_m(T)L\;
(13.7)

Jeśli natomiast podstawimy wzór na współczynniki Fouriera (13.4) do wzoru (13.7), to otrzymamy równość, z którego coś wywnioskujemy dalej, tzn. zachodzi tożsamość (13.6):

\langle\langle F[T],\psi\rangle\rangle={{1}\over{L}}\langle\langle T,e^{{{-2\pi inx}\over{L}}}\rangle\rangle L\Rightarrow
\langle\langle F[T],\psi\rangle\rangle=\langle\langle T,e^{{{-2\pi inx}\over{L}}}\rangle\rangle=\langle\langle T,\psi\rangle\rangle\;
(13.8)

Na podstawie obliczeń (13.8) udowodniliśmy tożsamość (13.6), która jest prawdziwa dla dowolnej funkcji próbnej ψ.

[edytuj] Twierdzenie Bessela-Parsevala

Zakładamy, że mamy dwie funkcje f(y) i g(y), które określać te funkcje będziemy w postaci szeregów określonych wzorami (13.5), przy założeniu, że jest spełniona tożsamość (13.6), to:

f(y)=\sum_m c_m(f)e^{{{2\pi i ym}\over{L}}}\;
(13.9)
g(y)=\sum_n c_n(g)e^{{{2\pi i yn}\over{L}}}\;
(13.10)

Mając już szeregi (13.9) i (13.10) możemy określić iloczyn skalarny funkcji f przez g w postaci:

(f,g)=\sum_0^L\overline{f}(y)g(y)dy=\sum_m\sum_n\tilde{c}_m(f)c_n(g)\int_0^{L}e^{2\pi  i y{{n-m}\over{L}}}=L\sum_n\sum_m\tilde{c}_m(g)c_n(g)\delta_{nm}=\;
=\sum_{n}\tilde{c}_n(f)c_n(g)\;
(13.11)

[edytuj] Rozwinięcie dowolnej funkcji w szereg sinusów i cosinusów

Bardzo często szereg Fouriera przestawiamy jako szereg funkcji sinus i cosinus. Można to uczynić, gdy funkcję wykładniczą o wykładniku urojonym występującą w szeregu (13.5) można rozłożyć na funkcję kosinus i sinus, co piszemy po tej operacji:

T(x)=\sum_{n=-\infty}^{\infty}c_n\cos(2\pi nx/L)+i\sum_{n=-\infty}^{\infty}c_n\sin(2\pi nx/L)
(13.12)

Funkcja cosinus występująca w szeregu (13.12) jest funkcją parzystą, zatem szereg z cosinusami możemy zapisać uproszczonym wzorem:

\sum_{n=-\infty}^{\infty}c_n\cos(2\pi nx/L)=c_0+\sum_{n=1}^{\infty}c_n\cos(2\pi nx/L)+\sum_{n=-1}^{-\infty}c_n\cos(2\pi x n/L)=\;
=
c_0+\sum_{n=1}^{\infty}(c_n+c_{-n})\cos(2\pi x n/L)\;
(13.13)

Podobnie możemy zrobić z szeregiem z sinusami, wiedząc że jest to funkcja nieparzysta:

\sum_{n=-\infty}^{\infty}c_n\sin(2\pi nx/L)=\sum_{n=1}^{\infty}c_n\sin(2\pi nx/L)+\sum_{n=-1}^{-\infty}c_n\sin(2\pi x n/L)=\;
=
\sum_{n=1}^{\infty}(c_n-c_{-n})\sin(2\pi x n/L)\;
(13.14)

Wzór (13.12), który możemy przestawić w innej postaci przy pomocy obliczeń przeprowadzonych w punkcie (13.13) i w (13.14), jest w postaci:

T(x)=c_0+\sum_{n=1}^{\infty}(c_n+c_{-n})\cos(2\pi x n/L)+i\sum_{n=1}^{\infty}(c_n-c_{-n})\sin(2\pi x n/L)\;
(13.15)

Naszym następnym krokiem jest wyznaczenie współczynników c0, i współczynników stojących przy cosinusach an=cn+c-n, i współczynników stojących przy sinusach an=cn+c-n i współczynnika wolnego a0=c0:

a_0=c_0={{1}\over{L}}\langle\langle T,1\rangle\rangle\;
(13.16)
a_n=c _n+c_{-n}={{1}\over{L}}\langle\langle T,e^{-2\pi in x/L}\rangle\rangle+{{1}\over{L}}\langle\langle T,e^{2\pi in x/L}\rangle\rangle={{2}\over{L}}\langle\langle T,\cos(2\pi n y/L)\rangle\rangle\;
(13.17)
b_n=i(c_n-c_{-n})=i\left[{{1}\over{L}}\langle\langle T,e^{-2\pi in x/L}\rangle\rangle-{{1}\over{L}}\langle\langle T,e^{2\pi in x/L}\rangle\rangle\right]={{2}\over{L}}\langle\langle T,\sin(2\pi n y/L)\rangle\rangle\;
(13.18)

[edytuj] Ostateczny wzór na szereg Fouriera i jego współczynniki Fouriera

Szereg otrzymany w punkcie (13.15), przy uzyskanych współczynnikach a0 (13.16), an (13.17) i bn (13.18), możemy zapisać w uproszczonej postaci:

T(x)=a_0+\sum_{n=1}^{\infty}a_n\cos(2\pi x n/L)+i\sum_{n=1}^{\infty}b_n\sin(2\pi x n/L)\;
(13.15)
  • gdzie stałe a0 , bn i cn są zdefiniowane w postaci:
a_0={{1}\over{L}}\int_0^Lf(y)dy\;
(13.16)
a_n={{2}\over{L}}\int_0^{L}f(y)\cos(2\pi ny/L)dy\;
(13.17)
b_n={{2}\over{L}}\int_0^Lf(y)\sin(2\pi n y/L)dy
(13.18)

[edytuj] Policzalny postęp Fouriera

Policzalny (skończony) szereg Fouriera prosty, ale też jego transformatę odwrotną piszemy wedle przestawień:

\tilde{A}_{\nu}={{1}\over{N}}\sum^{N-1}_{n=0}A_ne^{-{{2\pi i\nu n}\over{N}}}\;
(13.19)
A_{\nu}=\sum^{N-1}_{n=0}\tilde{A}_ne^{{{2\pi i\nu n}\over{N}}}\;
(13.20)

Aby wykazać, że transformata odwrotna (13.20) jest działaniem odwrotnym do (13.19), wtedy należy podstawić wzór (13.19) do (13.20), wtedy powiemy:

A_n={{1}\over{N}}\sum_{m=0}^{N-1}A_m\sum_{\nu=0}^{N-1}e^{-2\pi i\nu(m-n)/N}\;
(13.21)

W szeregu (13.21) mamy sumę postępu geometrycznego o ilorazie _{q=\left(e^{2\pi i(n-m)}\right)^{1/N}=1^{1/N}=1}\;, który to szereg nasz w postaci zwartej jest równa zero dla n różnego m. Natomiast gdy n=m, to mamy drugą sumę szeregu występującego w punkcie (13.21), która jest równa Nδnm, w takim razie szereg (13.21) dla naszego przypadku zapisujemy wedle:

A_n={{1}\over{N}}\sum_{m=0}^{N-1}A_m N\delta_{nm}=A_{n}\;
(13.22)

Zatem udowodniliśmy, że transformata (13.20) jest transformatą odwrotną do transformaty (13.19). Jeśli oznaczymy przez _{w=e^{2\pi i/N}}\;, wtedy _{\overline{w}=e^{-2\pi i/ N}=w^{-1}}\;, jeśli oznaczymy elementy macierzy w postaci _{W_{nm}=w^{mn}}\;, to macierz transformująca z _{A_n}\; na _{\tilde{A}_n}\; i odwrotnie jest \overline{W}\;, wtedy wzory wynikające z (13.19) na transformatę prostą (13.19) i wzoru (13.20) na transformatę odwrotną piszemy je razem:

\tilde{A}={{1}\over{N}}\overline{W}\cdot A\;
(13.23)
A=W\tilde{A}\;
(13.24)

[edytuj] Wstęp do transformacji Fouriera

Transformaty Fouriera są to transformaty pozwalające na rozkład pewnej funkcji na funkcję harmoniczne. W praktyce bardzo często jest potrzebne określenie transformaty z funkcji, lub z funkcji do transformaty, w takim razie rozważane transformaty są bardzo potrzebne w fizyce i matematyce.

[edytuj] Definicja prostej i odwrotnej transformaty Fouriera dla dowolnej funkcji

Transformatę funkcji φ będziemy oznaczać symbolem \tilde{\phi}\;, tzn. wzoru na transformatę prostą, a także określmy drugi wzór na transformatę, tzn. na transformatę odwrotną:

\tilde{\phi}(k)={{1}\over{2\pi}}\int_{-\infty}^{\infty}e^{-ikx}\phi(x)dx\;
(14.1)
\phi(x)=\int_{-\infty}^{\infty}e^{ikx}\tilde{\phi}(k)dk\;
(14.2)

W celu przeprowadzenia dowodu, że transformacja (14.2) jest transformatą odwrotną do transformaty prostej (14.1), napiszmy co się stanie, gdy dokonamy podwójnej transformaty funkcji φ(x), w takim przypadku:

\tilde{\tilde{\phi}}(k)={{1}\over{4\pi^2}}\int_{-\infty}^{\infty}e^{ikx}dx\int_{-\infty}^{\infty}e^{-ixy}\phi(y)dy\;
(14.3)

Aby umożliwić zamianę kolejności całkowania wprowadźmy funkcję wykładniczą _{e^{-\epsilon^2x^2}}\;, która jest funkcją wolnozmienną i przy granicy ε dążącej do zera, to ta nasza rozważana funkcja dąży do jedynki, czyli powinno być:

1=\lim_{\epsilon\rightarrow 0}e^{-\epsilon^2x^2}\;
(14.4)

Wtedy na podstawie granicy (14.4) tożsamość (14.3) przyjmuje postać:

\tilde{\tilde{\phi}}(k)=\lim_{\epsilon\rightarrow 0}{{1}\over{4\pi^2}}\int_{-\infty}^{\infty}dy\phi(y)\int_{-\infty}^{\infty}dx 
e^{-\epsilon^2\left(x^2+{{ix(k-y)}\over{\epsilon^2}}\right)}\;
(14.5)

Funkcję wykładniczą występującą w całce w równości (14.5) możemy przestawić wedle tożsamości napisanej poniżej, którą to udowodnimy, jak się przekonamy, to są rachunki elementarne przy dowodzie poniższego lematu:

e^{-\epsilon^2\left(x^2+ix{{k+y}\over{\epsilon^2}}\right)}=e^{-\epsilon^2\left(x+i{{(k+y)}\over{2\epsilon^2}}\right)^2}e^{-{{(k+y)^2}\over{4\epsilon^2}}}\;
(14.6)

Nastepnym krokiem jest udowodnienie tożsamości zapisanej w punkcie (14.6) i jej rozpisanie:

\epsilon^2\left(x+i{{(k+y)}\over{2\epsilon^2}}\right)^2+{{(k+y)^2}\over{4\epsilon^2}}=\epsilon^2\left(x^2-{{(k+y)^2}\over{4\epsilon^4}}+2i{{x(k+y)}\over{2\epsilon^2}}\right)+{{(k+y)^2}\over{4\epsilon^2}}\;
(14.7)

Zatem dowód tożsamości (14.6) został udowodniony przy pomocy obliczeń przeprowadzonych w punkcie (14.7). Następnym krokiem jest za pomocą całki oznaczonej podanej poniżej, dzięki której przeprowadzimy dalszy krok obliczeń (14.5) wykorzystując fakt (14.6), jest policzenie:

\int_{-\infty}^{\infty}e^{-a(x-z)^2}dx=\sqrt{{{\pi}\over{a}}}\;
(14.8)

Co dzieki tej całce możemy przejść do dalszego kroku obliczeń wyrażenia (14.5):

\tilde{\tilde{\phi}}(k)=\lim_{\epsilon\rightarrow 0}{{1}\over{4\pi^2}}\int_{-\infty}^{\infty}dy\phi(y)\int_{-\infty}^{\infty}dxe^{-\epsilon^2\left(x+i{{(k+y)}\over{2\epsilon^2}}\right)^2}e^{-{{(k+y)^2}\over{4\epsilon^2}}}=\lim_{\epsilon\rightarrow 0}{{\sqrt{\pi}}\over{4\pi^2\epsilon}}\int_{-\infty}^{\infty}dy\phi(y)e^{-{{(k+y)^2}\over{4\epsilon^2}}}\;
(14.9)

Mamy tutaj funkcję deltopodobną, która spełnia wszystkie warunki ciągu deltopodobnego, którą określamy wedle wzoru poniżej zależnej od zmiennej y i k:

\delta_{\epsilon}(y)={{1}\over{2\epsilon\sqrt{\pi}}}e^{-{{(k+y)^2}\over{4\epsilon^2}}}\;
(14.10)

Funkcja (14.10) która jest funkcją deltopodobną spełnia całkę (12.1) i dla ε dążącego do zera funkcja dla y nierównego -k, przyjmuje wartość zero, tylko dla y=-k wykładnik potęgi jest równy zero, dla której ta funkcja jest równa nieskończoność dla ε dążącego do zera, zatem ta nasza funkcja deltopodobna spełnia wszystkie warunki do predentowania bycia deltopodobną wielkością. Ponieważ funkcja (14.10) jest funkcją deltopodobną, to funkcję zapisaną w punkcie (14.9) możemy przestawić wedle schematu poniżej:

\tilde{\tilde{\phi}}(k)={{1}\over{2\pi}}\phi(-k)\;
(14.11)

Wynik określony w punkcie (14.11) jest bardzo ważnym wynikiem, która mówi, że dwukrotna transformacja Fouriera tej samej funkcji przechodzi w funkcję wyjściową, ale argumentem jest argument przeciwny do k, czyli -k, oczywiście jest, że cały wynik jest podzielony przez liczbą 2π. Stąd wniosek, że transformatę odwrotną zapisujemy wedle wzoru (14.2).

[edytuj] n-te pochodne transformaty Fouriera

Mając wzór (14.1) możemy napisać n-tą pochodną transformacji Fouriera, którą piszemy według:

\phi^{(n)}(k)=(-i)^n{{1}\over{2\pi}}\int_{-\infty}^{\infty}x^ne^{-ikx}\phi(x)dx=(-i)^n\left(x^n\phi(x)\right)^T\;
(14.12)

Aby udowodnić wzór (14.12) należy skorzystać, z twierdzenia o indukcji zupełnej. Zatem twierdzenie (14.12) jest spełniona dla n=1, na mocy (14.1), zatem jeśli twierdzenie (14.12) jest spełnione dla przypadku n, to powinno być spełnione dla przypadku n+1, co można udowodnić różniczkując stronami obie strony równana (14.12), co otrzymamy twierdzenie, ale dla przypadku n+1. Co kończy dowód naszego twierdzenia.

[edytuj] Transformaty pochodnej i jego wykorzystanie w równaniach różniczkowych

Weźmy sobie n-tą pochodną transformacji funkcji φ, która jest określona względem zmiennej k, jest ona napisana podobnym wzorem do (14.1), której to całkę całkujemy przez części n-razy pamiętając, że za każdym razem powstające niecałkowe wyrazy w granicy w nieskończoności są równe zero:

\left[\phi^{(n)}\right]^{T}(k)={{1}\over{2\pi}}\int_{-\infty}^{\infty}e^{-ikx}\phi^{(n)}(x)dx=(ik)^n{{1}\over{2\pi}}\int_{-\infty}^{\infty}e^{-ikx}\phi(x)dx=(ik)^n\tilde{\phi}(k)\;
(14.13)

Aby zapoznać się transformatom pochodnej należy rozwiązać pewien przykład obrazujący prawo (14.13), zatem napiszmy równanie, od którego będziemy wyznaczać funkcję f poniżej, z której policzymy transformatę Fouriera obu jego stron, w takim razie weźmy przykład:

f^{''}+f^{'}+f=g\Rightarrow \tilde{f^{''}}+\tilde{f^{''}}+\tilde{f}=\tilde{g}\;
(14.14)

Następnym krokiem jest wykorzystanie wzoru (14.13) na n-tą pochodną transformaty funkcji f, z którego wyprowadzimy wzór na transformatę funkcji f, czyli _{\tilde{f}}\;, w takim razie:

-k^2\tilde{f}+ik\tilde{f}+\tilde{f}=\tilde{g}\Rightarrow\tilde{f}={{\tilde{g}}\over{-k^2+ik+1}}\;
(14.15)

Jeśli skorzystamy ze wzoru (14.2) i znając transformatę funkcji g, zatem otrzymujemy wzór na funkcję f, którego zamiar mieliśmy wyznaczyć z pierwszego równania (14.14):

f(x)=\int_{-\infty}^{\infty}e^{ikx}{{\tilde{g}(k)}\over{-k^2+ik+1}}dk\;
(14.16)

[edytuj] Transformata Fouriera iloczynu dwóch funkcji

Przy liczeniu transformaty iloczynu dwóch funkcji skorzystamy tutaj z podobnego triku podobnego do (14.4):

[\phi_1\cdot\phi_2]^{T}{(k)}={{1}\over{2\pi}}\int_{-\infty}^{\infty}e^{-ikx}\phi_1(x)\phi_2(x)dx=
{{1}\over{2\pi}}\lim_{\epsilon\rightarrow 0}\int_{-\infty}^{\infty}e^{-\epsilon^2x^2-ikx}\phi_1(x)\phi_2(x)dx\;
(14.17)

Do wzoru (14.17) wstawiamy wzory na transformatę odwrotną przez wzór (14.2), wtedy dochodzimy do wniosku, że nas wspomniany wzór przepisujemy w formie poniżej. W tych obliczeniach zastosujemy również wzór (14.6), tylko tutaj zamiast k+y występuje -k+k1+k2.

[\phi_1\cdot\phi_2]^{T}{(k)}=\lim_{\epsilon\rightarrow 0}{{1}\over{2\pi}}\int_{-\infty}^{\infty}e^{-\epsilon^2x^2-ikx}dx\int_{-\infty}^{\infty}e^{ik_1x}\tilde{\phi}(k_1)dk_1\int_{-\infty}^{\infty}e^{ik_2x}\tilde{\phi}(k_2)dk_2=\;
=
{{1}\over{2\pi}}\lim_{\epsilon\rightarrow 0}\int_{-\infty}^{\infty}dk_1\tilde{\phi}_1(k_1)\int_{-\infty}^{\infty}dk_2\tilde{\phi}_2(k_2)\int_{-\infty}^{\infty}e^{-\epsilon^2x^2+ix(-k+k_1+k_2)}dx=\;
=
{{1}\over{2\pi}}\lim_{\epsilon\rightarrow 0}\int_{-\infty}^{\infty}dk_1\tilde{\phi}_1(k_1)\int_{-\infty}^{\infty}dk_2\tilde{\phi}_2(k_2)\int_{-\infty}^{\infty}e^{-\epsilon^2\left(x+i{{\left(-k+k_1+k_2\right)}\over{2\epsilon^2}}\right)^2}e^{-{{(-k+k_1+k_2)^2}\over{4\epsilon^2}}}dx=\;
=
{{1}\over{2\pi}}\lim_{\epsilon\rightarrow 0}\int_{-\infty}^{\infty}dk_1\tilde{\phi}_1(k_1)\int_{-\infty}^{\infty}dk_2\tilde{\phi}_2(k_2)e^{-{{\left(-k+k_1+k_2\right)^2}\over{4\epsilon^2}}}\sqrt{{{\pi}\over{\epsilon^2}}}=\;

={{1}\over{2\epsilon\sqrt{\pi}}}\lim_{\epsilon\rightarrow 0}\int_{-\infty}^{\infty}dk_1\tilde{\phi}_1(k_1)\int_{-\infty}^{\infty}dk_2\tilde{\phi}_2(k_2)e^{-{{\left(-k+k_1+k_2\right)^2}\over{4\epsilon^2}}}
(14.18)

W obliczeniach (14.18) występuje funkcja deltopodobna o postaci:

\delta_{\epsilon}={{1}\over{2\epsilon\sqrt{\pi}}}e^{-{{\left(-k+k_1+k_2\right)^2}\over{4\epsilon^2}}}\;
(14.19)

Funkcja (14.19) spełnia całkę (12.1) i dla ε dążącego do zera funkcja dla k nierównego k1+k2, to ta nasza rozważana funkcja jest równa zero, tylko dla k=k1+k2 wykładnik potęgi jest równy zero, dla którego należy wliczyć ε stojący w czynniku przed eksponensem w mianowniku, zatem przy naszym ε dążącej do zera, opisywana funkcja dąży do nieskończoności, zatem ta nasza funkcja deltopodobna spełnia wszystkie warunki do pretendowania bycia deltopodobną wielkością. W takim razie możemy napisać (14.18), korzystając przy tym z (12.38) na splot funkcji uogólnionych:

[\phi_1\cdot\phi_2]^{T}{(k)}=\int_{-\infty}^{\infty}\int_{-\infty}^{\infty}dk_1dk_2\tilde{\phi}_1(k_1)\tilde{\phi}_2(k_2)\delta(k-k_1-k_2)={{1}\over{2\pi}}\int_{-\infty}^{\infty}dk_1\tilde{\phi}_1(k_1)\tilde{\phi}_2(k-k_1)=\;
=[\tilde{\phi}_1*\tilde{\phi}_2](k)\;
(14.20)

Na podstawie tychże przeprowadzonych obliczeń transformata iloczynu dwóch funkcji jest równa splotowi transformaty tychże dwóch omawianych funkcji.

[edytuj] Transformacja Fouriera dla splotu dwóch funkcji

Splot dwóch funkcji napisanej wedle jego definicji (12.39) piszemy wedle schematu poniżej i jak się przekonamy jest ona równa z dokładnością do stałego czynnika iloczynowi transformat funkcji φ1(k) i φ2(k):

[\phi_1*\phi_2]^{T}(k)={{1}\over{2\pi}}\int_{-\infty}^{\infty}dxe^{-ikx}\int_{-\infty}^{\infty}dy\phi_1(x-y)\phi_2(y)=\;

={{1}\over{2\pi}}\int_{-\infty}^{\infty}\int_{-\infty}^{\infty}e^{-iky}\phi_2(y)dy\int_{-\infty}^{\infty}e^{-ik(x-y)}\phi_1(x-y)d(x-y)=2\pi\tilde{\phi}_1(k)\tilde{\phi}_2(k)\;
(14.21)

Na podstawie obliczeń (14.21) udowodniliśmy, że transformata splotu funkcji φ1 i funkcji φ2 jest równa iloczynowi transformat z każdej funkcji z osobna omawianych pomnożonej przez liczbę 2π.

[edytuj] Transformata Fouriera iloczynu skalarnego

Z definicji iloczynu skalarnego dwóch transformat i z definicji transformaty funkcji φ zapisanej wedle (14.1) piszemy:

(\tilde{\phi}_1,\tilde{\phi}_2)=\int_{-\infty}^{\infty}\overline{\tilde{\phi}}_1(k)\tilde{\phi}_2(k)dk={{1}\over{4\pi^2}}\int_{-\infty}^{\infty}dk\int_{-\infty}^{\infty}dxe^{ikx}\overline{\phi}_1(x)\int_{-\infty}^{\infty}dye^{-iky}\phi_2(y)\;
(14.22)

Nastepnym krokiem jest wykorzystanie granicy, którego schemat jest tutaj _{1=\lim_{\epsilon\rightarrow 0}e^{-\epsilon^2k^2}}\;, wtedy wzór (14.21) możemy przekształcić do postaci:

(\tilde{\phi}_1,\tilde{\phi}_2)={{1}\over{4\pi^2}}\lim_{\epsilon\rightarrow 0}\int_{-\infty}^{\infty}\int_{-\infty}^{\infty}\int^{\infty}_{-\infty}dkdxdye^{-\epsilon^2\left(k^2-{{ik(x-y)}\over{\epsilon^2}}\right)}\overline{\phi}_1(x)\phi_2(y)=\;

={{1}\over{4\pi^2}}\lim_{\epsilon\rightarrow 0}\int_{-\infty}^{\infty}\int_{-\infty}^{\infty}\int^{\infty}_{-\infty}dkdxdye^{-{{(x-y)^2}\over{4\epsilon^2}}}e^{-\epsilon^2\left(k+i{{x-y}\over{2\epsilon^2}}\right)^2}\overline{\phi}_1(x)\phi_2(y)
(14.23)

We wzorze (14.23) wykorzystujemy tożsamość całkową (14.8), wtedy nasz wspomniany wzór przyjmuje postać:

(\tilde{\phi}_1,\tilde{\phi}_2)={{1}\over{4\epsilon\pi\sqrt{\pi}}}\int_{-\infty}^{\infty}\int_{-\infty}^{\infty}dxdte^{-{{t^2}\over{4\epsilon^2}}}\overline{\phi}_1(x)\phi_2(x+t)\;
(14.24)

Funkcją deltopodobną wystepująca w obliczeniach (14.24) jest to funkcja zapisana wzorem:

\delta_{\epsilon}={{1}\over{2\epsilon\sqrt{\pi}}}e^{-{{t^2}\over{4\epsilon^2}}}\;
(14.25)

Funkcja (14.25) spełnia całkę (12.2) i dla ε dążącego do zera funkcja dla t nierównego 0, ta nasza rozważana funkcja jest równa zero, tylko dla t=0 wykładnik potęgi jest równy zero, zatem należy wliczyć ε stojący w czynniku w jego mianowniku przed eksponensem, zatem przy naszym ε dążącej do zera, opisywana funkcja dąży do nieskończoności, zatem ta nasza funkcja delto-podobna spełnia wszystkie warunki do pretendowania bycia delto-podobną wielkością. Wtedy obliczenia (14.23) można dokończyć w sposób:

(\tilde{\phi}_1,\tilde{\phi}_2)={{1}\over{2\pi}}\int_{-\infty}^{\infty}\int_{-\infty}^{\infty}dxdt\delta(t)\overline{\phi}_1(x)\phi_2(x+t)={{1}\over{2\pi}}\int_{-\infty}^{\infty}dx\overline{\phi}_1(x)\phi_2(x)={{1}\over{2\pi}}(\phi_1,\phi_2)\;
(14.26)

Wedle obliczeń przeprowadzonych w punkcie (14.26) i powyżej w tym rozdziale stwierdzamy, że iloczyn skalarny transformaty funkcji φ1 i funkcji φ2 jest równy iloczynowi skalarnemu samych dwóch funkcji tutaj omawianych podzielonej przez liczbę 2π.

[edytuj] Transformacja Fouriera funkcji przesuniętej

Napiszmy czemu jest równa transformata funkcji przesuniętej φa=φ(x-a), w takim przypadku z definicji transformaty mamy:

\tilde{\phi}_a(k)={{1}\over{2\pi}}\int_{-\infty}^{\infty}e^{ikx}\psi_a(a)={{1}\over{2\pi}}e^{-ika}\int_{-\infty}^{\infty}e^{-ik(x-a)}\psi(x-a)=\;
=e^{-ika}\int_{-\infty}^{\infty}e^{-ikt}\psi(t)dt=e^{-ika}\tilde{\psi}(x)\;
(14.27)

Na podstawie obliczeń przeprowadzonych w punkcie (14.27) możemy powiedzieć, że transformata funkcji przesuniętej o odcinek "a" wzdłuż osi iksowej jest równa transformacie samej nieprzesuniętej funkcji pomnożonej przez czynnik e-ika.

[edytuj] Transformata Fouriera funkcji parzystej i nieparzystej

Ogólnie funkcję parzystą i nieparzystą oznaczamy, gdy ona spełnia własność ogólnie (wybieramy plus gdy mamy do czynienia z funkcją parzystą, a znak minus, gdy mamy do czynienia z funkcją nieparzystą):

\phi(-x)=\pm \phi(x)\;
(14.28)

Wyznaczmy jakie własności spełnia transformata funkcji parzystej i nieparzystej, czyli wykorzystując własności dla tych funkcji (14.28), w takim wypadku:

\tilde{\phi}(-k)={{1}\over{2\pi}}\int_{-\infty}^{\infty}e^{-i(-k)x}\psi(x)dx=\begin{Bmatrix}y=-x\end{Bmatrix}=
-{{1}\over{2\pi}}\int_{\infty}^{-\infty}e^{-iky}\psi(-y)dy=\;
={{1}\over{2\pi}}\int_{-\infty}^{\infty}e^{-iky}\psi(-y)dy=\pm {{1}\over{2\pi}}\int_{-\infty}^{\infty}e^{-iky}\psi(y)dy=\pm\tilde{\phi}(k)\;
(14.29)

Na podstawie obliczeń (14.29) transformata funkcji parzystej (nieparzystej) jest transformatą parzystą (nieparzystą).

[edytuj] Transformata Fouriera dla dystrybucji

Definicją transformaty Fouriera dystrybucji T nazywamy dystrybucję, która jest opisywana przez własność napisanej poniżej, przy wprowadzeniu definicji transformaty funkcji φ, która jest _{\tilde{\phi}}\; i dystrybucji T, którą jest \hat{T}\;, wiedząc jednocześnie, że każda transformata funkcji jakieś funkcji ma transformatę określoną wzorem (14.1):

\langle  T,\tilde{\phi}\rangle=\langle \tilde{T},\phi\rangle\;
(14.30)

Dowód (14.30) przeprowadzimy w punkcie poniżej.

\langle f,\tilde{\phi}\rangle=\int_{-\infty}^{\infty}dxf(x){{1}\over{2\pi}}\int_{-\infty}^{\infty}dye^{ixy}\phi(y)=
\int_{-\infty}^{\infty}dy\phi(y){{1}\over{2\pi}}\int_{-\infty}^{\infty}dxe^{-iyx}f(x)=\;
=\int_{-\infty}^{\infty}dy\phi(y)\tilde{f}(y)=\langle \tilde{f},\phi\rangle\;
(14.31)

[edytuj] Transformata Fouriera delty Diraca

Dowód naszej własności przeprowadzamy na podstawie twierdzenia (14.30), to na podstawie tego powiemy:

\langle \tilde{\delta},\phi\rangle=\langle \delta,\tilde{\phi}\rangle=\int_{-\infty}^{\infty}\delta(x)\tilde{\phi}(x)dx=\tilde{\phi}(0)={{1}\over{2\pi}}\int_{-\infty}^{\infty}1\cdot\phi(x)dx={{1}\over{2\pi}}\langle 1,\phi\rangle\;
(14.32)

Na podstawie obliczeń przeprowadzonej w punkcie (14.32) transformata Fouriera delty Diraca przestawiamy:

\tilde{\delta}={{1}\over{2\pi}}\;
(14.33)

Wynik (14.33) możemy udowodnić przeprowadzając obliczenia tradycyjną metodą przeprowadzoną wedle wzoru (14.1), w takim przypadku możemy powiedzieć:

\tilde{\delta}={{1}\over{2\pi}}\int_{-\infty}^{\infty}e^{-ikx}\delta(x)dx={{1}\over{2\pi}}e^{ik\cdot 0}={{1}\over{2\pi}}\;
(14.34)

Transformata delty Diraca przesuniętej o odcinek "a" wzdłuż osi iksowej, przestawiamy na podstawie twierdzenia (14.27) i w wyniku obliczeń przeprowadzonych w punkcie (14.32), rysujemy:

\tilde{\delta}_a(k)={{1}\over{2\pi}}e^{-ika}\tilde{\delta}(k)\;
(14.35)

[edytuj] Transformata Fouriera funkcji stałej

Korzystając z udowodnionego twierdzenia (14.11) możemy powiedzieć, że podwójna transformata delty Diraca jest równa tej samej delcie, ale podzielonej przez 2π, w takim razie możemy powiedzieć, co dalej z własności parzystości delty Diraca możemy powiedzieć:

\tilde{\tilde{\delta}}={{1}\over{2\pi}}\delta(-x)={{1}\over{2\pi}}\delta(x)\;
(14.36)

Z drugiej strony ten sam dowód możemy przeprowadzić jeszcze raz licząc transformatę obu jego stron wzoru (14.34), wtedy na podstawie tego dostajemy własność:

\tilde{\tilde{\delta}}={{1}\over{2\pi}}\tilde{1}\;
(14.37)

Możemy porównać wzory (14.36) i (14.37) dostając bardzo ważną właściwość, że transformata jedynki jest równa:

\tilde{1}=\delta\;
(14.38)

Na podstawie własności (14.38) możemy powiedzieć, że transformata Fouriera stałej jest równa delcie Diraca. W fizyce często stosuje się umowną wersję definicji delty Diraca, którą zapisujemy wedle sposobów, które są ze sobą równoważne:

\delta(x)={{1}\over{2\pi}}\int_{-\infty}^{\infty}e^{-ikx}dk\;
(14.39)
\delta(x)={{1}\over{2\pi}}\int_{-\infty}^{\infty}e^{ikx}dk\;
(14.40)

Należy pamiętać, że definicję funkcji δ(x) opisywaną wzorami (14.39) i (14.40) są całkami podzielonymi przez liczbę 2π i są całkami niezbieżnymi wedle definicji całki Riemanna.

[edytuj] Transformata Fouriera dystrybucji przesuniętej

Dystrybucją przesunięcia o wartość o "a" nazywamy taka dystrybucją, którą wynikiem działania na funkcję φ(x), ale też przesuniętą o "a", daje nam działanie samej dystrybucji na tą samą funkcji φ(x), co zapisujemy wzorem:

\langle T(x-a),\phi(x-a)\rangle=\langle T(x),\phi(x)\rangle\;
(14.41)

Transformatę dystrybucji możemy policzyć wedle:

\langle T_a(k),\phi(k)\rangle=\langle T(x-a),\tilde{\phi}(x)\rangle=\langle T(x),\tilde{\phi}(x+a)\rangle\;
(14.42)

Następnym krokiem jest napisać transformatę funkcji φ przesuniętej o wartość "a", co w tym przypadku napiszmy transformatę funkcji przesuniętej wedle schematu:

\tilde{\phi}(y+a)={{1}\over{2\pi}}\int_{-\infty}^{\infty}e^{-iky}\phi(x+a)dx={{1}\over{2\pi}}\int_{-\infty}^{\infty}e^{-ik(y+a)}\phi(x)dy=\;
={{1}\over{2\pi}}\int_{-\infty}^{\infty}e^{-iyx}\left(e^{-iax}\phi(x)\right)dx=\left[e^{-iax}\phi(x)\right]^{T}(y)\;
(14.43)

Jeśli wykorzystamy obliczenia przeprowadzone w punkcie (14.43), wtedy możemy przeprowadzić do końca nasze obliczenia:

\langle \tilde{T}_a(k),\tilde{\phi}(k+a)\rangle=\langle T(x-a),\tilde{\phi}(x)\rangle=\langle T(x),\tilde{\phi}(x+a)\rangle=\langle T(k),[e^{-iak}\tilde{\phi}(k)]^{T}(y)\rangle=\;

=\langle \tilde{T}(k),e^{-iak}\tilde{\phi}(k)\rangle=\langle e^{-ika}\tilde{T}(k),\phi(k)\rangle
(14.44)

Porównując prawą i lewą stronę obliczeń (14.44) dostajemy stąd bardzo ważny wniosek co do przesunięcia transformaty dystrybuanty T(x), czyli w takim przypadku możemy napisać końcowy wzór:

\tilde{T}_a(k)=e^{-ika}\tilde{T}(k)\;
(14.45)

Porównując wzór (14.45) ze wzorem (14.27) dochodzimy do wniosku, że transformata przesunięcia zwykłej funkcji i przesunięcia transformaty dystrybuanty są to definicje formalnie identyczne.

[edytuj] Transformata Fouriera dla potęgi

Określmy transformatę funkcji potęgowej określonej przez wzór T=xn, wykorzystując przy tym definicję transformaty dystrybuanty (14.30):

\langle[x^n]^{T}\phi\rangle=\langle x^n,\tilde{\phi}\rangle=\langle 1,x^n\tilde{\phi}\rangle\;
(14.46)

Następnym krokiem jest wykorzystanie twierdzenia o transformacie n-tej pochodnej, przy tym wykorzystując wzór (14.13), wtedy możemy otrzymać tożsamość biorąc za k=x:

[\phi^{(n)}]^{T}=(ix)^n\tilde{\phi}\Rightarrow x^n\tilde{\phi}=(-i)^n\phi^{(n)}\;
(14.47)

Na podstawie przestawionych obliczeń (14.47) możemy dokończyć obliczenia, które przerwaliśmy w punkcie (14.46), zatem biorąc tożsamość (14.38) i w wyniku końcowych obliczeń dostajemy wniosek:

\langle[x^n]^{T}\phi\rangle=(-1)^n\langle1,[\phi^{(n)}]^{T}\rangle=(-i)^n\langle\tilde{1},\phi^{(n)}\rangle =(-i)^n\langle\delta,\phi^{(n)}\rangle=\;
=(-i)^n\langle(-1)^n\delta^{(n)},\phi\rangle=\langle i^n\delta^{(n)},\phi\rangle
(14.48)

Na podstawie obliczeń przeprowadzonych w punkcie (14.48) możemy powiedzieć zdanie:

[x^n]^{T}=i^n\delta^{(n)}\;
(14.49)

Wzór (14.49) otrzymujemy również poprzez n-krotnie różniczkowanie obustronne wzoru (14.39).

[edytuj] Transformata Fouriera funkcji sinus

Przed dalszym krokiem wyznaczenia transformaty funkcji sinus należy przeprowadzić nasz ciąg obliczeń przy okazji korzystając ze wzoru (14.30) i rozkładając wzór na sinus poprzez funkcje eksponencjalne, w takim razie:

\langle[\sin x]^{T}\phi\rangle=\langle \sin x,\tilde{\phi}\rangle={{1}\over{2i}}\left(\langle e^{ix},\tilde{\phi}\rangle-\langle e^{-ix},\tilde{\phi}\rangle\right)\;
(14.50)

Następnie określmy przesunięcie transformaty funkcji φ, wtedy możemy powiedzieć że zachodzą dwa poniższe wzory w zależności od znaku wykładniku potęgi stojącej przy funkcji _{\tilde{\phi}}\;:

e^{ik}\tilde{\phi}(k)={{1}\over{2\pi}}\int_{-\infty}^{\infty}e^{-i(k-1)x}\phi(x)dx=\tilde{\phi}(k-1)\;
(14.51)
e^{-ik}\tilde{\phi}(k)={{1}\over{2\pi}}\int_{-\infty}^{\infty}e^{-i(k+1)x}\phi(x)dx=\tilde{\phi}(k+1)\;
(14.52)

Zatem na podstawie przeprowadzonych obliczeń (14.51) i (14.52) i korzystając z własności (14.41) możemy dokończyć obliczenia przeprowadzonych w punkcie (14.50).

\langle[\sin x]^T,\phi\rangle={{1}\over{2i}}\left(\langle 1,\tilde{\phi}(k+1)\rangle-\langle 1,\tilde{\phi}(k-1)\rangle\right)={{1}\over{2i}}\left(\langle\tilde{1},\phi(k+1)\rangle-\langle\tilde{1},\phi(k-1)\right)=\;

={{1}\over{2i}}\left(
\langle \delta(k),\phi(k+1)\rangle-\langle\delta(k),\phi(k-1)\rangle
\right)={{1}\over{2i}}\left(\langle\delta(k-1),\phi(k)\rangle-\langle \delta(k+1),\phi(k)\rangle\right)=\;

={{1}\over{2i}}\left(\langle \delta(k-1)-\delta(k+1),\phi(k)\rangle\right)
(14.53)

Wedle obliczeń przeprowadzonych w punkcie (14.53) możemy powiedzieć, że porównując skrajne równości we wspomnianych obliczeniach, zatem na podstawie tego dostajemy, że transformata funkcji sin x wygląda:

[\sin x]^T={{1}\over{2i}}\left[\delta(k-1)-\delta(k+1)\right]\;
(14.54)

[edytuj] Transformata Fouriera funkcji schodkowej

Funkcję schodkową Heaviside'a θ(x) można wyrazić poprzez funkcję znakową wedle schematu:

\theta(x)={{1}\over{2}}\left(1+\operatorname{sqn} x\right)\;
(14.55)

Na podstawie przestawienia funkcji schodkowej poprzez funkcję znakową transformata funkcji schodkowej sprowadza się do obliczenia transformaty funkcji znakowej. Wyznaczmy transformatę funkcji znakowej, którą możemy wyznaczyć przy pomocy przy poniższych obliczeń:

\langle[\operatorname{sqn}]^T,\phi\rangle=\langle \operatorname{sqn},\tilde{\phi}\rangle=\lim_{A\rightarrow \infty}\left[-\int_{-A}^0\tilde{\phi}(k)dk+\int_0^A\tilde{\phi}dk\right]=\;
=\lim_{A\rightarrow \infty}\left[\left(-\int_{-A}^{0}+\int_0^A\right)dk{{1}\over{2\pi}}\int_{-\infty}^{\infty}e^{-ikx}\phi(x)dx\right]\;
(14.56)

W całce występującej w punkcie (14.56) jest dozwolona zmiana kolejności całkowania, zatem na podstawie tych wspomnień możemy napisać tożsamość:

\langle[\operatorname{sqn}]^T,\phi\rangle={{1}\over{2\pi}}\lim_{A\rightarrow \infty}\int_{-\infty}^{\infty}dx\phi(x)
\left(-\int_{-A}^{0}+\int_0^A\right)e^{-ikx}dk=\;

={{1}\over{2\pi}}\lim_{A\rightarrow \infty}\int_{-\infty}^{\infty}dx{{\phi(x)}\over{-ix}}\left(-2+e^{ixA}+e^{-ixA}\right)=
{{1}\over{2\pi}}\lim_{A\rightarrow \infty}\int_{-\infty}^{\infty}dx{{\phi(x)}\over{-ix}}\left(-2+2\cos(xA)\right)
(14.57)

Dalszym naszym krokiem jest obliczenie całki poniżej, którą jak wykażemy jest równa zero, w takim razie możemy powiemy:

\lim_{A\rightarrow \infty}\int_{-\infty}^{\infty}dx{{\phi(x)\cos kA}\over{x}}=\begin{Bmatrix}y=xA\end{Bmatrix}=
\lim_{A\rightarrow \infty}\int_{-\infty}^{\infty}{{dy}\over{A}}{{A}\over{y}}\phi\left({{y}\over{A}}\right)\cos ydy=
\;

=\lim_{A\rightarrow \infty}\int_{-\infty}^{\infty}dy\phi\left({{y}\over{A}}\right){{\cos y}\over{y}}=\phi(0)\int_{-\infty}^{\infty}dy{{\cos y}\over{y}}=0\;
(14.58)

Ostatnia całka w obliczeniach (14.58) jest równa zero, dlatego, że funkcja podcałkowa jest funkcją nieparzystą. Na podstawie wspomnianych obliczeń przeprowadzonych w punkcie (14.58), to obliczenia (14.57) możemy dokończyć do:

\langle[\operatorname{sqn}]^T,\phi\rangle={{1}\over{i\pi}}\int_{-\infty}^{\infty}dx{{\phi(x)}\over{x}}=\left\langle{{1}\over{i\pi}}{{1}\over{k}},\phi\right\rangle\;
(14.59)

Według obliczeń przeprowadzonych w punkcie (14.59) możemy powiedzieć, że zachodzi transformata funkcji znakowej:

[\operatorname{sqn}]^T={{1}\over{i\pi k}}\;
(14.60)

Wedle przestawienia funkcji schodkowej Heaviside'a (14.55) i transformaty funkcji znakowej (14.60) i przestawienia, że transformata jedynki jest zapisana według (14.38), wtedy powiemy:

\tilde{\theta}(k)={{1}\over{2}}\left[\tilde{1}+[\operatorname{sqn}]^T\right]={{1}\over{2}}\delta(k)-{{i}\over{2\pi k}}\;
(14.61)

[edytuj] Wprowadzenie do teorii operatorów liniowych

Tutaj tylko podamy wstęp do teorii operatorów liniowych, które są bardzo potrzebne w analizie funkcjonalnej, ale najpierw zapoznamy z definicją iloczynu skalarnego, ten obiekt powinien spełniać własności :

(f,f)\geq 0\;
(15.1)

Wzór (15.1) mówi nam, jakie warunki powinna spełniać iloczyn skalarny dwóch funkcji skalarnych lub wektorowych ale ogólnie zespolonych, jeśli ten iloczyn jest równy zero, to możemy dojść do wniosku, że funkcja f jest równa zero. Następnym bardzo ważnym postulatem jest, że zamienienie dwóch funkcji miejscami w iloczynie skalarnym, to ten nowy wynik jest sprzężonym zespolono z starym wynikiem przed przestawieniem, w takim przypadku drugi postulat:

(f,g)=\overline{(g,f)}\;
(15.2)

Ostatnim warunkiem jest liniowość, że względu na drugi czynnik w tymże obiekcie, co zapisujemy jako:

(f,ag+bh)=(a(f,g)+b(f,h)\;
(15.3)

Jeśli zastosujemy wzór na liniowość drugiego czynnika (15.3) i postulat (15.2), wtedy dostajemy, że istnieje anty-liniowość ze względu na pierwszy czynnik, co obrazujemy:

(af+bh,g)=\overline{a}(f,g)+\overline{b}(h,g)\;
(15.4)

Gdy mamy iloczyn skalarny dwóch wektorów w przestrzeni kartezjańskiej, to definicja takiego iloczynu jest napisana przez definicję poszczególnych składowych:

(A,B)=A_xB_x+A_yB_y+A_zB_z\;
(15.5)

W przestrzeni funkcyjnej często przyjmuje się jako definicję iloczynu skalarnego dla dwóch funkcji zapisanych w przestrzeni zespolonej:

(f,g)=\int_a^b\overline{f(x)}g(x)dx\;
(15.6)

Kwadrat normy wektora f zapisujemy wedle nastepującej definicji:

||f||^2={(f,f)}\;
(15.7)

Kwadrat definicji normy funkcji f (15.7), wynikającego z definicji iloczynu skalarnego (15.6), określamy dla przestrzeni jednowymiarowej i trójwymiarowej jako normę wektora:

||f||^2=\int^a_b|f(x)|^2dx\;
(15.8)
||f||^2=\int_{R^3}|f(\vec{r})|^2d^3\vec{r}\;
(15.9)

Odległość dwóch funkcji f i g definiujemy:

d(f,g)=||f-g||\;
(15.10)

Przestrzeń nazywamy zupełną, gdy każdy ciąg pewnych funkcji ma granicę w tej omawianej przestrzeni, w której określamy daną funkcję.

[edytuj] Iloczyn operatorowy

Iloczynem dwóch operatorów _{A\cdot B}wnazywamy operację, której najpierw operator B działa na funkcję w, a potem w ten sposób otrzymanego obiektu wsadzamy do działania operatora A, co ten wynik zapisujmy:

(AB)w=A(Bw)\;
(15.11)

Jeśli n-ta potęga operatora A działa na funkcję w, wtedy jego działanie jest w postaci:

A^nw=A(A...(A(Aw))...)\;
(15.12)

[edytuj] Funkcja, w której argumentem jest pewien operator

Załóżmy, że mamy pewną funkcję, w której argumentem nie jest pewna liczba, tylko pewnego rodzaju operator. Przykładem takiej funkcji, w której występuje pewien operator:

f(\hat{A})={{1}\over{1-\hat{A}}}\;
(15.13)

Każdą funkcję możemy rozłożyć w szereg Taylora, zatem twory typu (15,13) rozumie się, że aby je policzyć należy je rozłożyć we wspomniany szereg:

f(\hat{A})=f(0)\hat{1}+f^'(0)\hat{A}+{{1}\over{2!}}f^{'}(0)\hat{A}^2+...\;
(15.14)

Zbieżność szeregu (15.14) nie jest automatyczna, aby był szeregiem zbieżnym należy określić normę naszego operatora _{\hat{A}}\; należy napisać:

||A||=\operatorname{sup}||\hat{A}f||\mbox{, gdy zachodzi }||f||=1\;
(15.15)

Funkcję (15.14) możemy liczyć wedle sposobu poniżej, tak się to dzieje, gdy dokonamy rozwinięcia funkcji f(x)=(1-x)-1 w szereg Taylora i do tego operatora wstawiamy operator \hat{A}\;, zatem na podstawie tychże rozważań możemy powiedzieć:

f(\hat{A})=(1-\hat{A})^{-1}=\hat{1}+\hat{A}+\hat{A}^2+\hat{A}^3+...\;
(15.16)

A eksponens pewnego operatora liczymy podobnie jak w przykładzie (15.16), ale tym razem mamy do czynienia z funkcją , której jest eksonens, której to naszą funkcję eax rozkładamy w szereg Tayllora, a później do niego podstawiamy operator a\hat{A}\;, co możemy pisać:

f(\hat{A})=e^{a\hat{A}}=\hat{I}+a\hat{A}+{{1}\over{2!}}a^2\hat{A}^2+{ {1}\over{3!}}a^3\hat{A}^3+...\;
(15.17)

[edytuj] Wprowadzenie do teorii komutacji i antykomutacji dwóch operatorów

Ogólnie dwa operatory nie są przemiennymi operatorami, tzn. nie zachodzi w ogólności działanie _{\hat{A}\hat{B}=\hat{B}\hat{A}}\;, zatem wprowadźmy definicję komutatora, w których dla dwóch operatorów nazywamy definicję:

[\hat{A},\hat{B}]=\hat{A}\hat{B}-\hat{B}\hat{A}\;
(15.18)

Dla przykładu policzmy komutator określony dla dwóch operatorów, tzn. operatora mnożenia przez liczbę i operatora różniczkowania, którego obliczenia przeprowadzimy poniżej:

\left[x,{{d}\over{dx}}\right]=x{{d}\over{dx}}-{{d}\over{dx}}(x)=x{{d}\over{dx}}-x{{d}\over{dx}}-\hat{1}=\hat{1}\;
(15.19)

Naszym następnym krokiem jest udowodnienie twierdzenia, której przestawienie jest wedle poniższego wzoru:

[\hat{A}\hat{B},\hat{C}]=\hat{A}[\hat{B},\hat{C}]+[\hat{A},\hat{C}]\hat{B}\;
(15.20)

Dowód tożsamości (15.20) przestawimy wedle toku obliczeń poniżej, z którego to udowodnimy, że wychodząc z prawej strony obliczeń wspomnianego wzoru przechodzimy do jego lewej strony:

\hat{A}[\hat{B},\hat{C}]+[\hat{A},\hat{C}]\hat{B}=\hat{A}\hat{B}\hat{C}-\hat{A}\hat{C}\hat{B}+\hat{A}\hat{C}\hat{B}-\hat{C}\hat{A}\hat{B}=\hat{A}\hat{B}\hat{C}-\hat{C}\hat{A}\hat{B}=[\hat{A}\hat{B},\hat{C}]\;
(15.21)

[edytuj] Definicja operatora sprzężonego

Operatorem sprzężonym _{\hat{A}^*}\;do operatora _{\hat{A}}\; nazywamy taki operator, którego definicja jest przestawiana przy pomocy pewnych wektorów u i v, w takim razie:

(\hat{A}u,v)=(u,\hat{A}^*v)\;
(15.22)

Następnym krokiem bardzo znanym fizyce, gdy operator _{\hat{A}}\; jest pewną macierzą, a u i v są pewnego rodzaju wektorami pionowymi, jest:

(\hat{A}u,v)=\sum_{i,j=1}^n\overline{A}_{ij}\hat{u}_iv_j=\sum_{i,j=1}^n\overline{u}_j\overline{A}^T_{ji}v_i=(u,\overline{A}^Tv)\;
(15.23)

Z obliczeń przeprowadzonych w punkcie (15.23) możemy napisać wniosek:

\hat{A}^*=\overline{\hat{A}}^T\;
(15.24)

[edytuj] Iloczyn operatora i pewnego parametru i jego sprzężenie

Wykorzystując definicję operatora sprzężonego (15.24) możemy obliczyć wyrażenie (\lambda\hat{A}u,v)\;dwoma różnymi sposobami, by potem można by je przyrównać łatwo:

(\lambda\hat{A}u,v)=(u,(\lambda\hat{A})^*v)\;
(15.25)
(\lambda\hat{A}u,v)=\overline{\lambda}(\hat{A}u,v)=\overline{\lambda}(u,\hat{A}v)=(u,\overline{\lambda}\hat{A}v)\;
(15.26)

Możemy przyrównać oba powyższe wzory do siebie, bo one oznaczają to samo, stąd wniosek:

(\lambda\hat{A})^*=\overline{\lambda}\hat{A}^*\;
(15.27)

[edytuj] Definicja operatora hermitowskiego, czyli operatora samo-sprzężonego

Operatorem samosprzężonym do operatora \hat{A}\;nazywamy taki operator, który jest równy samemu opisywanemu operatorowi:

\hat{A}^*=\hat{A}\;
(15.28)

Gdy dany operatorem jest zwykłą macierzą, to warunek (15.24) piszemy:

\overline{\hat{A}}^T=\hat{A}\;
(15.29)

[edytuj] Definicja operatora odwrotnego

Definicją operatora odwrotnego _{\hat{A}^{-1}}\;do operatora _{\hat{A}}\; nazywamy taki operator spełniający warunek:

\hat{A}\hat{A}^{-1}=\hat{A}^{-1}\hat{A}=\hat{I}\;
(15.30)

Jeśli operator _{\hat{A}}\; jest zwykłą macierzą, to operator odwrotny tegoż operatora (tutaj macierzy) nazywamy macierzą odwrotną znaną z klasycznego kursu algebry.

[edytuj] Definicja operatora unitarnego

Operatorem unitarnym \hat{A}\; nazywamy takim operatorem, który po prowadzeniu do iloczynu skalarnego nie zmienia długości norm, wtedy jego definicja jest:

(\hat{A}w,\hat{A}v)=(w,v)\;
(15.31)

Jeśli wykorzystamy definicję operatora sprzężonego unitarnego określona wedle wzoru (15.22), wtedy wzór (15.31) możemy zapisać:

(\hat{A}w,\hat{A}\hat{v})=(w,\hat{A}^*\hat{A}v)\;
(15.32)

Ze wzoru (15.31) i (15.32) wynika, że operator sprzężony od \hat{a}\; jest równy operatorowi odwrotnemu, co przestawiamy:

\hat{A}^*=\hat{A}^{-1}\;
(15.33)

[edytuj] Elementy macierzowe operatora

Załóżmy, że mamy bazę ortogonalną zdefiniowanej wedle określenia ei, w takim przypadku elementami macierzowymi operatora w naszej bazie nazywamy elementy:

A_{ij}=(e_i,\hat{A}e_j)\;
(15.34)

Transformacją wektorów bazy z jednego układu współrzędnych do drugiego przy określeniu, przy definicji operatora \hat{U}\;, określamy jako:

e_j^'=\sum_iU_{ij} e_i\Rightarrow B^'=\hat{U}^T\hat{B}\;
(15.35)

A dowód unitarności operatora \hat{U}\; przeprowadzamy w sposób :

I=(B^',B^')=(\hat{U}^TB,\hat{U}^TB)=(B,(\hat{U}^*)^T\hat{U}^TB)\;
(15.36)

Na podstawie obliczeń przeprowadzonych w punkcie (15.36) możemy napisać, że operator sprzężony, który mówi coś o przejściu z jednego układu do drugiego jest równy operatorowi odwrotnemu do \hat{U}\;, co zapisujemy:

\hat{U}^*=\hat{U}^{-1}\;
(15.37)

Określmy elementy macierzowe operatora _{\hat{A}}\; w nowej bazie względem elementów tego samego operatora w starej bazie:

A_{mn}^'=(e_m^',\hat{A}e_n^')=\sum_{i,j}\overline{U}_{im}U_{jn}(e_i,\hat{A}e_j)=\sum_{i,j}\overline{U}_{im}U_{jn}A_{ij}=\sum_{i,j}\overline{U}_{mi}^TU_{jm}A_{ij}\;
(15.38)

Na podstawie przeprowadzonych obliczeń w punkcie (15.38) możemy powiedzieć, że transformacja operatora z jednego układu współrzędnych do drugiego i po jego odwróceniu, określamy:

\hat{A}^'=\hat{U}^+\hat{A}\hat{U}\;
(15.39)
\hat{A}=\hat{U}\hat{A}^'\hat{U}^{-1}\;
(15.40)

[edytuj] Definicja śladu operatora

Śladem operatora \hat{A}\; nazywamy taką liczbą, która jest sumą jego elementów diagonalnych elementów macierzowych operatora:

\operatorname{Tr}\hat{A}=\sum_i\hat{A}_{ii}\;
(15.41)

Wykażemy, że ślad operatora \hat{A}\; jest niezmienny od wyboru bazy, w której liczymy elementy macierzowe naszego operatora, możemy to stwierdzenie udowodnić:

\operatorname{Tr}\hat{A}^'=\sum_{m}A^'_{mm}=\sum_{i}\overline{U}^T_{ij}A_{jk}U_{ki}=\sum_{i}U_{ki}\overline{U}^{T}_{ij}A_{jk}=\sum_i\delta_{kj}A_{jk}=\sum_jA_{jj}=\operatorname{Tr}\hat{A}\;
(15.42)

[edytuj] Równanie własne, wektory i wartości własne operatora

Równaniem własnym operatora \hat{A}\; przy oznaczeniach dla wartości własnych λ i wektorów własnych u nazywamy obiekt:

\hat{A}u=\lambda u\;
(15.43)

[edytuj] Operatory hermitowskie w zagadnieniu własnym

  • Wartości własne operatora hermitowskiego mając wartości własne rzeczywiste, co możemy udowodnić pisząc dowód tej własności wedle sposobu:
\lambda=(u,\lambda u)=(u,\hat{A}u)=(\hat{A}^*u,u)=(\hat{A}u,u)=(\lambda u,u)=\overline{\lambda}\;
(15.44)

Wedle dowodu przeprowadzone w punkcie (15.44) udowodniliśmy tezę naszego twierdzenia.

  • Wektory własne są do siebie ortogonalne równania własnego (15.44) dla operatora \hat{A}\;, wtedy napiszmy dwa równania własne dla różnych wartości własnych naszego tutaj rozważanego operatora.
\hat{A}u_1=\lambda_1u\;
(15.45)
\hat{A}u_2=\lambda_2u\;
(15.46)

Równanie (15.41) mnożymy przez u_2^*; lewostronnie, a zaś równanie (15.42) mnożymy przez u_1\; prawostronnie, w takim razie te operacje zapisujemy:

(u_2,\hat{A}u_1)=\lambda_1(u_2,u_1)\;
(15.47)
(\hat{A}u_2,u_1)=\lambda_2(u_2,u_1)\;
(15.48)

Ponieważ operator \hat{A}\; jest operatorem hermitowskim, i korzystając własności (15.22) możemy powiedzieć, że lewe strony równań (15.47) i (15.48) są sobie równe, wtedy możemy odejmując oba te równania od siebie:

0=(u_2,u_1)(\lambda_1-\lambda_2)\;
(15.49)

Dla różnych wartości własnych równania własnego (15.43) możemy powiedzieć:

(u_2,u_1)=0\;
(15.50)

Warunek (15.51) wskazuje, że wektory własne równania (15.43) są do siebie ortogonalne.

[edytuj] Grupy i ich reprezentacje

W fizyce z reguły każdy układ ma pewne wartości symetrii, które określamy po dokonaniu tejże symetrii układ pozostaje bez zmian. Wpływem działania grup symetrii na pewne układy zajmuje się tutaj dziedzina matematyki zwaną teorią grup i ich reprezentacji.

[edytuj] Warunki jakie musi spełniać grupa, by być grupą

Wybierzmy sobie zbiór G, w której istnieje działanie, które w wyniku działania dwóch elementów tychże elementów należącej do tego zbioru powstaje element należącej do tej naszej grupy G.

  • Dla każdych elementów _{a,b\in G}\; istnieje trzeci element c\in G\;, które takie działanie dwóch elementów, których w wyniku powstaje trzeci element, określamy:
c=a\cdot b\;
(16.1)
  • W zbiorze G istnieje pewien element neutralny, które w wyniku pomnożenie przez dany element należącej do zbioru G lewostronnie czy prawostronnie powstaje ten sam element, co określamy:
a\cdot e=a\;
(16.2)
e\cdot a=a\;
(16.3)
  • Dla każdego elementu a należącego do zbioru G istnieje element odwrotny a-1, który przy znajomości elementu neutralnego w zbiorze G określamy wedle:
a\cdot a^{-1}=a^{-1}a=e\;
(16.4)
  • Działanie określone w zbiorze G dla gruby jest działaniem łącznym, co jest określane:
(a\cdot b)\cdot c=a\cdot(b\cdot c)\;
(16.5)

[edytuj] Grupy permutacji

Jest to grupa przekształceń skończonych, który w wyniku działania na l elementów otrzymujemy spermutowany wynik, który w zależności od argumentów wrzuconych do funkcji, różni się kolejnością elementów, lub w szczególności może nie być zmiany kolejności, co mamy do czynienia z permutacją tożsamościową. Określmy permutacja P określoną wedle wzoru na zbiorze n-elementowym należącej do zbioru X, co określamy schematem:

P:X\rightarrow X\mbox{,  czyli }P(x_1,x_2,x_3,...x_n)=(x_{j_1},x_{j_2},...,x_{j_n})\;
(16.6)

Odwzorowanie (16.6) jest działaniem wzajemnie jednoznacznym, zatem istnieje też operacja odwrotna do P. Działaniem grupowym dwóch permutacji określamy przez:

(P_1\cdot P_2)(x)=P_1(P_2(x))\;
(16.7)

Elementem jednostkowym nazywamy permutacją identycznościową, która wyniku operacji (16.6) nie zmienia kolejności wyrazów. Liczba elementów permutacji skończonej jest równa liczbie n!

[edytuj] Grupa obrotów w przestrzeni trójwymiarowej

Załóżmy, że mamy oś obrotu wyznaczony przez jednostkowy wektor \vec{k}\;, i obracamy cały układ współrzędnych o kąt α, w ten sposób otrzymujemy wzór określający nowe współrzędnych po obrocie dla danego punktu względem starych współrzędnych przed obrotem:

\vec{r}^'=C_{\vec{k}}(\alpha)\vec{r}=(1-\cos\alpha)(\vec{k}\vec{r})\vec{k}+\vec{r}\cos\alpha+(\vec{k}\times\vec{r})\sin\alpha\;
(16.8)

Inny sposobem obrotu naszego układu współrzędnych jest podanie trzech współrzędnych (θ,φ,ψ), które tworzą grupę obrotów określanych jako C(θ,φ,ψ). Popatrzmy na wzory (4.11), (4.12) i (4.13), a później oznaczmy je po kolei C3(φ), C1(θ), C3(ψ).

C(\theta,\phi,\psi)=C_3(\varphi)C_1(\theta)C_3(\psi)\;
(16.9)

Jeśli zatem po pewnych omówieniach wstawimy za obroty występujące w punkcie (16.9) odpowiednie macierze, to otrzymamy macierz określoną przez wzór (4.15).

[edytuj] Translacje, inwersje i odbicia

Translacją jest to operacja polegająca na sztywnym przesunięciu całej przestrzeni o wektor \vec{t}\;, co obrazujemy:

T:\vec{r}\rightarrow\vec{r}+\vec{t}\;
(16.10)

Inwersją względem danego punktu nazywamy takie przekształcenie płaszczyzny, w której następuje zmiana znaku naszego wektora \vec{r}\;, które to określamy związkiem:

I:\vec{r}\rightarrow-\vec{r}\;
(16.11)

Aby otrzymać macierz inwersji, który działa na wektor \vec{r}\;, to musimy ją napisać jako:

I=\begin{bmatrix}
-1&0&0\\
0&-1&0\\
0&0&-1\end{bmatrix}\;
(16.12)

Odbiciem względem płaszczyzny prostopadłej do wektora \vec{k}\; oznaczamy zwykle symbolem σk. Odbicie względem płaszczyzny prostopadłej do osi iksowej oznaczamy przez σ1, a odbicie dla osi igrekowej oznaczamy odbicie względem osi prostopadłej do osi ikregowej, podobnie ma się to do osi zetowej, zatem wszystkie te trzy macierze odbicia dla osi iksowej, igrekowej i zetowej określamy:

\sigma_1=\begin{bmatrix}-1&0&0\\0&1&0\\0&0&1\end{bmatrix}\;
(16.13)
\sigma_2=\begin{bmatrix}1&0&0\\0&-1&0\\0&0&1\end{bmatrix}\;
(16.14)
\sigma_3=\begin{bmatrix}1&0&0\\0&1&0\\0&0&-1\end{bmatrix}\;
(16.15)

[edytuj] Definicje grupy cyklicznych, a także definicje podgrup i klas

  • Grupa cykliczna jest to grupa, którego elementy są potęgami pierwszego elementu wchodzącej w skład grupy, to zbiór, który jest grupą, określamy:
G=\{a,a^2,a^3,a^4,...,a^n\}\;
(16.16)

Przykładem grupy obrotów cyklicznych jest grupa obrotów wokół ustalonej osi o kąty będącego wielokrotnością liczby 2π/n.

  • Podgrupą nazywamy taki zbiór H grupy G, którego działania dla poszczególnych elementów tejże grupy nie wychodzą poza granice tejże podgrupy.
  • Klasa jest to zbiór K elementów danej grupy, który powstaje z jednego elementu b∈G, jest to zbiór określony;
K=K_a=\{b\cdot a\cdot b^{-1}\in G, b\in G\}\;
(16.17)

[edytuj] Grupy symetrii na podstawie molekuły wody

Molekuła wody

Tutaj zbudujemy pewne działania na grupach symetrii dotyczącej molekuły wody (tlenku wodoru). Struktura przestrzenna cząsteczki wody jest pokazana na rysunku z prawej strony tego rozdziału. Grupy symetrii opisywanej tutaj wody przestawiamy wedle opisów:

  • e - przekształcenie, które działa w sposób neutralny na dany obiekt i w rezultacie otrzymujemy ten sam obiekt wyjściowy do wejściowego, czyli jest to przekształcenie identycznościowe.
  • C2 - jest to przekształcenie, która obraca dany obiekt o 180o względem osi pionowej.
  • σ1 - jest to przekształcenie, które powoduje odbicie względem płaszczyzny prostopadłej do płaszczyzny rysunku.
  • σ2 - jest to przekształcenie powodujące odbicie rysunku względem płaszczyzny w której jest zapisany ten rysunek.

Napiszemy w tabeli elementy działające na symetriach e, C2, σ1, σ2, ale działań przeprowadzonych w tabelce nie będziemy udowadniać.

G
e
C2
σ1
σ2
(13.18)
e e C2 σ1 σ2
C2 C2 e σ2 σ1
σ1 σ1 σ2 e σ1
σ2 σ2 σ1 C2 e

[edytuj] Podziały grup na klasy

Każda grupę można podzielić na podzbiory, których zbiory nie pokrywają się ze sobą i działania obsługujące taką grupę nie wychodzą poza zakres tej naszej struktury, którą jest podgrupa. Wybierzmy teraz klasy (opisuje je schemat (16.17)) generowane przez dwa różne elementy a i b, wtedy jeśli te dwie klasy mają wspólne elementy, to powinno zachodzić na pewno _{gag^{-1}=hbh^{-1}}\;. Z tego wzoru możemy wyznaczyć element b w postaci _{b=h^{-1}gag^{-1}h}. Stąd widzimy, że mając element "a" możemy wyznaczyć element "b", zatem elementy a i b należą do tej samej grupy, a więc dwa zbiory, które mają elementy wspólne muszą się pokrywać. Rozpatrzmy sobie cząsteczkę amoniaku, która zawiera przekształcenie identycznościowe E, trzy odbicia względem pionowych płaszczyzn przechodzące oczywiście przez oś główna naszej rozważanej cząsteczki i dwusieczną katów w podstawie (σ123), a także zawiera dwa obroty, tzn. pierwszy obrót o 120o (C+), a także obrót o 240o (C-). Ta grupa posiada elementy:

G=C_{3\nu}=\{E,\sigma_1,\sigma_2,\sigma_3,C^+,C^-\}\;
(16.19)

W naszym rozważaniach w przypadku grupy (16.19) licząc jej elementy odwrotne, co piszemy:

\sigma_m^{-1}=\sigma_m\mbox{, m=1,2,3}\;
(16.20)
(C^+)^{-1}=C^{-1}\;
(16.21)
(C^{-})^{-1}=C^+\;
(16.22)

Można udowodnić, że grupa G (16.19) dzieli się na trzy rozłączne klasy, których to klasy piszemy wedle przestawień:

K_1=\{E\}\;
(16.23)
K_2=\{\sigma_1,\sigma_2,\sigma_3\}\;
(16.24)
K_3=\{C^+,C^-\}\;
(16.25)

[edytuj] Reprezentacji struktur, które są grupami

Własności opisywanych symetrii mają swój swoisty sposób, które są zapisywane w przestrzeni położeń R3 lub pośrednio określone na funkcjach w tej przestrzeni, operacje te zwykle przedstawiamy w macierzowej postaci i nazywać je będziemy reprezentacjami. Reprezentacją D grupy G jest to zbiór obiektów, które są macierzami kwadratowymi, które są homomorficzne z rozważaną grupą i spełniające podobne własności jak i rozważana grupa. Zgodnie z naszym postulatem możemy powiedzieć:

D(e)=\{\delta_{ij}\}\;
(16.26)
D(a\cdot b)=D(a)D(b)\;
(16.27)
D(a^{-1})=D^{-1}(a)\;
(16.28)

Warunki (16.26), (16.27) i (16.28) sugerują, że reprezentacje też są grupami.

[edytuj] Grupa symetrii wody

Symetrię molekuły wody już rozważaliśmy w rozdziale Grupy symetrii na podstawie molekuły wody, tylko tutaj podamy je w macierzowej wersji w rachunku reprezentacji, które są elementami odbicia, w takim razie ich odpowiednikami są macierze:

\sigma_1=\begin{bmatrix}
-1&0&0\\
0&1&0\\
0&0&1\end{bmatrix}\;
(16.29)
\sigma_2=\begin{bmatrix}
1&0&0\\
0&-1&0\\
0&0&1
\end{bmatrix}\;
(16.30)

[edytuj] Grupa symetrii amoniaku

Symetrie cząsteczki amoniaku

Symetrie cząsteczki amoniaku sprowadzają się do symetrii przekształceń trójkąta równobocznego. Ograniczmy się teraz do płaszczyzny, czyli do dwuwymiarowego układu współrzędnych, a środek umieszczać będziemy w środku geometrycznym trójkąta. Przekształceniami rządzącymi naszym trójkątem równobocznym są to transformacje typu C, czyli są to transformacje, których omawiana grupa zawiera elementy zapisanej w punkcie (16.19), zatem w rachunku reprezentacji mamy macierze D(E), D(σ1), D(σ2), D(σ3), D(C;+), D(C;-):

D(E)=\begin{bmatrix}1&0&0\\0&1&0\\0&0&1\end{bmatrix}\;
(16.31)
D(\sigma_1)=\begin{bmatrix}-1&0&0\\0&1&0\\0&0&1\end{bmatrix}\;
(16.32)
D(\sigma_2)=\begin{bmatrix}
{{1}\over{2}}&-{{\sqrt{3}}\over{2}}&0\\
-{{\sqrt{3}}\over{2}}&-{{1}\over{2}}&0\\
0&0&1\end{bmatrix}\;
(16.33)
D(\sigma_2)\begin{bmatrix}
{{1}\over{2}}&{{\sqrt{3}}\over{2}}&0\\
{{\sqrt{3}}\over{2}}&-{{1}\over{2}}&0\\
0&0&1\end{bmatrix}\;
(16.34)
D(C^+)=\begin{bmatrix}
-{{1}\over{2}}&{{\sqrt{3}}\over{2}}&0\\
-{{\sqrt{3}}\over{2}}&-{{1}\over{2}}&0\\
0&0&1\end{bmatrix}\;
(16.35)
D(C^-)=\begin{bmatrix}
-{{1}\over{2}}&-{{\sqrt{3}}\over{2}}&0\\
-{{\sqrt{3}}\over{2}}&-{{1}\over{2}}&0\\
0&0&1\end{bmatrix}\;
(16.36)

[edytuj] Wstęp do reprezentacji równoważnej

Dwie reprezentacje D i D' nazywamy równoważnymi, jeśli istnieje taka macierz A, dla a∈G, dla której macierz A jest taka sama dla wszystkich elementów grupy, zatem przekształcenie między reprezentacjami równoważnymi przestawiamy wedle:

D^'(a)=AD(a)A^{-1}\;
(16.37)

[edytuj] Wstęp do reprezentacji przywiedlnych

Reprezentacja jest reprezentacją przywiedlną, jeśli istnieje ściśle określona macierz S, w której to reprezentacji D(a) tą całą macierz możemy przekształcić do postaci klatkowej za pomocą transformacji równoważnej (16.37), gdzie a∈ G, a jeśli nie da się tego zrobić, to reprezentację nazywamy nieprzywiedlną.

D^'(a)=S^{-1}D(a)S=\begin{bmatrix}
D_1(a)&0&0&\cdots&0\\
0&D_2(a)&0&\cdots&0\\
0&0&D_3(a)&\cdots&0\\
\cdots&\cdots&\cdots&\cdots&\cdots\\
\cdots&\cdots&\cdots&\cdots&D_m(a)\\
\end{bmatrix}\;
(16.38)

Rozkład reprezentacji na reprezentacje nieprzywiedlne nazywamy sumą prostą tychże reprezentacji i zapisujemy go:

D(a)=D_1\oplus D_2\oplus...\oplus D_m(a)\;
(16.39)

Dla przykładu symetrii molekuły amoniaku określamy przez dwie macierze nieprzywiedlne D1(a) i D2(a), dla każdego elementu grupy G, czyli dla elementów składających się na tą grupę, wiedząc że zachodzi (16.31), (16.32), (16.33), (16.34), (16.35) i macierzy (16.36), zatem na podstawie tego:

E σ1 σ2 σ3 C+ C-
D1 1 1 1 1 1 1
D2 \begin{bmatrix}1&0\\0&1\end{bmatrix}\; \begin{bmatrix}-1&0\\0&1\end{bmatrix}\; \begin{bmatrix}{{1}\over{2}}&-{{\sqrt{3}}\over{2}}\\-{{\sqrt{3}}\over{2}}&-{{1}\over{2}}\end{bmatrix}\; \begin{bmatrix}{{1}\over{2}}&-{{\sqrt{3}}\over{2}}\\-{{\sqrt{3}}\over{2}}&-{{1}\over{2}}\end{bmatrix}\; \begin{bmatrix}-{{1}\over{2}}&{{\sqrt{3}}\over{2}}\\-{{\sqrt{3}}\over{2}}&-{{1}\over{2}}\end{bmatrix}\; \begin{bmatrix}-{{1}\over{2}}&-{{\sqrt{3}}\over{2}}\\{{\sqrt{3}}\over{2}}&-{{1}\over{2}}\end{bmatrix}\;

[edytuj] Właściwości komutacyjne dla reprezentacji nieprzywiedlnej

Jeśli reprezentacja D(a) nieprzywiedlna komutuje z pewną macierzą A, to ta macierz jest prost proporcjonalna do macierzy jednostkowej, co powiemy jako:

[A,D(a)]\Rightarrow AD=DA\;
(16.39)

Załóżmy, że macierz A ma wartości własne i jednej wartości własnej odpowiada kilka wektorów własnych, zatem to równanie własne zapisujemy:

Au=\lambda u\;
(16.40)

Na podstawie własności (16.40) (równanie własne operatora A) i (16.39) (komutacji macierzy A z reprezentacji D(a)) możemy w takim razie napisać obliczenia:

A[D(a)u]=D(a)[Au]=D(a)[\lambda u]=\lambda[D(a)u]\Rightarrow A=\lambda E\;
(16.41)

Na podstawie obliczeń przeprowadzonych w punkcie (16.41) możemy napisać własność dla macierzy A, dla której zachodzi A=λE, i która jest pokazana we wspomnianych obliczeniach.

[edytuj] Dowód lematu Schura

Niech mamy dwie reprezentanty D1 i D2, które są reprezentantami nierównoważnymi i nieprzywiedlnymi grupy G, działający oczywiście w przestrzeniach L1 i L2. Operator liniowy odwzorowuje przestrzeń L2 w przestrzeń L1 spełnia własność:

D^{1}(a)A=AD^{2}(a)\mbox{,  }a\in G\;
(16.42)

To macierz A jest macierzą zerową. W celu dowodu powyższego lematu, załóżmy, że wymiar przestrzeni L1 jest większy od wymiaru przestrzeni L2, zatem oznaczmy przez M obraz powstały wyniku działania macierzy A na przestrzeń L2, wtedy jest oczywiste, żeby tak zachodziło musi być M∈L1. Zbiór ten M jest przestrzenią niezmienniczą względem operatora D1. Jeśli wykorzystamy ze wzoru (16.42), to możemy napisać tożsamość:

D^1M=D^1AL_2=AD^2L_2\subset M\;
(16.43)

Zatem przestrzeń M pokrywa się w przestrzenią L1, co przeczy twierdzeniu o wymiarach, bo zakładaliśmy, że wymiar przestrzeni L1 jest większy od wymiary przestrzeni L2, zatem dochodzimy do wniosku, że macierz A jest macierzą zerową (A=0).

[edytuj] Pełne przedstawienie twierdzenia o ortogonalności

Weźmy dwie nieprzywiedlne reprezentacje, które będziemy oznaczać wskaźnikami α i β, wybierzmy dla naszych dwóch reprezentacji odpowiednie macierze reprezentujące, tzn. macierze Dαij oraz Dβij, to rozważmy iloczyn skalarny dwóch reprezentacji zapisujemy:

(D_{ij}^{\alpha},D_{ml}^{\beta})=\sum_{a\in G}D_{ij}^{\alpha}(a){D}_{ml}^{\beta}(a)\;
(16.44)

Okazuje się, że tak zdefiniowany iloczyn skalarny na reprezentacjach jest równy:

\left(D_{ij}^{\alpha},D^{\beta}_{ml}\right)={{n}\over{d_{\alpha}}}\delta_{\alpha\beta}\delta_{im}\delta_{jl}\;
(16.45)
  • gdzie:
  • n- to ilość elementów grupy, którą reprezentuje reprezentanta.
  • dα -to wymiar przestrzeni grupy, którą reprezentuje dana reprezentanta.

Dowód faktu (16.45) przestawiamy poniżej w tym rozdziale. Załóżmy, że przestrzenie, której wymiar wskazuje reprezentacja ze wskaźnikiem α od reprezentacją ze wskaźnikiem β ma większy wymiar (dα>dβ), zatem na podstawie tego zbudujmy macierz A wedle schematu poniżej i zapisując jednocześnie bardziej szczegółowo wskazując na jego elementy Aim:

A=\sum_{b\in G}D^{\alpha}(b)BD^{\beta}(b^{-1})\Rightarrow A_{im}=\sum_{b\in G}\sum_{p,q}D_{ip}^{\alpha}(b)B_{pq}D^{\beta}_{qm}(b^{-1})\;
(16.46)

Aby udowodnić, czy spełnione jest twierdzenie Schura (16.42) dla dwóch różnych reprezentacji, takich że macierz B jest przekształceniem przestrzeni Lβ w przestrzeń Lα, co udowodnimy, że zachodzi A=0, zatem musimy udowodnić, czy zachodzi ogólnie (16.42):

D^{\alpha}(a)A=\sum_{b\in G}D^{\alpha}(a)D^{\alpha}(b)BD^{\beta}(b^{-1})=\sum_{b\in G}D^{\alpha}(ab)BD^{\beta}((ab)^{-1}a)=\;
=
\left(\sum_{b\in G}D^{\alpha}(ab)BD^{\beta}((ab)^{-1})\right)D^{\beta}(a)=AD^{\beta}(a)\;
(16.47)

Na podstawie obliczeń przeprowadzonych w punkcie (16.47) udowodniliśmy, że macierz A spełnia warunek (16.42), zatem macierz A jest równa zero. Jeśli obierzemy macierz, którego elementy macierzy B można zapisać wedle:

B_{pq}=\delta_{jp}\delta_{lq}\;
(16.48)

Na podstawie definicji elementów macierzy B, czyli według (16.48), że macierz A jest zerowa dla innego α i β, możemy napisać:

0=\sum_{b\in G}D^{\alpha}_{ij}D^{\beta}_{lm}(b^{-1})\;
(16.49)

Następną częścią dowodu jest założenie, że obie reprezentacje są jednakowe, tzn. α=β, również też zachodzi dowód dla tego przypadku (16.47), które to udowodniliśmy, nie wiedząc jakie wartości przyjmuje α i β, więc gdy obie te liczby są równe, to nie wiemy jakie wartości przyjmuje macierz A, zatem korzystając z twierdzenia udowodnionego w tym module w rozdziale Właściwości komutacyjne dla reprezentacji nieprzywiedlnej, a w nim (16.39), zatem należy powiedzieć, jak udowodniono tam, że macierz A jest macierzą jednostkową pomnożonej przez stałą według (16.41), wtedy macierz:

A_{ii}=d\lambda=\sum_{b\in G}\sum_{p,q}D_{ip}(b)B_{pq}D^{-1}_{qi}(b)=\sum_{b\in G}\sum_{p,q}B_{pq}(D^{-1}(b)D(b))_{qp}=\;
=
\sum_{b\in G}\sum_{p,q}B_{pq}\delta_{qp}=\sum_{b\in G}\sum_p B_{pp}=\sum_p\sum_{b\in G}B_{pp}=n\sum_p B_{pp}\;
(16.50)

Elementy macierzy B przestawimy w takiej postaci jak w punkcie (16.48), co na podstawie tego otrzymujemy:

\sum_pB_{pp}=\sum_{p}\delta_{jp}\delta_{lp}=\delta_{jl}\;
(16.51)

Wtedy do wzoru (16.50) podstawiając do niego otrzymaną tożsamość (16.51), wtedy dostajemy związek:

d\lambda=\sum_{b\in G}\sum_{p,q}D_{ip}(b)B_{pq}D^{-1}_{qi}(b)=n\delta_{jl}\Rightarrow \lambda={{n}\over{d}}\delta_{jl}\;
(16.52)

Ale ponieważ macierz A jest macierzą jednostkową pomnożonej przez stałą λ, wtedy dochodzimy po wstawieniu do niej definicji macierzy Aim poprzez definicję parametru λ określonego w punkcie (16.52), wtedy elementy macierzy A są w postaci:

A_{im}=\lambda \delta_{im}={{n}\over{d}}\delta_{jl}\delta_{im}\;
(16.53)

Elementy macierzy A zapisane wedle wzoru (16.46) przy definicji macierzy B (16.48) i po wykorzystaniu warunku (16.49) dla α nierównego β i wzoru (16.53) dla α=β, wtedy dla dowolnego α i β możemy zapisać wzór łączące oba te dwa przypadki:

A_{im}\rightarrow\sum_{b\in G}D^{\alpha}_{ij}(b)D^{\beta}_{lm}(b^{-1})={{n}\over{d}}\delta_{\alpha\beta}\delta_{jl}\delta_{im}\;
(16.53)

Zwykle mamy do czynienia z reprezentacjami unitarnymi, zatem macierz D-1(b) można zastąpić macierzą transponowaną, i która jest sprzężona jeszcze sensie zespolonym. mając wzór (16.53) po wykorzystaniu naszych wniosków wcześniej ostatnio powiedzianych otrzymujemy (16.45).

[edytuj] Reprezentacje i jego charaktery

Charakter oznaczamy przez symbol χ i jego definicja jest taka, że jest to ślad reprezentacji D(a):

\chi(a)=\operatorname{Tr} D(a)=\sum_{ll}D_{ll}(a)\;
(16.54)

Na podstawie twierdzenia (15.37) charaktery nie zależą od bazy, którego reprezentacje są liczone. Zbiór charakterów opisanych wzorem (16.54), których liczba jest taka sama jak i elementów grupy G, zatem zbiór charakterów tworzy n-wymiarowy wektor, którego to zapis:

\chi=(\chi(a_1),\chi(a_2),...,\chi(a_n))\;
(16.55)

Jeśli będziemy rozpatrywać grupę symetrii amoniaku, którego to macierze zapisane są w punkcie Wstęp do reprezentacji przywiedlnych, biorąc reprezentację D1 jako jednowymiarowy wektor, wtedy według tej samej tabelki charakter jest zawsze równy jeden, co zapisujemy:

\chi^1(g)=1\;
(16.56)

Następnie biorąc reprezentację dwuwymiarową D2 grupy symetrii amoniaku, wtedy na podstawie tego charaktery dla tej reprezentacji są przestawione wzorami:

\chi^2(E)=2\;
(16.57)
\chi^2(\sigma_m)=0\mbox{  (m=0,1,2,3)}\;
(16.57)
\chi^2(C^{\pm})=-1\;
(16.58)

[edytuj] Ortogonalna właściwość charakterów

Udowodnimy, że iloczyn skalarny dwóch charakterów charakteryzujące dwie różne reprezentacji przestawiamy:

(\chi^{\alpha},\chi^{\beta})=\sum_{a\in G}\chi^{\alpha}(a)\chi^{\beta}(a)=\sum_{i,l}\sum_{a\in G}D^{\alpha}_{ii}(a)D_{ll}^{\beta}(a)=0\;
(16.59)

Iloczyn charakterów zapisanych wedle wzoru (16.59) na podstawie wielkiego twierdzenia ortogonalności na reprezentantach, czyli według wzoru (16.45) jest równy zero, dla α różnego β.

Wyznaczmy normę reprezentacji χα, i wykorzystując wzór (16.45), wtedy mamy wniosek:

||\chi^{\alpha}||^2=\sum_{i,l}{{n}\over{d_{\alpha}}}\delta_{il}\delta_{il}={{n}\over{d_{\alpha}}}\sum_{il}\delta_{il}\delta_{il}=                 
{{n}\over{d_{\alpha}}}d_{\alpha}=n\;
(16.60)

[edytuj] Reprezentacje przywiedlne i jego charaktery

Wiadomo, że na podstawie (16.38) reprezentację przywiedlną można przestawić jako sumę prostą reprezentacji nieprzywiedlnych, w której dana reprezentacja może się powtarzać mα, to charakter całej reprezentacji przywiedlnej, po rozkładzie jej na reprezentacje nieprzywiedlne jest równy:

\chi(a)=\sum_{\alpha}m_{\alpha}\chi^{\alpha}(a)\;
(16.61)

[edytuj] Kryterium nieprzywiedlności reprezentacji

Grupowy kwadrat charakteru danej reprezentacji jest równy modułowi charakterowi całej reprezentacji przywiedlnej, czy według wzorowi określonego wzorem (16.41):

||\chi||^2=\left(\sum_{\alpha}m_{\alpha}\chi^{\alpha},\sum_{\beta}m_{\beta}\chi^{\beta}\right)=\sum_{\alpha,\beta}m_{\alpha}m_{\beta}(\chi^{\alpha}, \chi^{\beta})=\sum_{\alpha,\beta}m_{\alpha}m_{\beta}n\delta_{\alpha\beta}=n\sum_{\alpha}m_{\alpha}^2\;
(16.62)

Na podstawie obliczeń przeprowadzonych w punkcie (16.62) kwadrat charakteru reprezentacji przywiedlnej dla określonego "a" jest równy sumie kwadratów współczynników mα, który to wskazuje na ilość powtarzającej się danej reprezentacji nieprzywiedlnej w rozkładzie reprezentacji przywiedlnej na sumą prostą reprezentacji nieprzywiedlnych, pomnożone przez liczbę n. Na podstawie tychże rozważań dochodzimy, że jeśli dana reprezentacja jest przywiedlna, to kwadrat skalarny jej charakteru jest większy niż n.

[edytuj] Charaktery grup przemiennych i jego reprezentacje

Przykładami grup przemiennych są to obroty wokół pewnej osi i translację przestrzenne. Reprezentacje takich grup są reprezentacjami przemiennymi, które ta przemienność jest napisana przez poniższą równość:

D(a)D(b)=D(ab)=D(ba)=D(b)D(a)\;
(16.63)

Na podstawie twierdzenia udowodnionego w rozdziale Właściwości komutacyjne dla reprezentacji nieprzywiedlnej i z wniosku (16.63) możemy wnioskować, że wszystkie operatory reprezentacji nieprzywiedlnych są operatorami jednostkowymi pomnożonej przez pewną stałą λ, znaczy to, że wszystkie podprzestrzenie niezmiennicze są to przestrzenie jednowymiarowe, jeśli będziemy rozpatrywać reprezentację unitarne, możemy wtedy tą stałą napisać:

\lambda=e^{i\alpha}\;
(16.64)

Gdy mamy doczynienia z translakcjami, to parametr α jest iloczynem liczby k i translacji x, czyli α=kx, zatem nasz charakter naszej reprezentacji przesunięcia dla reprezentacji nieprzywiedlnych piszemy wedle sposobu:

\chi^k(x)=e^{ikx}\;
(16.65)

Dla grup obrotów Cn liczba α jest tak zdefiniowana by była wielokrotnością liczby 2π/n, w takim przypadku parametr α definiujemy wzorem:

\alpha={{2\pi}\over{n}}m\mbox{  (m=0,1,2,3,.,,n-1)}\;
(16.66)

Oczywiste jest, że taki wybór parametru α (16.66) zapewnia jednoznaczność dla obrotu o kąt pełny. Ale w obrębie jednej reprezentacji możemy dokonywać obroty będące krotnością l-tą kąta 2π/n, w takim przypadku charakterem m-tym nazywamy liczbę przestawioną:

\chi^{m}(l)=e^{i2\pi lm/n}\mbox{  (l,m=01,2,3,..,n-1)}\;
(16.67)

Jeśli mamy grupę C, dopuszczalne są obroty o dowolny kąt, wtedy charakter danej reprezentacji nieprzywiedlnych piszemy przez:

\chi^m(\phi)=e^{im\phi} \mbox{ (}m\in C\mbox{)}\;
(16.68)

Ostatni wzór jest wzorem do reprezentacji grup obrotów sfery. Wzór (16.67) przechodzi we wzór (16.68), gdy m/n zastąpimy liczbą rzeczywistą.

[edytuj] Definicja iloczynu reprezentacji

Często w fizyce dwa układy opisujemy różnymi wzorami, np. powłoki elektronowe i jadra, które są opisywane różnymi zmiennymi. Łączna grupa symetrii takiego naszego układu jest iloczynem albo kartezjańskim lub prostym, czyli dwóch symetrii związanych z określanymi podukładami jest napisana:

G=G_1\times G_2=\{(g_1,g_2):g_1\in C_1, g_2\in C_2\}\;
(16.69)

Ten sam zapis stosujemy stosujemy dla każdej reprezentacji naszej rozważanej grupy:

D(g)=D_1(g_1)\times D_2(g_2)\;
(16.70)

Mnożyć oczywiście możemy niekoniecznie różne reprezentacje tej naszej grupy wedle symetrii danego układu. Charakter reprezentacji (16.70) nazywamy iloczynem ogólnie dwóch reprezentacji danych dwóch grup:

\chi(g)=\chi_1(g_1)\chi_2(g_2)\;
(16.70)

[edytuj] Rachunek wariacyjny

Punktem wyjścia rachunku wariacyjnego jest pewien obrany funkcjonał L, którego argumentami są funkcje specyficzne dla danego problemu. Funkcjonał L ma zwykle postać całki oznaczonej po pewnym przedziale dla funkcji podcałkowej zależącego od argumentu x:

L[y]=\int_{a}^{b}F(x,y(x),y^'(x))dx\;
(17.1)

Funkcjonał w rachunku wariacyjnym nie jest zazwyczaj nieliniowy, tzn. spełnia nierówność:

L[py_1+qy_2]\neq pL[y_1]+qL[y_2]\;
(17.2)

Funkcjonał napisanej wedle we wzoru (17.1) nosi nazwę funkcjonału gęstości L i jest ona funkcją nieliniową argumentów. Dla podkreślenia faktów i dla uniknięcia nieporozumień nawias kwadratowy po L jest oznaczeniem, że mamy do czynienia z funkcjonałem, w której to w nawiasie występuje funkcja y, której to szukamy w rachunku wariacyjnym.

[edytuj] Wariacje funkcji i funkcjonału

Wariacja funkcjonału funkcji y będziemy umownie oznaczać przez δy i nazywamy tą wielkość jako różnicę funkcji y1 i funkcji y, to oznaczamy matematycznie:

\delta y=y_1-y\;
(17.3)

Zwykle rozumiemy, że wariacja jest mardzo mała, rozumiemy to, że maksymalna wartość (17.3) modułu z wielkości (17.3) przyjmuje bardzo małą wartość i jest o wiele mniejsza niż jeden, co piszemy:

||\delta y||=\operatorname{max}|y_1(x)-y(x)|<<1\;
(17.4)

Wariację funkcjonału L, czyli δy definiujemy podobnie jak w przypadku różniczki funkcji df wedle sposobu:

L[y+\delta y]-L[y]=\delta L[y,\delta y]+0(\delta y)\;
(17.5)

Ostatni człon oznacza resztę, która jest małą wielkością wyższego rzędu, ze względu na przyrost funkcji y

[edytuj] Ekstremum funkcjonału

Funkcjonał uzyskuje minimum dla funkcji yo, jeśli funkcjonał funkcji y, czyli L[y] jest większy niż funkcjonał funkcji dla naszej wspomnianej funkcji yo, czyli L[yo]:

L[y]\geq L[y_o]\;
(17.6)

Analogicznie również definiujemy maksimum naszego badanego tutaj funkcjonału. Warunkiem koniecznym istnienia funcjonału jest znikanie funkcjonału L dla tutaj funkcji szukanej y, otrzymujemy:

\delta L[y_0,\delta y_0]=0\;
(17.7)

[edytuj] Równanie Eulera-Lagrange'a

Rozpatrzmy, że minimum funcjonału jest napisane dla funkcji yo i dalej weźmy funkcję y, która różni się od funkcji y0 niewiele, zatem funkcję y możemy zapisać jako y=yo+δy Zakładamy, że wariacja jest na końcach, czyli w punktach a i b, jest równa zero, co matematycznie δy(a)=δy(b)=0 na końcach, w których liczymy naszą całkę (17.1), zatem wariacje δy' i δy są o wiele mniejsze kolejno niż funkcje |y'(x)| i |y0(x)|, co matematycznie piszemy je dla x∈(a,b) równaniami:

|\delta y(x)|<<|y_0(x)|\;
(17.8)
|\delta y^'(x)|<<|y^'(x)|\;
(17.9)

Rozwińmy funkcję F w szereg Taylora względem ziennych δy i δy' wokół punktu y i y', wiedząc, że te różniczki są bardzo małe, zatem możemy ograniczyć się do części liniowej naszego rozwinięcia:

F(x,y,y^')=F(x,y_0,y_0^')+{{\partial F}\over{\partial y}}\delta y+{{\partial F}\over{\partial y^'}}\delta y^'\;
(17.10)

Funkcję (17.10) wstawiamy do funkcjonału określonego w punkcie (17.1) i w drugiej całce dokonujemy całkowania poprzez części względem argumentu x, i zakładając, że wariacja funkcji y jest równa zero w naszych punktach, zatem na podstawie tego:

\delta L=\int_a^b{{\partial F}\over{\partial y}}\delta y+\int_a^b{{\partial F}\over{\partial y^'}}\delta y^'=
\int_a^b{{\partial F}\over{\partial y}}\delta y+\left({{\partial F}\over{\partial y^'}}\right)\delta y(x)\Bigg|^b_a-\int_a^b{{d}\over{dx}}{{\partial F}\over{\partial y^'}}\delta(x)dx\;
(17.11)

Drugi wyraz w przeprowadzonych obliczeniach (17.11) znika na podstawie warunku granicznego na końcach przedziału (a,b), dla której wariacja funkcji y znika. Szukamy taką funkcję y dla której wariacja δ L jest zawsze równa zero, wtedy mamy ekstremum funkcji L dla funkcji y, zatem na podstawie tego możemy napisać:

0=\delta L=\int_a^b\left[{{\partial F}\over{\partial y}}-{{d}\over{dx}}{{\partial F}\over{\partial y^'}}\right]\delta y dx\;
(17.12)

Funkcja podcałkowa w punkcie (17.12) jest zawsze równa zero, dla dowolnie małego δ, zatem w takim przypadku zachodzi równość:

{{\partial F}\over{\partial y}}-{{d}\over{dx}}{{\partial F}\over{\partial y^'}}=0\;
(17.13)

[edytuj] Ekstremum funkcjonału po ustaleniu na wiezów na stawiany układ

Funkcja we funkcjonale L[y] (17.1), w której występuje funkcja F możemy rozszerzyć, gdy nasz badany układ ma pewne więzy, zatem nową funkcję F* tworzymy pisząc to za pomocą mnożników (czynników) Lagrange'a, zatem ta funkcja:

F^*=F+\sum_j\lambda_j\phi_j\;
(17.14)

Mając już nową funkcję (17.14) i aby wyznaczyć funkcję szukaną y, należy podstawić tą wspomnianą funkcję do (17.1) i w ten sposób możemy określić funkcjonał L*, i wtedy dla tak obranego funkcjonału możemy wykorzystać na samym końcu wzór (17.13) wynikająca zerowania się wariacji funkcjonału F*, wtedy to równanie różniczkowe możemy wykorzystać do znalezienia naszej szukanej funkcji y(x).

[edytuj] Transformacja Laplace'a

W wielu zastosowaniach technicznych, a w szczególności w teorii obwodów elektrycznych spotykamy się z transformacjami Laplace'a, które są odpowiednikiem transformacji Fouriera. Funkcje, które stanowią bazę transformacji Laplace'a, które zaczęto je nazywać oryginałami.

[edytuj] Definicja transformaty prostej Laplace'a

Transformatą L[f] oryginału f jest to funkcja zależna od oryginału f(t), która to z kolei zależy od zmiennej "t", którą określamy:

L[f(s)]=\int_0^{\infty}e^{-st}f(t)dt\;
(18.1)

Zwykle transformatę funkcji f, czyli L[f(s)] oznaczamy symbolem _{\tilde{f}(s)}\;.

[edytuj] Przykłady transformat Laplace'a

Tutaj podamy transformaty Laplace'a dla wielu funkcji elementarnych, które możemy wyznaczyć z prostych reguł całkowania z analizy matematycznej.

Lp.
Oryginał f
Transformata \tilde{f}\;
1
1\;
{{1}\over{s}}\;
2
t^a\;
{{\Gamma(a+1)}\over{s^{a+1}}}\mbox{ }(a>-1)\;
3
e^{-\lambda t}\;
{{1}\over{s+\lambda}}\;
4
e^{-\lambda t}t^a\;
{{\Gamma(a+1)}\over{(s+\lambda)^{a+1}}}\;
5
\sin\omega t\;
{{\omega}\over{s^2+\omega^2}}\mbox{ }(\omega>0)\;
6
\cos\omega t\;
{{s}\over{s^2+\omega^2}}\mbox{ }(\omega>0)\;
7
t^n\sin\omega t\;
n!{{\operatorname{Im}(s+i\omega)^{n+1}}\over{(s^2+\omega^2)^{n+1}}}\;
8
t^n\cos\omega t\;
n!{{\operatorname{Im}(s+i\omega)^{n+1}}\over{(s^2+\omega^2)^{n+1}}}\;
9
\sinh\omega t\;
{{\omega}\over{s^2-\omega^2}}\;
10
\cosh\omega t\;
{s\over{s^2-\omega^2}}\;
11
{{e^{-at}}\over{\sqrt{\pi t}}}\;
{{1}\over{\sqrt{s+a}}}\;

[edytuj] Transformacja odwrotna

Jeśli znamy transformatę funkcji \tilde{f}\;, którą wyliczyliśmy dla funkcji f według wzoru (18.1), to funkcję f(t) można wyznaczyć korzystając ze:

f(t)={{1}\over{2\pi i}}\int^{x+i\infty}_{x-i\infty}e^{zt}\tilde{f}(z)dz\;
(18.2)
  • gdzie z=x+iy i dz=idy.

Aby udowodnić wzór (18.2), który omawia przejście z transformaty Laplace'a z funkcji \tilde{f}(z)\; do funkcji f(t), którą to transformatę wyznaczamy z powyższego wzoru, zatem przejdźmy do właściwego etapu dowodu. Do transformaty odwrotnej Laplace'a podstawiamy wzór na jego transformatę prostą Laplace'a i w rezultacie mamy:

\int^{x+i\infty}_{x-i\infty}e^{zt}\tilde{f}(z)dz=i\int_{-\infty}^{\infty}e^{(x+iy)t}dy\int_0^{\infty}e^{-(x+iy)\tau}f(\tau)d\tau=\;

=i\lim_{A\rightarrow\infty}\int_0^{\infty}e^{x(t-\tau)}f(\tau) d\tau\int_{-A}^{A}e^{iy(t-\tau)}dy=\;
=
i\lim_{A\rightarrow\infty}\int_0^{\infty}e^{x(t-\tau)}f(\tau)d\tau\left[{{e^{iA(t-\tau)}-e^{-iA(t-\tau)}}\over{i(t-\tau)}}\right]^A_{-A}=\;
=
i\lim_{A\rightarrow\infty}\int_0^{\infty}e^{x(t-\tau)}f(\tau)d\tau{{2\sin A(t-\tau)}\over{t-\tau}}
=2\pi i\int_0^{\infty}e^{x(t-\tau)}f(\tau)d\tau\lim_{A\rightarrow\infty}{{\sin A(t-\tau)}\over{\pi(t-\tau)}}
(18.3)

Funkcja napisana wewnątrz wzoru (18.3) jest deltą Diraca. którego to określamy:

\delta(t-\tau)=\lim_{A\rightarrow\infty}{{\sin A(t-\tau)}\over{\pi(t-\tau)}}\;
(18.4)

Na podstawie definicji delty Diraca, tym razem przestawionego w punkcie (18.4), która występuje w obliczeniach (18.3), i według właściwości delty Diraca możemy dokończyć te nasze obliczenia:

2\pi i\int_0^{\infty}e^{x(t-\tau)}f(\tau)d\tau\delta(t-\tau)=2\pi i \int_0^{\infty}e^{x(t-\tau)}f(\tau)\delta(t-\tau)d\tau]=2\pi i f(t)\;
(18.5)

Na podstawie obliczeń przestawionych w punkcie (18.5) i (18.4) udowodniliśmy, że transformata odwrotna, która jest przestawiona wzorem (18.2) jest transformatą odwrotną do transformaty prostej zapisaną wzorem (18.1).

[edytuj] Transformata Laplace'a pochodnej

We wzorze (18.1) podstawimy, zamiast funkcji f(t) funkcję f'(t), to całkując tak otrzymany wzór przez części dostajemy obraz:

\int_0^{\infty}e^{-st}f'(t)dt=f(t)e^{-st}\Bigg|_0^{\infty}+s\int_0^{\infty}e^{-st}f^'(t)dt=-f(0)+s\tilde{f}(s)\;
(18.6)

Na podstawie obliczeń przeprowadzonych w punkcie (18.6) transformata pochodnej funkcji f(s) przestawiamy:

\tilde{f}(s)=s\tilde{f}(s)-f(0)\;
(18.7)

Analogicznie wyprowadzamy transformatę drugiej pochodnej, którą to określamy przeprowadzając jednocześnie obliczenia wykorzystując wzór (18.7):

\tilde{f}^{''}(s)=s\tilde{f}^'(s)-f^'(0)=s^2\tilde{f}(s)-sf(0)-f^'(0)\;
(18.7)

[edytuj] Transformata Laplace'a całki z oryginału

Określmy funkcję pierwotną z oryginału, którym jest całka, która dla argumentu t=0 jest równa zero, co wynika z definicji całki:

F(t)=\int_0^{t}f(\tau)d\tau\;
(18.8)

Wyznaczmy transformatę funkcji F(t) określoną wzorem (18.8), zatem te obliczenia możemy przeprowadzić jako:

\int_0^{\infty}e^{-st}F(t)dt=-{{1}\over{s}}e^{-st}F(t)\Bigg|_0^{\infty}+{{1}\over{s}}\int_0^{\infty}e^{-st}F'(t)dt={{1}\over{s}}\int_0^{\infty}e^{-st}f(t)dt={{\tilde{f}(s)}\over{s}}\;
(18.9)

W drugiej równości w obliczeniach (18.9) pierwszy wyraz jest równy zero, bo F(0)=0 i _{\lim_{s\rightarrow\infty}e^{-st}=0}\;. Według przeprowadzonych obliczeń w punkcie (18.9) transformata powyżej całki jest przestawiana:

\tilde{F}(t)={{\tilde{f}(s)}\over{s}}\;
(18.10)

[edytuj] Transformata funkcji przesuniętej

Jeśli transformatą funkcji f(t) jest funkcja L[f(s)]\;, to oczywiste jest, że transformatą funkcji f(t-a) jest funkcja fa(t), którą liczymy:

L[f_a(s)]=\int_0^{\infty}e^{-st}f(t-a)dt=\int_0^{\infty}e^{-s(t-a)-sa}f(t-a)dt=e^{-sa}\int_0^{\infty}e^{-st}f(t)dt=e^{-sa}\tilde{f}(s)\;
(18.11)

[edytuj] Transformata funkcji f(at) dla a>0

Wyznaczamy transformatę funkcji f(at) dokonując podstawienia u=at, by potem policzyć transformatę szukanej funkcji:

L[f(at)]=\int_0^{\infty}e^{-st}f(at)dt={{1}\over{a}}\int_0^{\infty}e^{-{{s}\over{a}}at}f(at)d(at)={{1}\over{a}}\int_0^{\infty}e^{-{{s}\over{a}}u}f(u)d(u)={{1}\over{a}}\tilde{f}\left({{s}\over{a}}\right)\;
(18.12)

[edytuj] Równania różnicowe liniowe

Równania różnicowe, są to pewne związki rekurencyjne, które określają wartość danego wyrazu w sposób niebezpośredni - pośrednio, przez wyrazy go poprzedzające. Mogą to być ciągi: liczbowe, funkcyjne, a nawet i wektorowe. Indeksy mogą być numerowane liczbami naturalnymi lub całkowitymi. W naszych obliczeniach ograniczymy się do zmiennej jednej funkcji jednej zmiennej.

[edytuj] Równania różnicowe liniowe pierwszego rzędu

Równanie różnicowe liniowe, pierwszego rzędu, możemy zapisać równaniem:

y_{n+1}-a_ny_n=b_n\;
(19.1)

Wszystkie współczynniki występujące we wzorze (19.1) są różne od zera, a zakres zmienności zmiennej n jest ograniczony, chociaż nie jest to warunek konieczny. Wprowadźmy nową zmienną, tak określoną:

z_m={{y_m}\over{a_1a_2...a_{m-1}}}\;
(19.2)

Wzór na zmienną ym wyznaczoną ze wzoru (19.2) podstawiamy do równania różnicowego (19.1) i, dzieląc obustronnie tak otrzymane równanie przez a1a2...an, dostajemy schemat:

z_{n+1}a_1a_2..a_{n}-z_na_na_1a_2...a_{n-1}=b_n \quad \Rightarrow \quad z_{n+1}-z_n={{b_n}\over{a_1}a_2...a_n}\Rightarrow \;
\Rightarrow z_{n+1}-z_n=c_n\mbox{,}\quad  c_n={{b_n}\over{a_1a_2...a_n}}\;
(19.3)

Ogólnym rozwiązaniem zn równania różnicowego wynikającym z końcowego związku (19.3) jest równanie:

z_n=C+c_1+c_2+..+c_{n-1}\;
(19.4)

Z równania (19.4) możemy wyznaczyć ym wynikające z równania (19.2).

Procedura opisana w powyższych punktach jest procedurą uniwersalną, ale zwykle nie trzeba się do niej uciekać, bo wystarczy rozpisać kilka pierwszych wyrazów na ym i stąd wyznaczyć ogólne wyrażenie na ten wyraz.

[edytuj] Równania jednorodne różnicowe rzędu drugiego

Podamy tutaj ogólne równanie różnicowego rzędu drugiego, który często stosowane jest w fizyce, jest to równanie w postaci:

y_{n+2}-ay_{n+1}+by_n=0\;
(19.5)

Rozwiązania tego równania poszukujemy w postaci funkcji potęgowej:

y_m=\lambda^m\qquad m=0,1,2,n,n+1,n+2,..\;
(19.6)

Rozwiązanie (19.6) podstawiamy do równania (19.5), i dzieląc tak otrzymane równanie przez λm, dochodzimy do równania kwadratowego:

\lambda^2-a\lambda+b=0\;
(19.7)

Z równania (19.7) możemy otrzymać parametr λ, który przedstawia się w postaci dwóch wzorów zależnych od stałych a i b występujących w równaniu (19.5):

\lambda_{1,2}={{1}\over{2}}\left(a\pm\sqrt{a^2-4b}\right)\;
(19.8)

Ogólnym rozwiązaniem równania (19.5) jest równanie:

y_n=C_1\lambda_1^n+C_2\lambda_2^n\;
(19.9)

Jesli dwa rozwiązania równania kwadratowego są takie same, czyli λ=λ12, to rozwiązaniem równania różnicowego (19.5) jest:

y_n=(C_1+nC_2)\lambda^n\;
(19.10)

Aby sprawdzić, czy rzeczywiście (19.10) jest rozwiązaniem równania (19.5), gdy wyróżnik trójmianu kwadratowego (19.7) jest równy zero, podstawiamy nasze rozwiązanie do równania różnicowego i po podzieleniu przez λn otrzymujemy:

(C_1+(n+2)C_2)\lambda^2-a(C_1+(n+1) C_2)\lambda+b(C_1+n C_2)=0\Rightarrow\;
\Rightarrow C_1(\lambda^2-a\lambda+b)+C_2[(n+2)\lambda^2-a(n+1)\lambda+bn]=0\Rightarrow\;
\Rightarrow C_1(\lambda^2-a\lambda+b)+C_2n(\lambda^2-a\lambda+b)+C_2\lambda(2\lambda-a)=0\;
(19.11)

Równanie (19.11) jest rozwiązaniem prawdziwym na mocy równania kwadratowego (19.7) i wartości parametru _{\lambda={{1}\over{2}}a}\;, gdy rozwiązaniem tego równania (19.7) są dwa jednakowe pierwiastki.


[edytuj] Funkcje Greena

Wprowadźmy operator \hat{O}\; i pewną funkcję \psi(\underline{x})\;, której argumenty \underline{x}\; są elementami n-wymiarowej przestrzeni. Załóżmy, że \psi(\underline{x})\; jest rozwiązaniem pewnego równania niejednorodnego omawianego operatora, które to równanie możemy przedstawić w postaci:

\hat{O}\psi(\underline{x})=K(\underline{x})\;
(20.1)

Zakładamy, że operator \hat{O}^{-1}\; posiada operator odwrotny. Działając lewostronnie równość (20.1) przez nasz operator odwrotny do \hat{O}\; dostajemy równoważne do poprzedniego równanie:

\psi(\underline{x})=\hat{O}^{-1}K(\underline{x})\;
(20.2)

Jeśli skorzystamy z własności funkcji Diraca, czyli z własności (12.1), to wyrażenie (20.2) możemy zapisać równoważnie w postaci całki po lewej stronie - co wynika z własności delty Diraca:

\psi(\underline{x})=\int K(\underline{x}^')\hat{O}^{-1}\delta^n(\underline{x}-\underline{x}^')d^n\underline{x}^'\;
(20.3)

Funkcją Greena nazywamy wyrażenie, które jest iloczynem operatorowym odwrotności operatora \hat{O}\; i n-wymiarowej funkcji Diraca, zapisując tę funkcję według schematu:

G(\underline{x},\underline{x}^')=\hat{O}^{-1}\delta^n(\underline{x}^'-\underline{x})\;
(20.4)

Również z funkcji Greena (definicja (20.4)) możemy wyznaczyć n-wymiarową deltę (funkcję) Diraca z definicji funkcji Greena, wtedy jest ona iloczynem operatorowym operatora \hat{O}\; i funkcji Greena, zależną od dwóch n-wymiarowych argumentów:

\hat{O}G(\underline{x},\underline{x}^')=\delta^n(\underline{x}^'-\underline{x})\;
(20.5)

Biorąc wyrażenie (20.3) i korzystając z definicji funkcji Greena (20.4), oraz mając na uwadze, że funkcja \psi(\underline{x})\; jest szczególnym rozwiązaniem równania niejednorodnego (20.1), wtedy otrzymamy rozwiązanie:

\psi(\underline{x})=\int K(\underline{x}^')G(\underline{x},\underline{x}^')d\underline{x}^'\;
(20.6)

Niech rozwiązaniami równania jednorodnego operatora \hat{O}\; będą funkcje ψ0 spełnające:

\hat{O}\psi_0(\underline{x})=0\;
(20.7)

Rozwiązaniem równania różniczkowego (20.1) jest suma rozwiązania (20.6) i rozwiązania jednorodnego operatora \hat{O}\;(20.6):

\psi(\underline{x})=\psi_0(\underline{x})+\int K(\underline{x}^')G(\underline{x},\underline{x}^')d^n\underline{x}^'\;
(20.8)

Oczywiste jest, że funkcja własna (20.8) jest rozwiązaniem równania (20.1). Udowodnijmy to, korzystając przy tym z własności (20.7), a zatem przejdźmy do właściwego dowodu, wstawiając wyrażenie (20.8) do równości (20.1) do jej lewej strony:

\hat{O}\psi(\underline{x})=\hat{O}\left(\psi_0(\underline{x})+\int K(\underline{x}^')G(\underline{x},\underline{x}^')d^n\underline{x}^'\right)=\;
=\underbrace{\hat{O}\psi_0(\underline{x})}_{=0}+\hat{O}\int K(\underline{x}^')G(\underline{x},\underline{x}^')d^n\underline{x}^'=\hat{O}\int K(\underline{x}^')G(\underline{x},\underline{x}^')d^n\underline{x}^'\;
(20.9)

W (20.9) z korzystamy z definicji funkcji Greena (20.4), wtedy nasze wyrażenie ma się:

\hat{O}\psi(\underline{x})=\hat{O}\int K(\underline{x}^')\hat{O}^{-1}\delta^n(\underline{x}-\underline{x}^')d^n\underline{x}^'=\int K(\underline{x}^')\delta^n(\underline{x}-\underline{x}^')d^n\underline{x}^'=K(\underline{x})\;
(20.10)

Doszliśmy do wniosku (a korzystaliśmy z definicji delty Diraca), że z lewej strony (20.1) dochodzimy do jej prawej strony pomocy obliczeń (20.10), zatem funkcja (20.7) jest rozwiązaniem równania niejednorodnego (20.1).

[edytuj] Problem funkcji Greena dla oscylatora harmonicznego

W problemie oscylatora harmonicznego mamy równanie różniczkowe, a wiedząc że nasz układ drga z częstotliwością ω, możemy to równanie różniczkowe na opisywany ruch przestawić jako:

u^{''}+2\gamma u^'+\omega_0^2u={{F}\over{m}}\;
(20.11)

Operatorem _{\hat{O}}\; nazywamy operator, który przestawiamy na podstawie definicji równania różniczkowego (20.11) dla oscylatora, którego drgania są wymuszane względem siły zewnętrznej F:

\hat{O}={{d^2}\over{dt^2}}+2\gamma{{d}\over{dt}}+\omega_0^2\;
(20.12)

Aby policzyć funkcję Greena należy skorzystać z jej definicji zapisanej w punkcie (20.4) i z definicji wersji całkowej funkcji Diraca (14.39). W takim przypadku możemy napisać funkcję Greena używając definicji operatora \hat{O}\;, uzyskując:

G(t)={{1}\over{2\pi}}\int_{-\infty}^{\infty}{{1}\over{\hat{O}e^{it\omega}}}d\omega={{1}\over{2\pi}}\int_{-\infty}^{\infty}{{e^{-it\omega}d\omega}\over{-\omega^2+2i\gamma\omega+\omega_0^2}}\;
(20.13)

Wyznaczmy bieguny funkcji podcałkowej występującej w całce (20.13) - należy rozwiązać równanie kwadratowe według wiadomości ze szkoły średniej: -ω2+2iγω+ω02=0. W takim przypadku pierwiastki wynoszą:

\omega={{-2i\gamma\pm\sqrt{-4\gamma^2+4\omega_0^2}}\over{-2}}=\pm\sqrt{\omega_0^2-\gamma^2}+i\gamma\;
(20.14)

Wyznaczmy residuum dla pierwszego bieguna występującego ze znakiem plus według definicji residuum (8.34):

\operatorname{Res} f(\omega_{\pm})=\pm e^{-\gamma t}{{e^{\pm i\sqrt{\omega_0^2-\gamma^2}}}\over{2\sqrt{\omega_0^2-\gamma^2}}}\;
(20.15)

Zgodnie z lematem Jordana, w przypadku tak obranego konturu, by znajdował się on na górnej półpłaszczyźnie, tzn. dla takiego t, że mamy G(t)=0, bo na górnej półpłaszczyźnie nie ma biegunów, możemy powiedzieć, że funkcja Greena się zeruje:

G(t)=0\mbox{ }t<0\;
(20.16)

Natomiast dla t>0 możemy obrać w półpłaszczyźnie dolnej taki kontur, by obejmował oba bieguny i był w górnej półpłaszczyźnie, zatem funkcja Greena jest w postaci:

G(t)={{1}\over{2\pi}}(2\pi i){{e^{-\gamma t}}\over{2\sqrt{\omega_0^2-\gamma^2}}}\left(e^{it\sqrt{\omega_0^2-\gamma^2}}-e^{-it\sqrt{\omega_0^2-\gamma^2}}\right)=e^{-\gamma t}{{\sin t \sqrt{\omega_0^2-\gamma^2}}\over{\sqrt{\omega_0^2-\gamma^2}}}\;
(20.17)

Funkcja U(t), która jest rozwiązaniem równania (20.11), daje się zapisać za pomocą funkcji Greena G(t) wedle sposobu:

u(t)=\int_{-\infty}^{\infty}G(t-t^')F(t^')dt^'=\int^t_{-\infty}G(t-t^')F(t^')dt^'\;
(20.18)

Znając funkcję Greena dla oscylatora harmonicznego (20.17) i postać siły, którą mamy zamiar określić, może być to przypadek harmoniczny drgań siły opisanych według funkcji F=F0sin Ω t, to wtedy możemy oczywiście policzyć funkcję u(t) zapisaną wzorem (20.18). Należy zauważyć, że funkcja Greena nic nie upraszcza.

[edytuj] Definicja operatorowej funkcja Greena

Zamiast skalarnej definicji funkcji Greena (20.5) wprowadza się jego definicję operatorową, gdzie zamiast delty Diraca występuje operator jednostkowy, a zamiast funkcji Greena operator _{\hat{G}(t)}\;, zatem definicję operatora Greena piszemy:

(z-\hat{H})\hat{G}(z)=\hat{I}\;
(20.19)

Ze wzoru (20.19) możemy wyznaczyć operator \hat{G}(t)\;, jeśli _{z-\hat{H}}\; posiada operator odwrotny, wtedy ten operator piszemy wedle sposobu zależny od operatora całkowitej energii badanej cząstki:

\hat{G}(z)=(z-\hat{H})^{-1}\;
(20.20)

Operatora definicja na funkcję Greena jest często niepraktyczna, w takim przypadku wprowadza się elementy macierzowe operatora Greena wedle jego definicji operatora Greena (20.19), których definicję jest zależna od elementów macierzowych operatora Diraca:

zG_{\alpha\beta}-\sum_{\gamma}H_{\alpha\gamma}G_{\gamma\beta}=\delta_{\alpha\gamma}\;
(20.21)

Bardzo wygodna jest baza funkcji własnych operatora \hat{H}\;, zatem jego elementy macierzowe piszemy przy pomocy funkcji bazy ortogonalnej φα, które są funkcjami własnymi operatora całkowitej energii badanej cząstki lub układu:

H_{\alpha\beta}=\lambda_{\alpha}\delta_{\alpha\gamma}\;
(20.22)

Wtedy równanie macierzowe (20.21) piszemy wedle rozkładu operatora \hat{H}\; w postaci macierzowej, których przestawienie jest zależne od wartości własnej λα rozważanego operatora energii:

zG_{\alpha\beta}-\sum_{\gamma}\lambda_{\alpha}\delta_{\alpha\gamma}G_{\gamma\beta}=\delta_{\alpha\beta}\Rightarrow
zG_{\alpha\beta}-\lambda_{\alpha}G_{\alpha\beta}=\delta_{\alpha\beta}\Rightarrow G_{\alpha\beta}={{1}\over{z-\lambda_{\alpha}}}\delta_{\alpha\beta}\;
(20.23)

[edytuj] Rachunek zaburzeń dla funkcji Greena

Równanie operatorowego (20.19), który w tym przypadku nie zawsze da się rozwiązać, ma to miejsce, gdy operator \hat{H}\; jest zapisany jako operator różniczkowy, czy to zapisanej w języku operatorów, w takim przypadku dokonuje się rozkładu operatora \hat{H}\; na sumę operatora niezaburzonego i zaburzenia w sposób:

\hat{H}=\hat{H}_0+\hat{V}\;
(20.24)

Napiszmy teraz funkcję na funkcję Greena niezaburzoną \hat{G}_0\; i jej odpowiednik zaburzony \hat{G}\;, w takim przypadku możemy powiedzieć ze zachodzą tożsamości operatorowe na te wielkości:

(z-\hat{H}_0)\hat{G}_0=I\;
(20.25)
(z-\hat{H}_0-\hat{V})\hat{G}=I\;
(20.26)

Mając wzór (20.25), który w równoważny sposób można zapisać, jako _{x-\hat{H}_0=\hat{G}_0^{-1}}\;, które to podstawiamy do równania operatorowego (20.26), w takim przypadku otrzymujemy równość po dokonaniu opisanej operacji:

(\hat{G}_0^{-1}-\hat{V})\hat{G}=\hat{I}\;
(20.27)

Jeśli równanie operatorowe (20.27) pomnożymy przez operator niezaburzonej funkcji Greena\hat{G}_0\;, wyznaczamy stąd funkcję Greena zaburzoną:

\hat{G}=\hat{G}_0+\hat{G}_0\hat{V}\hat{G}\;
(20.28)

Równanie (20.28) możemy rozpisać w równoważny dla niego sposób wyznaczają z niego operator _{\hat{G}}\;, który jest zależny od operatora \vec{G}_0\; i od \hat{V}\;:

\hat{G}-\hat{G}_0\hat{V}\hat{G}=\hat{G}_0\Rightarrow(\hat{I}-\hat{G}_0\hat{V})\hat{G}=\hat{G}_0\Rightarrow\hat{G}=(\hat{I}-\hat{G}_0\hat{V})^{-1}\hat{G}_0\;
(20.29)

Końcową równość (20.29), która jest równaniem Dyssona, która to możemy rozwinąć w szereg i w ten sposób otrzymać tożsamość operatorową na operator Greena dla hamiltonianu niezaburzonego:

\hat{G}=(\hat{I}-\hat{G}_0\hat{V})^{-1}\hat{G}_0=\hat{G}_0+\hat{G}_0\hat{V}\hat{G}_0+\hat{G}_0\hat{V}\hat{G}_0\hat{G}_0+...\;
( 19.30)

Wzór (20.30) jest nazywana wzorem Dyssona, który to dla małej poprawki _{\hat{V}}\; do operatora _{\hat{H}_0}\; przyjmuje postać:

\hat{G}\simeq \hat{G}_0+\hat{G}_0\hat{V}\hat{G}_0\;
(20.31)

[edytuj] Rachunek zaburzeń dla stacjonarnego równania Schrödingera

Równanie Schrödingera zawierający potencjał zaburzony V przestawiamy dla równania własnego zależnego od funkcji własnej i wartości własnej przestawiamy je na w sposób:

(\hat{H}_0+V)\psi=E\psi\;
(20.32)

Nie zmniejszając na ogólności w przypadku równania (20.32) możemy napisać go wprowadzając przy tym parametr ε, który dąży do zera, w takim przypadku wspomniane równanie własne w sposób równoważny zapisujemy je według:

(E+i0-\hat{H}_0)\psi=V\psi \Leftrightarrow\lim_{\epsilon\rightarrow 0}(E+i\epsilon-\hat{H}_0)\psi=V\psi\;
(20.33)

Prawą stronę równości (20.33) możemy potraktować jako niejednorodność, równanie jednorodne zbudowane na podstawie (20.33) ma rozwiązanie ψ0, którego rozwiązaniem szczególnym powyższego równania jest ψ, zatem przy definicji odwrotności operatora \hat{G}_0\;, czyli _{E+i0-\hat{H}=G_0^{-1}}\;(zmienna E+iε jest odpowiednikiem "z" w (20.19)), możemy powiedzieć:

\psi=\psi_0+\hat{G}_0V\psi\;
(20.34)

Co równanie (20.34) można podstawić do równania (20.33) i sprawdzić jego słuszność, co tutaj nie będziemy robili. W równości (20.34) wyznaczamy funkcję ψ0 w zależności od funkcji ψ i operatora \hat{G}\;, z którego na podstawie tego będziemy wyznaczać naszą funkcję własną ψ równania własnego hamiltonianu:

(\hat{I}-\hat{G}_0V)\psi=\psi_0\Rightarrow\psi=(\hat{I}-\hat{G}_0V)^{-1}\psi_0\;
(20.35)

Funkcję jako odwrotności pewnego operatora przestawimy jako nieskończony szereg geometryczny, którą piszemy na podstawie tożsamości (20.35), wtedy on przestawia się:

\psi=\psi_0+\hat{G}_0V\psi+G_0VG_0V\psi_0+...\;
(20.36)

Jeśli przyjmować będziemy funkcję ψ jako małą względem wielkości V, zatem (20.36) piszemy w przybliżonej w postaci, dla które prawa strona zależy od operatora operatora \hat{G}_0\; i od funkcji własnej hamiltonianu niezaburzonego:

\psi\simeq\psi_0+\hat{G}_0V\psi_0\;
(20.37)

Język operatorowy (20.37) w przełożeniu na język funkcyjny zapisujemy jako:

\psi(\vec{r})=\psi_0(\vec{r})+\iiint_{R^3}G_0(\vec{r}-\vec{r}^')V(\vec{r}^')\psi_0(\vec{r}^')d^3\vec{r}^'\;
(20.38)

[edytuj] Związek funkcji gęstości stanów z funkcjami Greena

W układach wielocząstkowych często się stosuje sumowania po wszystkich cząstkach, które to sumowanie często możemy zamienić na całkowanie, co piszemy:

\sum_{\alpha}F(E_{\alpha})\rightarrow\int_0^{\infty}F(E)g(E)dE\;
(20.39)

Powyższe przejście jest możliwe, gdy funkcja F zależy tylko od energii. Wprowadziliśmy tutaj funkcję gęstości stanów, czy inaczej znana jako gęstością spektralną i określa ona liczbę stanów o energiach zbliżonych do E. Przejście od sumowania do całki wykonujemy według definicji definicji delty Diraca zapisanej przy pomocy stanów Eα wedle sposobu:

\sum_{\alpha}F(E_{\alpha})=\sum_{\alpha}\int_{-\infty}^{\infty}F(E)\delta(E-E_{\alpha})dE=\int_{-\infty}^{\infty}F(E)\left\{\sum_{\alpha}\delta(E-E_{\alpha})\right\}dE\;
(20.40)

Porównując wzory (20.39) ze wzorem (20.40), otrzymujemy wzór na funkcję gęstości stanów, która jest zależna od energii stanów, i przestawiana jest jako sumę delt Diraca zapisanej względem energii poszczególnych poziomów (20.42) Eα i jest to sumowanie względem α:

g(E)=\sum_{\alpha}\delta(E-E_{\alpha})\;
(20.41)

Mając wzór (20.23) i za "z" w tym wzorze podstawiamy z=E+i0 i wykorzystując przy tym fakt (12.21), wtedy możemy napisać elementy macierzowe operatora \hat{G}\; z definicji elementów macierzowych:

G_{\alpha\alpha}={{1}\over{E-E_{\alpha}+i0}}={{1}\over{E-E_{\alpha}}}-i\pi\delta(E-E_{\alpha})\;
(20.42)

Zadem ślad elementów macierzowych funkcji Greena wedle wzoru (20.42) przestawiamy jako część rzeczywistą ze zespolonej funkcji elementu macierzowego Gαα z definiowaną w punkcie (20.42):

\operatorname{Im}[\operatorname{Tr}G(E+i0)]=-\pi\sum_{\alpha}\delta(E-E_{\alpha})\Rightarrow 
\sum_{\alpha}\delta(E-E_{\alpha})={{1}\over{\pi}}\operatorname{Im}\left[\operatorname{Tr}G(E+i0)\right]\;
(20.43)

Na podstawie przeprowadzonych obliczeń (20.43) i wzoru na gęstość stanów (20.41), dochodzimy do wniosku, że gęstość stanów jest równa wyrażeniu (20.43) i przedstawiamy go jako:

g(E)={{1}\over{\pi}}\operatorname{Im}\left[\operatorname{Tr}G(E+i0)\right]\;
(20.44)
Osobiste
Przestrzenie nazw

Warianty
Działania
Nawigacja
Drukuj lub eksportuj
Narzędzia