Metody matematyczne fizyki/Wprowadzenie do teorii operatorów liniowych

Z Wikibooks, biblioteki wolnych podręczników.
Skocz do: nawigacja, szukaj


Metody matematyczne fizyki
Metody matematyczne fizyki
Autor: Mirosław Makowiecki
Email: miroslaw.makowiecki@gmail.com
Cała książka
Licencja: Creative Commons: uznanie autorstwa

Tutaj tylko podamy wstęp do teorii operatorów liniowych, które są bardzo potrzebne w analizie funkcjonalnej, ale najpierw zapoznamy się z definicją iloczynu skalarnego, ten obiekt powinien spełniać własności :

(f,f)\geq 0\;
(15.1)

Wzór (15.1) mówi nam, jakie warunki powinna spełniać iloczyn skalarny dwóch funkcji skalarnych lub wektorowych ale ogólnie zespolonych, jeśli ten iloczyn jest równy zero, to możemy dojść do wniosku, że funkcja f jest równa zero. Następnym bardzo ważnym postulatem jest, że zamienienie dwóch funkcji miejscami w iloczynie skalarnym, to ten nowy wynik jest sprzężonym zespolono z starym wynikiem przed przestawieniem, w takim przypadku drugi postulat:

(f,g)=\overline{(g,f)}\;
(15.2)

Ostatnim warunkiem jest liniowość, że względu na drugi czynnik w tymże obiekcie, co zapisujemy jako:

(f,ag+bh)=(a(f,g)+b(f,h)\;
(15.3)

Jeśli zastosujemy wzór na liniowość drugiego czynnika (15.3) i postulat (15.2), wtedy dostajemy, że istnieje anty-liniowość ze względu na pierwszy czynnik, co obrazujemy:

(af+bh,g)=\overline{a}(f,g)+\overline{b}(h,g)\;
(15.4)

Gdy mamy iloczyn skalarny dwóch wektorów w przestrzeni kartezjańskiej, to definicja takiego iloczynu jest napisana przez definicję poszczególnych składowych:

(A,B)=A_xB_x+A_yB_y+A_zB_z\;
(15.5)

W przestrzeni funkcyjnej często przyjmuje się jako definicję iloczynu skalarnego dla dwóch funkcji zapisanych w przestrzeni zespolonej:

(f,g)=\int_a^b\overline{f(x)}g(x)dx\;
(15.6)

Kwadrat normy wektora f zapisujemy wedle nastepującej definicji:

||f||^2={(f,f)}\;
(15.7)

Kwadrat definicji normy funkcji f (15.7), wynikającego z definicji iloczynu skalarnego (15.6), określamy dla przestrzeni jednowymiarowej i trójwymiarowej jako normę wektora:

||f||^2=\int^a_b|f(x)|^2dx\;
(15.8)
||f||^2=\int_{R^3}|f(\vec{r})|^2d^3\vec{r}\;
(15.9)

Odległość dwóch funkcji f i g definiujemy:

d(f,g)=||f-g||\;
(15.10)

Przestrzeń nazywamy zupełną, gdy każdy ciąg pewnych funkcji ma granicę w tej omawianej przestrzeni, w której określamy daną funkcję.

Iloczyn operatorowy[edytuj]

Iloczynem dwóch operatorów _{A\cdot B}wnazywamy operację, której najpierw operator B działa na funkcję w, a potem w ten sposób otrzymanego obiektu wsadzamy do działania operatora A, co ten wynik zapisujmy:

(AB)w=A(Bw)\;
(15.11)

Jeśli n-ta potęga operatora A działa na funkcję w, wtedy jego działanie jest w postaci:

A^nw=A(A...(A(Aw))...)\;
(15.12)

Funkcja, w której argumentem jest pewien operator[edytuj]

Załóżmy, że mamy pewną funkcję, w której argumentem nie jest pewna liczba, tylko pewnego rodzaju operator. Przykładem takiej funkcji, w której występuje pewien operator:

f(\hat{A})={{1}\over{1-\hat{A}}}\;
(15.13)

Ponieważ jest to funkcja gładka, możemy rozpatrzyć szereg Taylora

f(\hat{A})=f(0)\hat{1}+f^{'}(0)\hat{A}+{{1}\over{2!}}f^{''}(0)\hat{A}^2+...\;
(15.14)

Zbieżność szeregu (15.14) nie jest automatyczna, aby był szeregiem zbieżnym należy określić normę naszego operatora _{\hat{A}}\; należy napisać:

||A||=\operatorname{sup}||\hat{A}f||\mbox{, gdy zachodzi }||f||=1\;
(15.15)

Funkcję (15.14) możemy liczyć wedle sposobu poniżej, tak się to dzieje, gdy dokonamy rozwinięcia funkcji f(x)=(1-x)-1 w szereg Taylora i do tego operatora wstawiamy operator \hat{A}\;, zatem na podstawie tychże rozważań możemy powiedzieć:

f(\hat{A})=(1-\hat{A})^{-1}=\hat{1}+\hat{A}+\hat{A}^2+\hat{A}^3+...\;
(15.16)

A eksponens pewnego operatora liczymy podobnie jak w przykładzie (15.16), ale tym razem mamy do czynienia z funkcją , której jest eksonens, której to naszą funkcję eax rozkładamy w szereg Tayllora, a później do niego podstawiamy operator a\hat{A}\;, co możemy pisać:

f(\hat{A})=e^{a\hat{A}}=\hat{I}+a\hat{A}+{{1}\over{2!}}a^2\hat{A}^2+{ {1}\over{3!}}a^3\hat{A}^3+...\;
(15.17)

Wprowadzenie do teorii komutacji i antykomutacji dwóch operatorów[edytuj]

Ogólnie dwa operatory nie są przemiennymi operatorami, tzn. nie zachodzi w ogólności działanie _{\hat{A}\hat{B}=\hat{B}\hat{A}}\;, zatem wprowadźmy definicję komutatora, w których dla dwóch operatorów nazywamy definicję:

[\hat{A},\hat{B}]=\hat{A}\hat{B}-\hat{B}\hat{A}\;
(15.18)

Dla przykładu policzmy komutator określony dla dwóch operatorów, tzn. operatora mnożenia przez liczbę i operatora różniczkowania, którego obliczenia przeprowadzimy poniżej:

\left[x,{{d}\over{dx}}\right]=x{{d}\over{dx}}-{{d}\over{dx}}(x)=x{{d}\over{dx}}-x{{d}\over{dx}}-\hat{1}=\hat{1}\;
(15.19)

Naszym następnym krokiem jest udowodnienie twierdzenia, której przestawienie jest wedle poniższego wzoru:

[\hat{A}\hat{B},\hat{C}]=\hat{A}[\hat{B},\hat{C}]+[\hat{A},\hat{C}]\hat{B}\;
(15.20)

Dowód tożsamości (15.20) przestawimy wedle toku obliczeń poniżej, z którego to udowodnimy, że wychodząc z prawej strony obliczeń wspomnianego wzoru przechodzimy do jego lewej strony:

\hat{A}[\hat{B},\hat{C}]+[\hat{A},\hat{C}]\hat{B}=\hat{A}\hat{B}\hat{C}-\hat{A}\hat{C}\hat{B}+\hat{A}\hat{C}\hat{B}-\hat{C}\hat{A}\hat{B}=\hat{A}\hat{B}\hat{C}-\hat{C}\hat{A}\hat{B}=[\hat{A}\hat{B},\hat{C}]\;
(15.21)

Definicja operatora sprzężonego[edytuj]

Operatorem sprzężonym _{\hat{A}^*}\;do operatora _{\hat{A}}\; nazywamy taki operator, którego definicja jest przestawiana przy pomocy pewnych wektorów u i v, w takim razie:

(\hat{A}u,v)=(u,\hat{A}^*v)\;
(15.22)

Następnym krokiem bardzo znanym fizyce, gdy operator _{\hat{A}}\; jest pewną macierzą, a u i v są pewnego rodzaju wektorami pionowymi, jest:

(\hat{A}u,v)=\sum_{i,j=1}^n\overline{A}_{ij}\hat{u}_iv_j=\sum_{i,j=1}^n\overline{u}_j\overline{A}^T_{ji}v_i=(u,\overline{A}^Tv)\;
(15.23)

Z obliczeń przeprowadzonych w punkcie (15.23) możemy napisać wniosek:

\hat{A}^*=\overline{\hat{A}}^T\;
(15.24)

Iloczyn operatora i pewnego parametru i jego sprzężenie[edytuj]

Wykorzystując definicję operatora sprzężonego (15.24) możemy obliczyć wyrażenie (\lambda\hat{A}u,v)\;dwoma różnymi sposobami, by potem można by je przyrównać łatwo:

(\lambda\hat{A}u,v)=(u,(\lambda\hat{A})^*v)\;
(15.25)
(\lambda\hat{A}u,v)=\overline{\lambda}(\hat{A}u,v)=\overline{\lambda}(u,\hat{A}v)=(u,\overline{\lambda}\hat{A}v)\;
(15.26)

Możemy przyrównać oba powyższe wzory do siebie, bo one oznaczają to samo, stąd wniosek:

(\lambda\hat{A})^*=\overline{\lambda}\hat{A}^*\;
(15.27)

Definicja operatora hermitowskiego, czyli operatora samo-sprzężonego[edytuj]

Operatorem samosprzężonym do operatora \hat{A}\;nazywamy taki operator, który jest równy samemu opisywanemu operatorowi:

\hat{A}^*=\hat{A}\;
(15.28)

Gdy dany operatorem jest zwykłą macierzą, to warunek (15.24) piszemy:

\overline{\hat{A}}^T=\hat{A}\;
(15.29)

Definicja operatora odwrotnego[edytuj]

Definicją operatora odwrotnego _{\hat{A}^{-1}}\;do operatora _{\hat{A}}\; nazywamy taki operator spełniający warunek:

\hat{A}\hat{A}^{-1}=\hat{A}^{-1}\hat{A}=\hat{I}\;
(15.30)

Jeśli operator _{\hat{A}}\; jest zwykłą macierzą, to operator odwrotny tegoż operatora (tutaj macierzy) nazywamy macierzą odwrotną znaną z klasycznego kursu algebry.

Definicja operatora unitarnego[edytuj]

Operatorem unitarnym \hat{A}\; nazywamy takim operatorem, który po prowadzeniu do iloczynu skalarnego nie zmienia długości norm, wtedy jego definicja jest:

(\hat{A}w,\hat{A}v)=(w,v)\;
(15.31)

Jeśli wykorzystamy definicję operatora sprzężonego unitarnego określona wedle wzoru (15.22), wtedy wzór (15.31) możemy zapisać:

(\hat{A}w,\hat{A}\hat{v})=(w,\hat{A}^*\hat{A}v)\;
(15.32)

Ze wzoru (15.31) i (15.32) wynika, że operator sprzężony od \hat{a}\; jest równy operatorowi odwrotnemu, co przestawiamy:

\hat{A}^*=\hat{A}^{-1}\;
(15.33)

Elementy macierzowe operatora[edytuj]

Załóżmy, że mamy bazę ortogonalną zdefiniowanej wedle określenia ei, w takim przypadku elementami macierzowymi operatora w naszej bazie nazywamy elementy:

A_{ij}=(e_i,\hat{A}e_j)\;
(15.34)

Transformacją wektorów bazy z jednego układu współrzędnych do drugiego przy określeniu, przy definicji operatora \hat{U}\;, określamy jako:

e_j^'=\sum_iU_{ij} e_i\Rightarrow B^'=\hat{U}^T\hat{B}\;
(15.35)

A dowód unitarności operatora \hat{U}\; przeprowadzamy w sposób :

I=(B^',B^')=(\hat{U}^TB,\hat{U}^TB)=(B,(\hat{U}^*)^T\hat{U}^TB)\;
(15.36)

Na podstawie obliczeń przeprowadzonych w punkcie (15.36) możemy napisać, że operator sprzężony, który mówi coś o przejściu z jednego układu do drugiego jest równy operatorowi odwrotnemu do \hat{U}\;, co zapisujemy:

\hat{U}^*=\hat{U}^{-1}\;
(15.37)

Określmy elementy macierzowe operatora _{\hat{A}}\; w nowej bazie względem elementów tego samego operatora w starej bazie:

A_{mn}^'=(e_m^',\hat{A}e_n^')=\sum_{i,j}\overline{U}_{im}U_{jn}(e_i,\hat{A}e_j)=\sum_{i,j}\overline{U}_{im}U_{jn}A_{ij}=\sum_{i,j}\overline{U}_{mi}^TU_{jm}A_{ij}\;
(15.38)

Na podstawie przeprowadzonych obliczeń w punkcie (15.38) możemy powiedzieć, że transformacja operatora z jednego układu współrzędnych do drugiego i po jego odwróceniu, określamy:

\hat{A}^'=\hat{U}^+\hat{A}\hat{U}\;
(15.39)
\hat{A}=\hat{U}\hat{A}^'\hat{U}^{-1}\;
(15.40)

Definicja śladu operatora[edytuj]

Śladem operatora \hat{A}\; nazywamy taką liczbą, która jest sumą jego elementów diagonalnych elementów macierzowych operatora:

\operatorname{Tr}\hat{A}=\sum_i\hat{A}_{ii}\;
(15.41)

Wykażemy, że ślad operatora \hat{A}\; jest niezmienny od wyboru bazy, w której liczymy elementy macierzowe naszego operatora, możemy to stwierdzenie udowodnić:

\operatorname{Tr}\hat{A}^'=\sum_{m}A^'_{mm}=\sum_{i}\overline{U}^T_{ij}A_{jk}U_{ki}=\sum_{i}U_{ki}\overline{U}^{T}_{ij}A_{jk}=\sum_i\delta_{kj}A_{jk}=\sum_jA_{jj}=\operatorname{Tr}\hat{A}\;
(15.42)

Równanie własne, wektory i wartości własne operatora[edytuj]

Równaniem własnym operatora \hat{A}\; przy oznaczeniach dla wartości własnych λ i wektorów własnych u nazywamy obiekt:

\hat{A}u=\lambda u\;
(15.43)

Operatory hermitowskie w zagadnieniu własnym[edytuj]

  • Wartości własne operatora hermitowskiego mając wartości własne rzeczywiste, co możemy udowodnić pisząc dowód tej własności wedle sposobu:
\lambda=(u,\lambda u)=(u,\hat{A}u)=(\hat{A}^*u,u)=(\hat{A}u,u)=(\lambda u,u)=\overline{\lambda}\;
(15.44)

Wedle dowodu przeprowadzone w punkcie (15.44) udowodniliśmy tezę naszego twierdzenia.

  • Wektory własne są do siebie ortogonalne równania własnego (15.44) dla operatora \hat{A}\;, wtedy napiszmy dwa równania własne dla różnych wartości własnych naszego tutaj rozważanego operatora.
\hat{A}u_1=\lambda_1u\;
(15.45)
\hat{A}u_2=\lambda_2u\;
(15.46)

Równanie (15.41) mnożymy przez u_2^*; lewostronnie, a zaś równanie (15.42) mnożymy przez u_1\; prawostronnie, w takim razie te operacje zapisujemy:

(u_2,\hat{A}u_1)=\lambda_1(u_2,u_1)\;
(15.47)
(\hat{A}u_2,u_1)=\lambda_2(u_2,u_1)\;
(15.48)

Ponieważ operator \hat{A}\; jest operatorem hermitowskim, i korzystając własności (15.22) możemy powiedzieć, że lewe strony równań (15.47) i (15.48) są sobie równe, wtedy możemy odejmując oba te równania od siebie:

0=(u_2,u_1)(\lambda_1-\lambda_2)\;
(15.49)

Dla różnych wartości własnych równania własnego (15.43) możemy powiedzieć:

(u_2,u_1)=0\;
(15.50)

Warunek (15.51) wskazuje, że wektory własne równania (15.43) są do siebie ortogonalne.

Następny rozdział: Grupy i ich reprezentacje Poprzedni rozdział: Wstęp do transformacji Fouriera

Podręcznik: Metody matematyczne fizyki