Statystyka matematyczna/Twierdzenie o rozkładzie normalnym wielowymiarowym

Z Wikibooks, biblioteki wolnych podręczników.
Statystyka matematyczna
Statystyka matematyczna
Twierdzenie o rozkładzie normalnym wielowymiarowym

Licencja
Autor: Mirosław Makowiecki
Absolwent UMCS Fizyki Komputerowej Uniwersytetu Marii Curie-Skłodowskiej w Lublinie
Email: miroslaw(kropka)makowiecki(małpa)gmail(kropka)pl
Dotyczy: książki, do której należy ta strona, oraz w niej zawartych stron i w nich podstron, a także w nich kolumn, wraz z zawartościami.
Użytkownika książki, do której należy ta strona, oraz w niej zawartych stron i w nich podstron, a także w nich kolumn, wraz z zawartościami nie zwalnia z odpowiedzialności prawnoautorskiej nieprzeczytanie warunków licencjonowania.
Umowa prawna: Creative Commons: uznanie autorstwa, na tych samych warunkach, z możliwością obowiązywania dodatkowych ograniczeń.
Autor tej książki dołożył wszelką staranność, aby informacje zawarte w książce były poprawne i najwyższej jakości, jednakże nie udzielana jest żadna gwarancja, czy też rękojma. Autor nie jest odpowiedzialny za wykorzystanie informacji zawarte w książce, nawet jeśli wywołaby jakąś szkodę, straty w zyskach, zastoju w prowadzeniu firmy, przedsiębiorstwa lub spółki bądź utraty informacji, niezależnie czy autor (a nawet Wikibooks) został powiadomiony o możliwości wystąpienie szkód. Informacje zawarte w książce mogą być wykorzystane tylko na własną odpowiedzialność.


Twierdzenie o rozkładzie normalnym wielowymiarowym - jest to uogólnienie twierdzenia o rozkładzie normalnym jednej zmiennej. Ono określa, jeśli mamy n-wymiarowy wektor pomiaru: oraz n-wymiarowy wektor wartości dokładnej: , to jaka jest gęstość prawdopodobieństwo uzyskania n-wymiarowego wektora dla pomiarów wokół wartości dokładnej.

Wyprowadzenie twierdzenia o rozkładzie normalnym wielowymiarowym[edytuj]

Aby wprowadzić definicję gęstości prawdopodobieństwa uzyskania n wektorów, które symbolizują pomiary uzyskane w wyniku doświadczenia, a każde taki wektor z n jest m wymiarowy, które przedstawiają m pomiarów, różnych wielkości fizycznych uzyskanych jednocześnie. Każde takie m wielkości posiadają m wartości dokładnych. Mając wzór (12.7), w nim można logarytm naturalny z liczby trafień w m-wymiarowy punkt przedstawić jako funkcję "g" z minusem, którego argumentem jest m-wymiarowy wektor przedstawiający n jednoczesnych pomiarów różnych wielkości fizycznych, dzięki której chcemy wyznaczyć m wartości dokładnych jednocześnie:

(13.1)
  • gdzie m pomiarów jednoczesnych różnych wielkości fizycznych i m wartości dokładnych przedstawiamy:
(13.2)
(13.3)

Rozwińmy funkcję , którego argumentem jest m jednoczesnych pomiarów pomiarów i m wartości dokładnych, w szereg Taylora względem względem m wartości dokładnych, które są zapisane w postaci wektora (13.3) pomijając wyrazy trzeciego rzędu i wyższych w tym rozważanym szeregu:

(13.4)

Zbudujmy macierze B i A występujące w przedstawieniu przybliżonych funkcji g , czyli według (13.4), gdzie macierz A jest wektorem poziomym pierwszych pochodnych cząstkowych względem wartości m pomiarów jednoczesnych xi, a macierz B jest macierzą drugich pochodnych cząstkowych tej samej funkcji co poprzednio względem tych samych pomiarów:

(13.5)
(13.6)

Na podstawie przedstawienia macierz A (13.5) i macierzy B (13.6) i definicji wektora m jednoczesnych pomiarów (13.3) i definicji wektora m wartości dokładnych tychże wspomnianych pomiarów (13.3), funkcję g możemy napisać w sposób przybliżony wedle schematu:

(13.7)

Wedle wzoru (13.1) i przedstawienia funkcji g w szereg Taylora, który wektorowo zapisujemy wedle schematu (13.7), zatem na podstawie wzoru (12.8) dla n pomiarów m wartości prawdopodobieństwo tego zdarzenia zapisujemy wedle:

(13.8)

Prawdpodobieństwo uzyskania n pomiarów m różnych wielkości fizycznych (13.8) powinno mieć największe prawdopodobieństwo, gdy we wspomnianym wzorze podstawimy, za każdy pomiar z n doświadczeń podstawimy jego wartość dokładną, w tym celu należy policzyć pierwszą pochodną względem jednego pomiaru z "n" m-wymiarowego wektora jednoczesnych pomiarów, który po dokonaniu wspomnianego podstawienia funkcją prawdopodobieństwa powinna przyjmować wartość ekstremalną, zatem dochodzimy do wniosku, że ta pierwsza pochodna powinna przyjmować wartość zero:

(13.9)

Pierwsza pochodna (13.9) musi przyjmować wartość zerową, gdy za m-wymiarowe wyniki pomiarów podstawimy jego wartości dokładne, zatem na podstawie tychże rozważań dostajemy we wspomnianym wzorze, że wektor poziomy A przyjmuje wartość zero w punkcie . Wedle tychże rozważań prawdopodobieństwo uzyskania n m-wymiarowych pomiarów jest wyrażone przez:

(13.10)

Dla pojedynczego pomiaru rozkład normalny prawdopodobieństwo uzyskania wektora jednoczesnych pomiarów, przy skorzystaniu ze wzoru (13.10), który mówi coś o uzyskaniu m pomiarów jednoczesnych różnych wartości pomiarów, jest pisana:

(13.11)

Na podstawie (13.1) i (13.7) wzór (13.11) po podstawieniu za A wektora zerowego na podstawie powyższych rozważań przedstawia liczbę tych samych wektorów wyników pomiarowych z n niejednoczesnych pomiarów wektora wyników pomiarowych podzielonych przez n. Powyższy wzór jest spełniony, gdy mamy l poziomów, w którym te m-wymiarowe pomiary mogą posiadać składowe o pewnych wartościach. Gdy mamy m-wymiarową zmienne losowe ciągłe, to w tym przypadku gęstość prawdopodobieństwa jest opisywana tym samym wzorem co w przypadku dyskretnym, czyli równaniem (13.11).

Wyznaczenie elementów macierzy B, wartość dokładna a wartość oczekiwana[edytuj]

Macierz (13.6) na podstawie przemienności różniczkowania jest macierzą przemienną względem dowolnego punktu, w którym ta macierz jest obliczona, zatem na podstawie tego można powiedzieć:

(13.12)

Dowód równości wartości oczekiwanej i dokładnej[edytuj]

Następnym krokiem jest policzenie wartości oczekiwanej funkcji wektorowej , względem funkcji gęstości prawdopodobieństwa przy m-wymiarowej przestrzeni. Funkcja gęstości prawdopodobieństwa (13.11) jest funkcją parzystą względem argumentu , to wartość średnia względem wspomnianej funkcji jest równa zero ze względu na jej nieparzystość, co poniżej wykorzystano tą własność:

(13.13)

Na podstawie powyższych rozważań, które zawierają obliczenia (13.13), dochodzimy do wniosku, że m-wymiarowy wektor jest wartością oczekiwaną zmiennej , bo jedynkowy moment μ1 jest równy zero, tak jak powinno zachodzić zawsze dla tego obiektu statystycznego.

Definicja macierzy B poprzez macierz kowariancji[edytuj]

Korzystając z definicji funkcji prawdopodobieństwa dla pojedynczego m-wymiarowego pomiaru (13.11), to wzór na wartość oczekiwaną (13.13) możemy napisać:

(13.14)

Zróżniczkujmy obie strony równania (13.14) względem wektora wartości dokładnej, która jest wektorem wartości najprawdopodobnych (oczekiwanych) , oczywiste jest, że po tej operacji otrzymujemy bardziej skomplikowaną tożsamość, z którego będziemy wyprowadzać macierz B:


(13.15)

Korzystając z symetryczności macierzy napisanej w punkcie (13.12) i omówionej dlaczego ta jest, to tożsamość napisana wedle (13.15) przyjmuje postać bardziej uproszczoną postać:

(13.16)

Znów korzystamy z definicji funkcji prawdopodobieństwa (13.11) dla pojedynczego pomiaru, zatem możemy wyrazić tożsamość (13.16) w bardziej prostej postaci:

(13.17)

Wykorzystujemy definicję normowania funkcji gęstości prawdopodobieństwa (2.54), która jest zapisana przy pomocy m-wymiarowej całki gęstości prawdopodobieństwa względem infinitezymalnej objętości należącej do tej przestrzeni przy całkowaniu po wszystkich punktach należących do tej przestrzeni:

(13.18)
Korzystajmy ze wzoru na wartość oczekiwaną pewnej funkcji według wzoru (4.21) przy tutaj panującej gęstości funkcji prawdopodobieństwa (13.11), wtedy można wartość oczekiwaną uzyskania m-wymiarowego wektora jednoczesnych pomiarów napisać sposobem:
(13.19)

Wykorzystując tożsamość (13.19) i warunek normowania gęstości funkcji prawdopodobieństwa względem m-wymiarowej przestrzeni (13.18), wtedy wyrażenie (13.17) można zapisać wedle równoważnej do poprzedniego wzoru w postaci:

(13.20)

Z końcowego równania wynikowego (13.20) wyznaczmy macierz B, korzystając przy tym z wiadomości o macierzach z algebry:

(13.21)

Widzimy, że macierz B-1 jest macierzą kowariancji zdefiniowanej w punkcie według definicji (4.34) przy jego dowodzie przeprowadzonego powyżej:

(13.22)

Na podstawie tych rozważań końcowych (13.22) macierz B jest odwrotnością macierzy kowariancji C.