Statystyka matematyczna/Centralne twierdzenie graniczne

Statystyka matematyczna

Centralne twierdzenie graniczne

Licencja
Autor: Mirosław Makowiecki Absolwent UMCS Fizyki Komputerowej Uniwersytetu Marii Curie-Skłodowskiej w Lublinie Email: miroslaw(kropka)makowiecki(małpa)gmail(kropka)pl Dotyczy: książki, do której należy ta strona, oraz w niej zawartych stron i w nich podstron, a także w nich kolumn, wraz z zawartościami. Użytkownika książki, do której należy ta strona, oraz w niej zawartych stron i w nich podstron, a także w nich kolumn, wraz z zawartościami nie zwalnia z odpowiedzialności prawnoautorskiej nieprzeczytanie warunków licencjonowania. Umowa prawna: Creative Commons: uznanie autorstwa, na tych samych warunkach, z możliwością obowiązywania dodatkowych ograniczeń. Autor tej książki dołożył wszelką staranność, aby informacje zawarte w książce były poprawne i najwyższej jakości, jednakże nie udzielana jest żadna gwarancja, czy też rękojma. Autor nie jest odpowiedzialny za wykorzystanie informacji zawarte w książce, nawet jeśli wywołaby jakąś szkodę, straty w zyskach, zastoju w prowadzeniu firmy, przedsiębiorstwa lub spółki bądź utraty informacji, niezależnie czy autor (a nawet Wikibooks) został powiadomiony o możliwości wystąpienie szkód. Informacje zawarte w książce mogą być wykorzystane tylko na własną odpowiedzialność.

Wykaz modułów w książce
1Średnie w matematyce statystycznej 2Wprowadzenie do rozkładów zmiennych losowych 3Momenty statystyczne ciągłe i dyskretne 4Momenty statystyczne dla funkcji złożonej 5Momenty statystyczne w działaniu 6Pobieranie próby 7Metoda największej wiarygodności 8Funkcje charakterystyczne 9Ważniejsze rozkłady statystyczne 10Twierdzenie o rozkładzie Bernoulliego 11Twierdzenie o rozkładzie wielomianowym 12Twierdzenie o rozkładzie normalnym jednowymiarowym 13Twierdzenie o rozkładzie normalnym wielowymiarowym 14Centralne twierdzenie graniczne 15Twierdzenie o rozkładzie χ² 16Twierdzenie o rozkładzie hipergeometrycznym 17Twierdzenie o rozkładzie Poissona 18Błędy pomiarowe w fizyce 19Metoda najmniejszych kwadratów

Spis treści
1Dowód twierdzenia "Centralne twierdzenie graniczne" 2Rozkład statystyczny sumy wyników pomiarów 3Funkcja charakterystyczna a "Centralne twierdzenie graniczne"

Następny rozdział: Twierdzenie o rozkładzie χ². Poprzedni rozdział: Twierdzenie o rozkładzie normalnym wielowymiarowym.

Podręcznik: Statystyka matematyczna.

Centralne twierdzenie graniczne - gdy wykonamy n → ∞ czyli nieskończenie wiele pomiarów, a w praktyce bardzo dużą liczbę pomiarów, tzn. Ω>>1, to rozkład statystyczny przechodzi w rozkład normalny. Tutaj liczbą stopni swobody jest ilość doświadczeń przeprowadzonych na obiekcie S. Wiemy jednak, że poszczególne wyniki doświadczalne podlegają rozkładowi normalnemu, ale czy ich średnie arytmetyczne również, tego nie wiadomo. Poniżej przedstawimy, że jednak tak jest, że rozkład dotyczący rozkładu średniej arytmetycznej jest również rozkładem normalnym.

Jeśli jest spełnione to twierdzenie, uzasadnione jest stosowanie dla dużej liczby pomiarów rozkładu normalnego napisanej jako rozkład średniej arytmetycznej lub jako rozkład sumy wszystkich pomiarów, ponieważ mimo, że liczba tych pomiarów nie jest naprawdę nieskończenie duża, to twierdzenie jest w miarę dobrze spełnione, przy tych ograniczonych warunkach.

Dowód twierdzenia "Centralne twierdzenie graniczne"

W n-próbach prawdopodobieństwo uzyskania tych samych średnich arytmetycznych ${\overline {x}}_{i}={\overline {x}}\;$ jest przedstawiona w podobny sposób jak rozkład wyników pomiarów w próbie, czyli według (12.34), co na tej podstawie możemy uzyskać prawdopodobieństwo uzyskania wartości średnich arytmetycznych w próbach:

P_{0}({\overline {x}})=Fe^{-{{Dn} \over {2}}({\overline {x}}-x_{0})^{2}}\;

(14.1)

Jak udowodniliśmy w punkcie (14.1), że rozkład tych samych średnich arytmetycznych w próbach podlega pewnemu rozkładowi, a więc w próbach uzyskanie tych średnich podlega ciągłemu rozkładowi normalnemu w przypadku quasiciągłym podstawiając definicję (12.35) na $Dn\;$ jest przedstawiona w sposób:

\rho _{0}({\overline {x}})=F_{0}e^{-{{({\overline {x}}-x_{0})^{2}} \over {2\sigma ^{2}({\overline {x}})}}}\;

(14.2)

Naszym krokiem jest znormalizowanie funkcji gęstości prawdopodobieństwa (14.2) średniej arytmetycznej, zatem dochodzimy do wniosku, że stała F₀ jest napisana wzorem poniżej tak jak w punkcie (12.30), ale w tym przypadku odchylenie standardowe jest odchyleniem standardowym średniej arytmetycznej.

F_{0}={{1} \over {{\sqrt {2\pi }}\sigma ({\overline {x}})}}\;

(14.3)

Zatem nasz rozkład statystyczny średniej arytmetycznej (14.2) przy wykorzystaniu warunku (14.3) jest pisany:

\rho _{0}({\overline {x}})={{1} \over {{\sqrt {2\pi }}\sigma ({\overline {x}})}}e^{-{{({\overline {x}}-x_{0})^{2}} \over {2\sigma ^{2}({\overline {x}})}}}\;

(14.4)

Można również udowodnić, na podstawie tego samego kształtu rozkładu gęstości prawdopodobieństwa średniej arytmetycznej (14.4), co w rozkładzie gęstości prawdopodobieństwa pomiaru (12.31), że wariancja średniej arytmetycznej jest równa $\sigma ^{2}({\overline {x}})\;$ w naszym wyprowadzonym rozkładzie. Rozkład (14.4) jest rozkładem normalnym średniej arytmetycznej wokół wartości dokładnej x₀, co zostało udowodnione nasze powyższe twierdzenie napisane w tym tytule.

Rozkład statystyczny sumy wyników pomiarów

Aby udowodnić, że suma pomiarów podlega rozkładowi normalnemu, należy skorzystać tutaj ze wzoru (14.4) (rozkładu uzyskania średniej arytmetycznej w próbie) i wykorzystać definicję wartości średniej arytmetycznej n pomiarów, zatem wedle:

dP=\rho _{0}({\overline {x}})d{\overline {x}}={{1} \over {{\sqrt {2\pi }}\sigma ({\overline {x}})}}e^{-{{\left({\overline {x}}-x_{0}\right)^{2}} \over {2\sigma ^{2}({\overline {x}})}}}d{\overline {x}}={{\sqrt {n}} \over {{\sqrt {2\pi }}\sigma (x)}}e^{-n{{\left({{\sum _{p=1}^{m}x_{p}} \over {n}}-x_{0}\right)^{2}} \over {2\sigma ^{2}(x)}}}d{\overline {x}}={{\sqrt {n}} \over {{\sqrt {2\pi }}\sigma (x)}}e^{-n{{\left({{\sum _{p=1}^{m}x_{p}-nx_{0}} \over {n}}\right)^{2}} \over {2\sigma ^{2}(x)}}}d{\overline {x}}=\;

={{\sqrt {n}} \over {{\sqrt {2\pi }}\sigma (x)}}e^{-n{{\left(\sum _{p=1}^{m}x_{p}-nx_{0}\right)^{2}} \over {2n^{2}\sigma ^{2}(x)}}}d{\overline {x}}={{1} \over {{\sqrt {2\pi }}\sigma (x)}}e^{-{{\left(\sum _{p=1}^{m}x_{p}-nx_{0}\right)^{2}} \over {2n\sigma ^{2}(x)}}}{{dn{\overline {x}}} \over {\sqrt {n}}}={{1} \over {{\sqrt {2\pi }}\sigma (x){\sqrt {n}}}}e^{-{{\left(\sum _{p=1}^{m}x_{p}-nx_{0}\right)^{2}} \over {2n\sigma ^{2}(x)}}}dn{\overline {x}}\;

(14.5)

Obierzmy zmienną ξ zdefiniowaną jaką sumę pomiarów uzyskanych wyników w doświadczeniu, którego definicja jest poniżej, a także jego wartość dokładną, też zdefiniowaną poniżej:

\xi =\sum _{p=1}^{n}x_{j}=n{\overline {x}}\;\;

(14.6)

\xi _{0}=nx_{0}\;

(14.7)

Następnie w celu wyznaczania wariancji sumy pomiarów (14.6) korzystamy ze wzoru (5.17) przy założeniu, że poszczególne pomiary są niezależne od siebie, zatem ich kowariancja jest równa zera, zatem na podstawie tych rozważań można napisać, że wariancja wyrażenia ξ jest sumą wariancji poszczególnych pomiarów:

\sigma ^{2}(\xi )=\sigma ^{2}(\sum _{p=1}^{n}x_{p})=\sum _{p=1}^{n}\sigma ^{2}(x)=n\sigma ^{2}(x)\Rightarrow \sigma (\xi )={\sqrt {n}}\sigma (x)\;

(14.8)

Zatem nasz rozkład (14.5) po uwzględnieniu (14.6) oraz (14.7), a także wzoru (14.8), przyjmuje postać:

dP={{1} \over {{\sqrt {2\pi }}\sigma (\xi )}}e^{-{{(\xi -\xi _{0})^{2}} \over {2\sigma ^{2}(\xi )}}}d\xi =\rho _{0}(\xi )d\xi \Rightarrow \rho _{0}(\xi )={{1} \over {{\sqrt {2\pi }}\sigma (\xi )}}e^{-{{(\xi -\xi _{0})^{2}} \over {2\sigma ^{2}(\xi )}}}\;

(14.9)

Można udowodnić, że w wyniku normalizacji rozkładu (14.9) gęstość prawdopodobieństwa $\rho (\xi )\;$ całkuje się do jedynki względem $\xi \;$ , a kwadrat odchylenia od wartości średniej całkuje się do $\sigma ^{2}(\xi )\;$ też względem tej samej zmiennej. Udowodniliśmy, że zmienna zdefiniowana wzorem (14.6) ma rozkład normalny z wariacją (14.8), zatem nasz rozważany rozkład jest określony według wzoru (14.9) i jest to rozkład normalny.

Funkcja charakterystyczna a "Centralne twierdzenie graniczne"

Z własności funkcji charakterystycznej wiemy jednak, że jego wartość funkcji charakterystycznej w punkcie t równej zero jest równa jeden, co wynika z (8.11), a pierwsza pochodna jest wyrażona według (8.12) oraz druga pochodna jest wyrażona według (8.13), zatem rozwińmy tą funkcję charakterystyczną w szereg Taylora wedle sposobu:

\phi _{x}(t)=\phi (0)+\phi ^{(1)}(0)t+{{1} \over {2}}\phi ^{(2)}(0)t^{2}+...=1-{{1} \over {2}}\sigma ^{2}(x)t^{2}+...

(14.10)

W prowadźmy nową zmienną zdefiniowaną przy pomocy wyników pomiarów x_i, wartości dokładnej x₀, odchylenia standardowego pojedyńczego wyniku pomiaru σ(x) i względem ilości przeprowadzonych pomiarów, zatem jego definicja jest:

u_{i}={{x_{i}-x_{0}} \over {\sigma (x){\sqrt {n}}}}

(14.11)

Policzmy funkcję charakterystyczną względem nowej zmiennej zdefiniowanej w punkcie (14.11), zatem z oczywistych powodów otrzymujemy:

\phi _{u_{i}}(t)=E\left\{\exp(itu_{i})\right\}=E\left\{\exp \left(it{{x_{i}-x_{0}} \over {\sigma (x){\sqrt {n}}}}\right)\right\}=\phi _{x_{i}}\left({{t} \over {\sigma (x){\sqrt {n}}}}\right)

(14.12)

Skorzystajmy z rozwinięcia funkcji φ_{u_i}(t) w szereg Taylora wedle sposobu (14.10), zatem po tych operacjach dostajemy funkcję charakterystyczną pojedynczego pomiaru x_i:

\phi _{x_{i}}\left({{t} \over {\sigma (x){\sqrt {n}}}}\right)=1-{{1} \over {2}}\sigma ^{2}(x)\left({{t} \over {\sigma (x){\sqrt {n}}}}\right)^{2}+...=1-{{t^{2}} \over {2n}}+...

(14.13)

Z definiujmy inną nową zmienną zależną "u" jako sumę nowych zmiennych losowych (14.12), zatem wtedy dochodzimy do wniosku, że tą zmienną możemy wyznaczyć względem zmiennej sumy "n" pomiarów (14.6), którego wartość dokładna jest (14.7):

u=\lim _{n\rightarrow \infty }\sum _{i=1}^{n}{{x_{i}-x_{0}} \over {\sigma (x){\sqrt {n}}}}=\lim _{n\rightarrow \infty }{{\xi -\xi _{0}} \over {\sigma (x){\sqrt {n}}}}

(14.14)

Funkcja charakterystyczna na podstawie wzoru (14.13) i wedle twierdzenia (8.16) dla n-doświadczeń jest iloczynem n takich wspomnianych funkcji charakterystycznych:

\phi _{u}(t)=\lim _{n\rightarrow \infty }\prod _{i=1}^{n}\phi _{u_{i}}(t)=\lim _{n\rightarrow \infty }\left(\phi _{u_{i}}(t)\right)^{n}=\lim _{n\rightarrow \infty }\left(1-{{t^{2}} \over {2n}}+...\right)^{n}=\lim _{n\rightarrow \infty }\left(1-{{t^{2}} \over {2n}}\right)^{(-2n)(-{{1} \over {2}})}=e^{-{{1} \over {2}}t^{2}}

(14.15)

Funkcja (14.15) jest to funkcja charakterystyczna rozkładu normalnego standardowego (8.24) względem zmiennej (14.14) na podstawie (8.24), który zachodzi dla specyficznych wartości dokładnej i odchylenia standardowego. Rozkład normalny jest napisany:

\rho (u)={{1} \over {\sqrt {2\pi }}}e^{-{{1} \over {2}}u^{2}}={{1} \over {\sqrt {2\pi }}}e^{-{{1} \over {2}}{{(\xi -\xi _{0})^{2}} \over {\sigma ^{2}(x)n}}}={{1} \over {\sqrt {2\pi }}}e^{-{{(\xi -\xi _{0})^{2}} \over {2\sigma ^{2}(\xi )}}}

(14.16)

Wyznaczmy gęstość prawdopodobieństwa względem zmiennej ξ, zatem infinitezymalne prawdopodobieństwo, które jest niezmiennicze ze względu na zmienną, względem której liczymy tę funkcję gęstości prawdopodobieństwa:

dP=\rho (u)du=\rho (u)d{{\xi -\xi _{0}} \over {\sigma (x){\sqrt {n}}}}={{\rho (u)} \over {\sigma (x){\sqrt {n}}}}d\xi ={{\rho (u)} \over {\sigma (\xi )}}d\xi \;

(14.17)

Jeśli skorzystamy ze wzoru (14.17), a także z gęstości prawdopodobieństwa zmiennej u (14.16), to gęstość prawdopodobieństwa, uzyskania zmiennej sumy pomiarów (14.6) wokół wartości dokładnej tej zmiennej (14.7), jest wyrażona:

\rho (\xi )={{\rho (u)} \over {\sigma (\xi )}}={{1} \over {\sqrt {2\pi }}\sigma (\xi )}e^{-{{(\xi -\xi _{0})^{2}} \over {2\sigma ^{2}(\xi )}}}

(14.18)

Można sprawdzić, że funkcja gęstości prawdopodobieństwa (14.18) jest unormowana do jedynki i posiada wariancję σ²(ξ).

Wzór (14.18) jest taki sam jak wzór zapisany w punkcie (14.9), tylko innym sposobem udowodniliśmy, że zmienna (14.6) podlega rozkładowi normalnemu.