Statystyka matematyczna/Centralne twierdzenie graniczne

Statystyka matematyczna
Statystyka matematyczna
Centralne twierdzenie graniczne

Licencja
Autor: Mirosław Makowiecki
Absolwent UMCS Fizyki Komputerowej Uniwersytetu Marii Curie-Skłodowskiej w Lublinie
Email: miroslaw(kropka)makowiecki(małpa)gmail(kropka)pl
Dotyczy: książki, do której należy ta strona, oraz w niej zawartych stron i w nich podstron, a także w nich kolumn, wraz z zawartościami.
Użytkownika książki, do której należy ta strona, oraz w niej zawartych stron i w nich podstron, a także w nich kolumn, wraz z zawartościami nie zwalnia z odpowiedzialności prawnoautorskiej nieprzeczytanie warunków licencjonowania.
Umowa prawna: Creative Commons: uznanie autorstwa, na tych samych warunkach, z możliwością obowiązywania dodatkowych ograniczeń.
Autor tej książki dołożył wszelką staranność, aby informacje zawarte w książce były poprawne i najwyższej jakości, jednakże nie udzielana jest żadna gwarancja, czy też rękojma. Autor nie jest odpowiedzialny za wykorzystanie informacji zawarte w książce, nawet jeśli wywołaby jakąś szkodę, straty w zyskach, zastoju w prowadzeniu firmy, przedsiębiorstwa lub spółki bądź utraty informacji, niezależnie czy autor (a nawet Wikibooks) został powiadomiony o możliwości wystąpienie szkód. Informacje zawarte w książce mogą być wykorzystane tylko na własną odpowiedzialność.


Centralne twierdzenie graniczne - gdy wykonamy n → ∞ czyli nieskończenie wiele pomiarów, a w praktyce bardzo dużą liczbę pomiarów, tzn. Ω>>1, to rozkład statystyczny przechodzi w rozkład normalny. Tutaj liczbą stopni swobody jest ilość doświadczeń przeprowadzonych na obiekcie S. Wiemy jednak, że poszczególne wyniki doświadczalne podlegają rozkładowi normalnemu, ale czy ich średnie arytmetyczne również, tego nie wiadomo. Poniżej przedstawimy, że jednak tak jest, że rozkład dotyczący rozkładu średniej arytmetycznej jest również rozkładem normalnym.

Jeśli jest spełnione to twierdzenie, uzasadnione jest stosowanie dla dużej liczby pomiarów rozkładu normalnego napisanej jako rozkład średniej arytmetycznej lub jako rozkład sumy wszystkich pomiarów, ponieważ mimo, że liczba tych pomiarów nie jest naprawdę nieskończenie duża, to twierdzenie jest w miarę dobrze spełnione, przy tych ograniczonych warunkach.

Dowód twierdzenia "Centralne twierdzenie graniczne"

edytuj

W n-próbach prawdopodobieństwo uzyskania tych samych średnich arytmetycznych jest przedstawiona w podobny sposób jak rozkład wyników pomiarów w próbie, czyli według (12.34), co na tej podstawie możemy uzyskać prawdopodobieństwo uzyskania wartości średnich arytmetycznych w próbach:

(14.1)

Jak udowodniliśmy w punkcie (14.1), że rozkład tych samych średnich arytmetycznych w próbach podlega pewnemu rozkładowi, a więc w próbach uzyskanie tych średnich podlega ciągłemu rozkładowi normalnemu w przypadku quasiciągłym podstawiając definicję (12.35) na jest przedstawiona w sposób:

(14.2)

Naszym krokiem jest znormalizowanie funkcji gęstości prawdopodobieństwa (14.2) średniej arytmetycznej, zatem dochodzimy do wniosku, że stała F0 jest napisana wzorem poniżej tak jak w punkcie (12.30), ale w tym przypadku odchylenie standardowe jest odchyleniem standardowym średniej arytmetycznej.

(14.3)

Zatem nasz rozkład statystyczny średniej arytmetycznej (14.2) przy wykorzystaniu warunku (14.3) jest pisany:

(14.4)

Można również udowodnić, na podstawie tego samego kształtu rozkładu gęstości prawdopodobieństwa średniej arytmetycznej (14.4), co w rozkładzie gęstości prawdopodobieństwa pomiaru (12.31), że wariancja średniej arytmetycznej jest równa w naszym wyprowadzonym rozkładzie. Rozkład (14.4) jest rozkładem normalnym średniej arytmetycznej wokół wartości dokładnej x0, co zostało udowodnione nasze powyższe twierdzenie napisane w tym tytule.

Rozkład statystyczny sumy wyników pomiarów

edytuj

Aby udowodnić, że suma pomiarów podlega rozkładowi normalnemu, należy skorzystać tutaj ze wzoru (14.4) (rozkładu uzyskania średniej arytmetycznej w próbie) i wykorzystać definicję wartości średniej arytmetycznej n pomiarów, zatem wedle:


(14.5)

Obierzmy zmienną ξ zdefiniowaną jaką sumę pomiarów uzyskanych wyników w doświadczeniu, którego definicja jest poniżej, a także jego wartość dokładną, też zdefiniowaną poniżej:

(14.6)
(14.7)

Następnie w celu wyznaczania wariancji sumy pomiarów (14.6) korzystamy ze wzoru (5.17) przy założeniu, że poszczególne pomiary są niezależne od siebie, zatem ich kowariancja jest równa zera, zatem na podstawie tych rozważań można napisać, że wariancja wyrażenia ξ jest sumą wariancji poszczególnych pomiarów:

(14.8)

Zatem nasz rozkład (14.5) po uwzględnieniu (14.6) oraz (14.7), a także wzoru (14.8), przyjmuje postać:

(14.9)

Można udowodnić, że w wyniku normalizacji rozkładu (14.9) gęstość prawdopodobieństwa całkuje się do jedynki względem , a kwadrat odchylenia od wartości średniej całkuje się do też względem tej samej zmiennej. Udowodniliśmy, że zmienna zdefiniowana wzorem (14.6) ma rozkład normalny z wariacją (14.8), zatem nasz rozważany rozkład jest określony według wzoru (14.9) i jest to rozkład normalny.

Funkcja charakterystyczna a "Centralne twierdzenie graniczne"

edytuj

Z własności funkcji charakterystycznej wiemy jednak, że jego wartość funkcji charakterystycznej w punkcie t równej zero jest równa jeden, co wynika z (8.11), a pierwsza pochodna jest wyrażona według (8.12) oraz druga pochodna jest wyrażona według (8.13), zatem rozwińmy tą funkcję charakterystyczną w szereg Taylora wedle sposobu:

(14.10)

W prowadźmy nową zmienną zdefiniowaną przy pomocy wyników pomiarów xi, wartości dokładnej x0, odchylenia standardowego pojedyńczego wyniku pomiaru σ(x) i względem ilości przeprowadzonych pomiarów, zatem jego definicja jest:

(14.11)

Policzmy funkcję charakterystyczną względem nowej zmiennej zdefiniowanej w punkcie (14.11), zatem z oczywistych powodów otrzymujemy:

(14.12)

Skorzystajmy z rozwinięcia funkcji φui(t) w szereg Taylora wedle sposobu (14.10), zatem po tych operacjach dostajemy funkcję charakterystyczną pojedynczego pomiaru xi:

(14.13)

Z definiujmy inną nową zmienną zależną "u" jako sumę nowych zmiennych losowych (14.12), zatem wtedy dochodzimy do wniosku, że tą zmienną możemy wyznaczyć względem zmiennej sumy "n" pomiarów (14.6), którego wartość dokładna jest (14.7):

(14.14)

Funkcja charakterystyczna na podstawie wzoru (14.13) i wedle twierdzenia (8.16) dla n-doświadczeń jest iloczynem n takich wspomnianych funkcji charakterystycznych:

(14.15)

Funkcja (14.15) jest to funkcja charakterystyczna rozkładu normalnego standardowego (8.24) względem zmiennej (14.14) na podstawie (8.24), który zachodzi dla specyficznych wartości dokładnej i odchylenia standardowego. Rozkład normalny jest napisany:

(14.16)

Wyznaczmy gęstość prawdopodobieństwa względem zmiennej ξ, zatem infinitezymalne prawdopodobieństwo, które jest niezmiennicze ze względu na zmienną, względem której liczymy tę funkcję gęstości prawdopodobieństwa:

(14.17)

Jeśli skorzystamy ze wzoru (14.17), a także z gęstości prawdopodobieństwa zmiennej u (14.16), to gęstość prawdopodobieństwa, uzyskania zmiennej sumy pomiarów (14.6) wokół wartości dokładnej tej zmiennej (14.7), jest wyrażona:

(14.18)

Można sprawdzić, że funkcja gęstości prawdopodobieństwa (14.18) jest unormowana do jedynki i posiada wariancję σ2(ξ).

Wzór (14.18) jest taki sam jak wzór zapisany w punkcie (14.9), tylko innym sposobem udowodniliśmy, że zmienna (14.6) podlega rozkładowi normalnemu.