Statystyka matematyczna/Twierdzenie o rozkładzie normalnym wielowymiarowym
Licencja
|
---|
Autor: Mirosław Makowiecki
Absolwent UMCS Fizyki Komputerowej Uniwersytetu Marii Curie-Skłodowskiej w Lublinie Email: miroslaw(kropka)makowiecki(małpa)gmail(kropka)pl Dotyczy: książki, do której należy ta strona, oraz w niej zawartych stron i w nich podstron, a także w nich kolumn, wraz z zawartościami. Użytkownika książki, do której należy ta strona, oraz w niej zawartych stron i w nich podstron, a także w nich kolumn, wraz z zawartościami nie zwalnia z odpowiedzialności prawnoautorskiej nieprzeczytanie warunków licencjonowania. Umowa prawna: Creative Commons: uznanie autorstwa, na tych samych warunkach, z możliwością obowiązywania dodatkowych ograniczeń. Autor tej książki dołożył wszelką staranność, aby informacje zawarte w książce były poprawne i najwyższej jakości, jednakże nie udzielana jest żadna gwarancja, czy też rękojma. Autor nie jest odpowiedzialny za wykorzystanie informacji zawarte w książce, nawet jeśli wywołaby jakąś szkodę, straty w zyskach, zastoju w prowadzeniu firmy, przedsiębiorstwa lub spółki bądź utraty informacji, niezależnie czy autor (a nawet Wikibooks) został powiadomiony o możliwości wystąpienie szkód. Informacje zawarte w książce mogą być wykorzystane tylko na własną odpowiedzialność. |
Podręcznik: Statystyka matematyczna.
Twierdzenie o rozkładzie normalnym wielowymiarowym - jest to uogólnienie twierdzenia o rozkładzie normalnym jednej zmiennej. Ono określa, jeśli mamy n-wymiarowy wektor pomiaru: oraz n-wymiarowy wektor wartości dokładnej: , to jaka jest gęstość prawdopodobieństwo uzyskania n-wymiarowego wektora dla pomiarów wokół wartości dokładnej.
Wyprowadzenie twierdzenia o rozkładzie normalnym wielowymiarowym
edytujAby wprowadzić definicję gęstości prawdopodobieństwa uzyskania n wektorów, które symbolizują pomiary uzyskane w wyniku doświadczenia, a każde taki wektor z n jest m wymiarowy, które przedstawiają m pomiarów, różnych wielkości fizycznych uzyskanych jednocześnie. Każde takie m wielkości posiadają m wartości dokładnych. Mając wzór (12.7), w nim można logarytm naturalny z liczby trafień w m-wymiarowy punkt przedstawić jako funkcję "g" z minusem, którego argumentem jest m-wymiarowy wektor przedstawiający n jednoczesnych pomiarów różnych wielkości fizycznych, dzięki której chcemy wyznaczyć m wartości dokładnych jednocześnie:
- gdzie m pomiarów jednoczesnych różnych wielkości fizycznych i m wartości dokładnych przedstawiamy:
Rozwińmy funkcję , którego argumentem jest m jednoczesnych pomiarów pomiarów i m wartości dokładnych, w szereg Taylora względem względem m wartości dokładnych, które są zapisane w postaci wektora (13.3) pomijając wyrazy trzeciego rzędu i wyższych w tym rozważanym szeregu:
Zbudujmy macierze B i A występujące w przedstawieniu przybliżonych funkcji g , czyli według (13.4), gdzie macierz A jest wektorem poziomym pierwszych pochodnych cząstkowych względem wartości m pomiarów jednoczesnych xi, a macierz B jest macierzą drugich pochodnych cząstkowych tej samej funkcji co poprzednio względem tych samych pomiarów:
Na podstawie przedstawienia macierz A (13.5) i macierzy B (13.6) i definicji wektora m jednoczesnych pomiarów (13.3) i definicji wektora m wartości dokładnych tychże wspomnianych pomiarów (13.3), funkcję g możemy napisać w sposób przybliżony wedle schematu:
Wedle wzoru (13.1) i przedstawienia funkcji g w szereg Taylora, który wektorowo zapisujemy wedle schematu (13.7), zatem na podstawie wzoru (12.8) dla n pomiarów m wartości prawdopodobieństwo tego zdarzenia zapisujemy wedle:
Prawdpodobieństwo uzyskania n pomiarów m różnych wielkości fizycznych (13.8) powinno mieć największe prawdopodobieństwo, gdy we wspomnianym wzorze podstawimy, za każdy pomiar z n doświadczeń podstawimy jego wartość dokładną, w tym celu należy policzyć pierwszą pochodną względem jednego pomiaru z "n" m-wymiarowego wektora jednoczesnych pomiarów, który po dokonaniu wspomnianego podstawienia funkcją prawdopodobieństwa powinna przyjmować wartość ekstremalną, zatem dochodzimy do wniosku, że ta pierwsza pochodna powinna przyjmować wartość zero:
Pierwsza pochodna (13.9) musi przyjmować wartość zerową, gdy za m-wymiarowe wyniki pomiarów podstawimy jego wartości dokładne, zatem na podstawie tychże rozważań dostajemy we wspomnianym wzorze, że wektor poziomy A przyjmuje wartość zero w punkcie . Wedle tychże rozważań prawdopodobieństwo uzyskania n m-wymiarowych pomiarów jest wyrażone przez:
Dla pojedynczego pomiaru rozkład normalny prawdopodobieństwo uzyskania wektora jednoczesnych pomiarów, przy skorzystaniu ze wzoru (13.10), który mówi coś o uzyskaniu m pomiarów jednoczesnych różnych wartości pomiarów, jest pisana:
Na podstawie (13.1) i (13.7) wzór (13.11) po podstawieniu za A wektora zerowego na podstawie powyższych rozważań przedstawia liczbę tych samych wektorów wyników pomiarowych z n niejednoczesnych pomiarów wektora wyników pomiarowych podzielonych przez n. Powyższy wzór jest spełniony, gdy mamy l poziomów, w którym te m-wymiarowe pomiary mogą posiadać składowe o pewnych wartościach. Gdy mamy m-wymiarową zmienne losowe ciągłe, to w tym przypadku gęstość prawdopodobieństwa jest opisywana tym samym wzorem co w przypadku dyskretnym, czyli równaniem (13.11).
Wyznaczenie elementów macierzy B, wartość dokładna a wartość oczekiwana
edytujMacierz (13.6) na podstawie przemienności różniczkowania jest macierzą przemienną względem dowolnego punktu, w którym ta macierz jest obliczona, zatem na podstawie tego można powiedzieć:
Dowód równości wartości oczekiwanej i dokładnej
edytujNastępnym krokiem jest policzenie wartości oczekiwanej funkcji wektorowej , względem funkcji gęstości prawdopodobieństwa przy m-wymiarowej przestrzeni. Funkcja gęstości prawdopodobieństwa (13.11) jest funkcją parzystą względem argumentu , to wartość średnia względem wspomnianej funkcji jest równa zero ze względu na jej nieparzystość, co poniżej wykorzystano tą własność:
Na podstawie powyższych rozważań, które zawierają obliczenia (13.13), dochodzimy do wniosku, że m-wymiarowy wektor jest wartością oczekiwaną zmiennej , bo jedynkowy moment μ1 jest równy zero, tak jak powinno zachodzić zawsze dla tego obiektu statystycznego.
Definicja macierzy B poprzez macierz kowariancji
edytujKorzystając z definicji funkcji prawdopodobieństwa dla pojedynczego m-wymiarowego pomiaru (13.11), to wzór na wartość oczekiwaną (13.13) możemy napisać:
Zróżniczkujmy obie strony równania (13.14) względem wektora wartości dokładnej, która jest wektorem wartości najprawdopodobnych (oczekiwanych) , oczywiste jest, że po tej operacji otrzymujemy bardziej skomplikowaną tożsamość, z którego będziemy wyprowadzać macierz B:
Korzystając z symetryczności macierzy napisanej w punkcie (13.12) i omówionej dlaczego ta jest, to tożsamość napisana wedle (13.15) przyjmuje postać bardziej uproszczoną postać:
Znów korzystamy z definicji funkcji prawdopodobieństwa (13.11) dla pojedynczego pomiaru, zatem możemy wyrazić tożsamość (13.16) w bardziej prostej postaci:
Wykorzystujemy definicję normowania funkcji gęstości prawdopodobieństwa (2.54), która jest zapisana przy pomocy m-wymiarowej całki gęstości prawdopodobieństwa względem infinitezymalnej objętości należącej do tej przestrzeni przy całkowaniu po wszystkich punktach należących do tej przestrzeni:
Wykorzystując tożsamość (13.19) i warunek normowania gęstości funkcji prawdopodobieństwa względem m-wymiarowej przestrzeni (13.18), wtedy wyrażenie (13.17) można zapisać wedle równoważnej do poprzedniego wzoru w postaci:
Z końcowego równania wynikowego (13.20) wyznaczmy macierz B, korzystając przy tym z wiadomości o macierzach z algebry:
Widzimy, że macierz B-1 jest macierzą kowariancji zdefiniowanej w punkcie według definicji (4.34) przy jego dowodzie przeprowadzonego powyżej:
Na podstawie tych rozważań końcowych (13.22) macierz B jest odwrotnością macierzy kowariancji C.