Statystyka matematyczna/Twierdzenie o rozkładzie normalnym jednowymiarowym
Licencja
|
---|
Autor: Mirosław Makowiecki
Absolwent UMCS Fizyki Komputerowej Uniwersytetu Marii Curie-Skłodowskiej w Lublinie Email: miroslaw(kropka)makowiecki(małpa)gmail(kropka)pl Dotyczy: książki, do której należy ta strona, oraz w niej zawartych stron i w nich podstron, a także w nich kolumn, wraz z zawartościami. Użytkownika książki, do której należy ta strona, oraz w niej zawartych stron i w nich podstron, a także w nich kolumn, wraz z zawartościami nie zwalnia z odpowiedzialności prawnoautorskiej nieprzeczytanie warunków licencjonowania. Umowa prawna: Creative Commons: uznanie autorstwa, na tych samych warunkach, z możliwością obowiązywania dodatkowych ograniczeń. Autor tej książki dołożył wszelką staranność, aby informacje zawarte w książce były poprawne i najwyższej jakości, jednakże nie udzielana jest żadna gwarancja, czy też rękojma. Autor nie jest odpowiedzialny za wykorzystanie informacji zawarte w książce, nawet jeśli wywołaby jakąś szkodę, straty w zyskach, zastoju w prowadzeniu firmy, przedsiębiorstwa lub spółki bądź utraty informacji, niezależnie czy autor (a nawet Wikibooks) został powiadomiony o możliwości wystąpienie szkód. Informacje zawarte w książce mogą być wykorzystane tylko na własną odpowiedzialność. |
Podręcznik: Statystyka matematyczna.
Artykuł zawiera wszystkie informacje dotyczące rozkładu normalnego, które są potrzebne do jego wyprowadzenia oraz prostą jego interpretację, a w szczególności interpretację σ oraz punktu przegięcia, kiedy wyniki pomiaru należy odrzucić, a kiedy przyjąć.
Niżej znajdują się wszystkie momenty statystyczne rozkładu normalnego. Należy zaznaczyć, że momenty statystyczne o nieparzystym stopniu są równe zeru, a pozostałe są od niego różne. Można tak interpretować, że rozrzut wyników doświadczalnych wokół wartości najprawdopodobniej x0 jest symetryczny, tzn. ilość wyników pomiarowych przed oraz za x0 jest taka sama, czyli funkcja gęstości prawdopodobieństwa jest funkcją parzystą względem x0, z tego powodu momenty statystyczne nieparzystego stopnia są równe zero, gdyż funkcja podcałkowa jest funkcją nieparzystą w całce symbolizującej moment statystyczny.
Twierdzenie o rozkładzie normalnym – szczególny przypadek twierdzenia o rozkładzie wielomianowym, dający odpowiedź na pytanie jak postępować z danymi doświadczalnymi: czy je odrzucić jako mało prawdopodobne, czy je przyjąć w zależności od danych doświadczalnych uzyskanych z doświadczenia, poprzez uprzednie obliczenie i σ, czyli wartość średnią (arytmetyczną) i średnie odchylenie standardowe. Zasady obliczania tych wskaźników czy σ będziemy tu przyjmować za znane i nie będziemy do tego problemu podchodzić, tylko wyprowadzimy wzory na σ(x) - to jest niepewność standardową pojedynczego wyniku pomiarowego, oraz , to jest niepewność standardową średniej arytmetycznej uzyskanych z doświadczenia wszystkich nie odrzuconych wyników pomiarowych, a także , określające wartość, której prawdopodobieństwo uzyskanie w naszym doświadczeniu jest największe, wartość ta jest najdokładniejsza ze wszystkich uzyskanych xi względem wartości dokładnej x0. Celem doświadczenia jest uzyskanie wartości x0, ponieważ nie jest możliwe uzyskanie tej wartości, lub dokonania nieskończenie wielu pomiarów, bo wtedy , to zamiast niej uzyskujemy średnią arytmetyczną, która jest liczona dla każdej serii danych doświadczalnych, wykorzystując do tego celu rozkład normalny, w którym w miejsce wartości dokładnej wsadzamy .
Zwykle tak się robi w fizyce doświadczalnej, nie patrząc na opinie matematyków, w których matematycy mówią, że wszystko musi być dokładne, nie ma wartości przybliżonej - a jeśli są, to trzeba określić je w sposób ściśle określony. Jednak według fizyków nie ma wartości dokładnej, są tylko wartości przybliżone. W doświadczeniach fizycznych dane doświadczalne układają się wokół punktu x0 (wartości dokładnej), i bardzo rzadko się zdarza, że wyjdzie jakiś wynik (pomiar), który jest odległy od x0 nawet o σ, a nawet o 2σ, i jest to raczej błąd systematyczny, który może mówić o błędzie eksperymentatora, np. niedostosowanej temperatury do warunków doświadczalnych itp., dlatego odrzucanie wyników doświadczalnych bardzo oddalonych od x0, należy przyjąć jako odrzucone. Gdy odrzuca się te xi z poszczególnych prób i serii. Mówi się, że w przybliżeniu n⇒∞ jest spełniony rozkład normalny, natomiast przy małym n tak nie jest, ponieważ w doświadczeniu powinno się robić co najmniej 30 pomiarów w doświadczeniu w poszczególnych próbach, by rozkład był w miarę spełniony, bo wtedy policzenie wariancji jest bardziej dokładne, a wartość średnia z wyników pomiarowych zbliża się do wartości dokładnej (bo czym, większa jest liczba uzyskanych wyników pomiarowych w wyniku doświadczenia to błąd wartości średniej jest bardziej mniejszy). Rozrzut wyników wokół wartości dokładnej jest porozrzucany po obu stronach x0 i tak się dzieje, że wyniki doświadczalne znajdują się bardzo blisko wartości dokładnej. Prawdopodobieństwo uzyskania wyników o błędzie większym od σ a nawet o 2σ jest raczej bardzo mało prawdopodobne i nieodrzucanie tychże wyników doświadczalnych wnosi wkładu do obliczania σ, zatem co je należy odrzucić, bo te wartości obliczenia stają się mało-wiarygodne przy nieodrzuceniu tychże wartości. Rozkład normalny jest spełniony dla nieskończonej ilości stopni swobody (liczby uzyskanych danych doświadczalnych), oczywiście minus jeden, bo mamy wzór na wariancję wyniku pomiarowego, licząc je dla poszczególnych prób.
Niepewność pomiarową w doświadczeniu określmy jako średni błąd, który można popełnić, dla poszczególnych doświadczeń w próbach. Jeśli niepewności są większe niż σ, to taki wynik częściowy doświadczenia należy odrzucić, toteż i należy przeliczyć od nowa, czy nie ma dalszych wyników doświadczenia, tzn.: xi określić jako odrzucone. Jeśli są, wówczas tę procedurę powtarzamy aż do skutku. Po tej czynności należy przejść do dalszego etapu badania, jakie są zależności w naszym doświadczeniu w poszczególnych próbach.
Dlaczego trzeba odrzucać wyniki dla których , ale ponieważ gdy zapoznamy się z wyprowadzeniem wzoru na rozkład normalny z zastosowaniem szeregu Taylora wokół wartości x0, i jak wiemy z analizy matematycznej, gdy większa jest różnica między xi (wynikiem pomiaru) a x0 (wartością dokładną), to szereg Taylora przestaje być spełniony poza promieniem zbieżności, dlatego odchyły od x0 nie powinny być za duże.
Wielomianowa kombinacja trafień w układ doświadczalny
edytujZałóżmy, że mamy "m" punktów doświadczalnych, które będziemy uzyskiwać w "n" doświadczeniach. W "n" doświadczeniach możemy uzyskać w dany punkt o numerze j liczbę kj dotknięć. Według rozkładu normalnego w doświadczeniu staramy by liczba doświadczeń była nieskończenie duża, a praktycznie bardzo duża, by doświadczenie pokryło prawie wszystkie punkty możliwe do uzyskania w naszym doświadczeniu, przy czym uzyskane wyniki są powtarzane z różną częstością, wtedy liczba trafionych punktów l zbliżała się do liczby punktów w doświadczeniu możliwych do uzyskania. W wzorze (12.1) wliczmy tylko te punkty, które zostały dotknięte w naszym doświadczeniu. Zatem ilość możliwych trafień w te punkty wyraża się:
gdzie:
- n jest to ilość przeprowadzonych doświadczeń w danym układzie doświadczalnym.
- kj jest to ilość trafień w dany punkt doświadczalny.
We wzorze (12.1) jest spełniony związek mówiący, że liczba wszystkich poszczególnych trafień w dane punkty doświadczalne jest równe sumie przeprowadzonych doświadczeń.
Wyznaczanie wzoru przybliżonego na n!
edytujW rozkładzie dwumianowym bardzo często występuje silnia, korzystanie z niej szczególnie jest niewygodne, gdy zachodzi n→ ∞. Będziemy korzystać ze wzoru Stirlinga, który wylicza w sposób przybliżony silnie z liczby n za pomocą potęgowania i pierwiastkowania, zatem ten wzór mozna napisać wedle sposobu:
Wzór (12.3) staje się wyrażeniem dokładnym, gdy n→∞. Możemy z logarytmować wyrażenie przybliżone na silnie liczby n przedstawionego wedle wspomnianego wzoru i dokonać dalszych przybliżeń, z którego końcowego przybliżenia będziemy korzystać w dalszych obliczeniach na wyznaczaniem rozkładu normalnego.
Logarytm kombinacji trafień w układ doświadczalny
edytujPoliczmy logarytm naturalny wyrażenia na ilość możliwych pewnych dotknięć w "l" ściśle określonych punktów, którego wzór jest napisany tutaj (12.1), korzystając przy tym ze wzoru na przybliżenie wielkości logarytmu naturalnego silni z liczby n, czyli (12.4) i z właściwości logarytmu iloczynu lub ilorazu dwóch liczb:
W równaniu (12.5) możemy wyznaczyć Wn(k1,k2,...,kl), zatem dostajemy, że ilość możliwości realizacji układu statystycznego trafień w ściśle określony punkty z ilością trafień kj dla punktu o numerze "j" jest określana:
Jeżeli mamy układ doświadczeń, w których uzyskano l dotknięć w punkty doświadczalne przeprowadzając n doświadczeń, wtedy prawdopodobieństwo uzyskania jednego doświadczenia z układów doświadczeń jest równe odwrotności .
Całkowite prawdopodobieństwo zdarzeń w rozkładzie normalnym
edytujW doświadczeniu ilość możliwych dotknięć w dane punkty doświadczalne jest określone przez wzór (12.6). Prawdopodobieństwo, że nasze doświadczenie tak przejdzie, według określonego schematu jest określone jak jeden ze wszystkich możliwych potnieć w l punktów doświadczalnych: Wn{(k1,k2,..,kn). Załóżmy, że mamy zbiór doświadczeń, w których otrzymaliśmy takie same dotknięcia w l punktów doświadczalnych, a prawdopodobieństwo tego zbioru jest określone przez stałe , wtedy z definicji prawdopodobieństwa warunkowego prawdopodobieństwo, że uzyskamy dotknięcia w l punktów doświadczalnych jest określone jako iloczyn prawdopodobieństwa p i prawdopodobieństwa, że uzyskamy dotnięcia w l-punktów doświadczalnych z całego zbioru doświadczeń, w których otrzymujemy dotnięcia w te same w l punktów doświadczalnych:
Rozszerzenie przedziałów uzyskania wyników na R lub przedział w R
edytujZałóżmy, że badamy przypadek w bardzo dużej ilości doświadczeń "n" dla zmiennej typu ciągłego w R lub w przedziale (a,b) należących do zbioru liczb rzeczywistych lub w przypadku quasiciągłym. Dla tego przypadku, w doświadczeniu, wiemy jednak że: Δx→0 i (x0-Δ x/2,x0+Δ x/2), gdzie jest to malutki przedział dla którego wartości naszego wyniku pomiarowego są nierozróżnialne względem niepewności pomiarowej, ale i też z drugiej strony d → ∞, co przedstawia rozległość pomiarów, co spełnia warunki dla naszego rozkładu normalnego. Prawdopodobieństwo uzyskania jakiegoś wyniku w rozważanym przedziale dąży zera, bo ilość wyników do uzyskania jest nieskończenie duża. Uzyskanie wyników w przedziale (-∞,∞), nie dość że długość przedmiotów miała by wiele do życzenia, jak i prawa fizycznego, które badamy mogą być nie spełnione dla aż tak dużego "d", np. prędkość świata dla "d" względnie miarę małego w porównywana tysiącami kilometrów jaką światła może przebyć, ma wiele do życzenia, a dla "d" bardzo dużego raczej już nie. Również Δ x nie może być nieskończenie małe, ponieważ niepewność pomiarowa przedmiotów jest jakaś tam, tak że rozróżnienie wyników w (x-χ,x+χ) graniczy z cudem. Czyli pomiary jakieś wielkości fizycznej nie mogą być pomiarami zbyt rozległymi względem naszego doświadczenia, jak i pomiarami bardzo małymi względnie wielkości, które mierzymy. Jeśli d jest względnie duże, a Δ x jest względnie małe, to nasz przedział można potraktować jak przedział ciągły o rozmiarach nieskończonych, tzn. (-∞,∞).
Gęstość prawdpodobieństwa dla zmiennej typu ciągłego lub quasiciągłego
edytujGęstość prawdopodobieństwa w n doświadczeniach należy zdefiniować wedle:
Ponieważ ilość danych do zbadania jest nieskończenie duża, i wtedy dochodzimy do wniosku, że zachodzi Pn→ 0, oczywiste jest, że ma sens stosowanie wtedy definicji gęstości prawdopodobieństwa. Tutaj zastępujemy wielkości k→ k(x) dla nieskończenie przeprowadzonych doświadczeń w przedziale (a,b) lub w "R", wtedy gęstość prawdopodobieństwa uzyskania wyników z przedziału jest równe w naszym przypadku dla "n" (duże "n") doświadczeń:
- gdzie jest to gęstość ilości stanów ilości trafień dla zmiennej typu ciągłej w przedziale o grubości "dx".
Maksymalizacja prawdopodobieństwa dla pomiaru równej wartości dokładnej
edytujRozłóżmy sobie logarytm naturalny ilości trafień w dany punkt doświadczalny "x" względem wartości dokładnej napisanej przez x0 w szereg Taylora, pisząc wszystkie wyrazy włącznie z kwadratowym, a pozostałe wyrazy oznaczając wielokropkami:
Prawdopodobieństwo uzyskania k wyników takich samych uzyskanych w doświadczeniu w n wynikach pomiarowych jest równa na podstawie (12.10):
Wzór na prawdopodobieństwo realizacji danego doświadczenia określonych wzorem (12.7), do którego podstawiamy wyrażenie na logarytm ilości trafień w punkt doświadczalny x, określonych według wzoru (12.10), i dostajemy pewne wyrażenie, które jest prawdopodobieństwem trafień w dany punkt doświadczalny od x1 do xn, których wyników pomiarowych jest n.
Z obliczeń wynikających z przeprowadzonych obliczeń w punkcie (12.12) przepiszmy końcowy wynik dla przejrzystości wykładu.
- gdzie:
- są to wyniki doświadczalne uzyskane w wyniku doświadczenia, wyniki powtarzające się nie są wliczane do tego wektora.
- są to wyniki doświadczalne uzyskany w wyniku doświadczenia, przy czym do tego wektora są wliczane również wyniki powtarzające się.
Wartość x0 są tak dobieramy, by rozkład (12.13) dla tej wartości przyjmował wartość największą, czyli wartość dokładna powinna być najbardziej prawdopodobna , zatem dochodzimy do wniosku, że B=0, a stałą związaną z A, możemy włączyć pod stałą C i w końcu dostajemy stałą F, co uwzględnimy poniżej. A to dowód, że stała B ma taką wartość. aby to udowodnić należy policzyć pochodną cząstkową prawdopodobieństwa rozkładu (12.13) względem wartości xi uzyskanych w wyniku pomiaru i podstawić do niego za xi wartość dokładną x0 a cały wynik przyrównać do zera:
Na podstawie wcześniejszych rozważań otrzymujemy, że prawdopodobieństwa naszego zdarzenia, że uzyskamy n pewnych wyników doświadczalnych, dla stałej D sformułowanej dla wyników pomiarowych jest zatem określona przez wzór:
Prawdopodobieństwa uzyskania średnich arytmetycznych dla stałej D sformułowanej dla wartości średniej arytmetycznej, przy tym korzystając ze wzoru (12.15), jest ono równe wzorowi względem jego odchylenia od wartości dokładnej x0 zastępując w ostatnim wspomnianym wzorze przez wiedząc, że ten wzór formujemy dla n prób:
Prawdopodobieństwo warunkowe względem prawdopodobieństwa wartości średniej
edytujOkreślimy czemu jest równa gęstość prawdopodobieństwa względem średniej arytmetycznej, jeśli znamy tylko gęstość prawdopodobieństwo wyniku pomiarowego oraz średniej arytmetycznej względem wartości dokładnej x0 ,czyli jaka jest gęstość prawdopodobieństwa, gdy mamy wartość średnią , czyli skorzystajmy z definicji prawdopodobieństwa warunkowego:
Dokonajmy obliczeń pomocniczych rozwinięcia wyrazu o numerze "i" występującego w pierwszej sumie w postaci przekształceń jego, które przeprowadzimy poniżej:
Na podstawie obliczeń (12.18), prawdopodobieństwo uzyskania n wyników pomiarowych (12.17) przedstawiamy według:
Redukując drugi i czwarty wyraz, i korzystając z tego, że poszczególne wyniki doświadczenia są niezależne od siebie, co można dla wyrazu trzeciego przeprowadzić obliczenia, który jest równy zero.
Wedle obliczeń (12.20) prawdopodobieństwo warunkowe względem średniej arytmetycznej prawdopodobieństwa uzyskania uzyskania pewnej ilości wyników (12.19) jest określone:
Mając wzór na rozkład średniej wokół wartości dokładnej (12.17) oraz korzystając z definicji wartości średniej arytmetycznej dla bardzo dużej liczby wyników pomiarowych n, możemy ten wzór przekształcić jeszcze bardziej, zatem dochodzimy do schematu:
Przejdźmy jeszcze raz do wzoru (12.17), w której mianownik zastępujemy jej wyrażeniem równoważnym (12.22), wtedy dochodzimy do wniosku, że prawdopodobieństwo uzyskania danego wyniku pomiarowego względem prawdopodobieństwa uzyskania ściśle określonej wartości średniej jest określone równoważnym do wspomnianego wzorem:
Wyznaczamy stałe D i F we wzorze na rozkład normalny
edytujZajmować będziemy się zajmować wielkością ciągłą zmiennej x, oczywiste jest że rozkład dyskretny można uważać za ciągły, gdy Δ x=x-xi-1 jest bardzo małe w porównaniu z badanym przedziale (x0-d/2,x0+d/2), tzn. Δ x<<d, i dlatego w tym przypadku będziemy używać gęstości prawdopodobieństwa ρ zamiast prawdopodobieństwa uzyskania n wyników pomiarowych P, w przypadku wielkości badanej. Tak by obejmował dwa przypadki, tzn. rozkład normalnym ciągły i quasiciągły. W przypadku quasistatycznym gęstość prawdopodobieństwa uzyskania pojedynczego wyniku pomiaru definiujemy jako iloraz prawdopodobieństwa uzyskania wyniku xi w przedziale o długości Δ xi.
W przypadku ciągłym w (12.24) możemy zastąpić wielkość dyskretną xi przez wielkość ciągłą x.
Zakładamy, że mamy rozkład gęstości prawdopodobieństwa gęstości wartości losowej ciągłej zmiennej "x" lub w przypadku quasiciągłym, gdy różnica pomiędzy dwoma najbliższymi punktami doświadczalnymi jest mała w porównaniu z "d"(długością badanego przedziału), zatem tą gęstość prawdopodobieństwa dla stałej D sformułowanej dla wyników pomiarowych, wartości średniej arytmetycznej lub innego typu zmiennej przedstawiamy:
Będziemy się posługiwać całkami przystępnymi, które będziemy się często posługiwać, które wynikają z rozważań z analizy matematycznej. A także można napisać całkę wynikającego z różniczkowania ciągłego obu stron (12.26) względem parametru α, zatem te dwie całki (przed różniczkowaniem i po różniczkowaniu obu stron) przedstawiamy:
Funkcja gęstości prawdopodobieństwa (12.25) powinna być funkcją unormowaną, w tym celu należy skorzystać z tożsamości całkowej (12.26), zatem dochodzimy do wniosku:
Wariancję możemy policzyć względem rozkładu (12.25), po podstawieniu do niej za stałą F napisanej wedle (12.28) i korzystając z definicji wariancji zmiennej losowej ciągłej (2.15), przedstawiamy tą wielkość wedle obliczeń poniżej:
Zatem zmienna F, wynikająca z końcowych obliczeń (12.28), możemy podstawić do niego wzór wynikający też z obliczeń (12.29), wtedy tą stałą możemy przedstawić w zależności od odchylenia standardowego σ(x).
Na samym końcu możemy wyznaczyć rozkład ρ(x) zmiennej x (12.25) w pełnej jego okazałości, wykorzystując końcowe wyniki z obliczeń (12.29) (stała D) i (12.30) (stała F), wtedy ten nasz rozkład jest przedstawiony wedle:
Jest to rozkład zmiennej losowej ciągłej x (rozkład normalny) względem wartości dokładnej. Wzór przedstawia się też jako gęstość prawdopodobieństwa uzyskania wyniku x: , na podstawie (12.11)(po podstawieniu do niej stałej B=0 i innych stałych uzyskanych w tym rozdziale), która jest liczbą wyników pomiarowych dk z wynikiem x podzielonej przez liczbę wszystkich wyników pomiarowych n uzyskanych w doświadczeniu w przedziale (x,x+dx) podzieloną też przez dx.
Związki w rozkładzie normalnym
edytujMożemy określić odchylenie standardowe wyników pomiarowych, które podamy poniżej wyprowadzenie tego wzoru, mając kolejno wzory (12.23) i (12.21), które są wzorami wynikających z definicji prawdopodobieństwa warunkowego wyników pomiarowych względem prawdopodobieństwa uzyskania średniej arytmetycznej wokół wartości dokładnej, te wzory kolejno przedstawiamy w postaci:
A także ze wzoru na prawdopodobieństwo uzyskania średniej arytmetycznej w n pomiarach wynikającego ze wzoru (12.15):
Wzór (12.34) jest również prawdopodobieństwem uzyskania średniej arytmetycznej w doświadczeniu. W przypadku quasiciągłym i ciągłym prawdopodobieństwa zastępujemy gęstościami prawdopodobieństwa we wzorach (12.15) i (12.34), wtedy można powiedziać wywody, że według równości (12.15) mamy stałą D określoną przez (12.36) i z drugiej jednak strony stałą D można określić względem równości (12.34), wedle sposobu (12.35):
Jeśli wzór (12.36) na stałą D podstawimy do wzoru (12.35), wtedy otrzymamy wyrażenie, które nadal będziemy przekształcać:
Co zgadza się z wzorem (6.11), więc podejście (12.34) jest prawidłowe. Według obliczeń (12.37) wynika, że odchylenie standardowe średniej arytmetycznej jest równe odchyleniu standardowemu wyniku pomiaru podzielonej przez pierwiastek ilości wszystkich wyników pomiarów.
Wiadomo jednak, że wzory (12.33) i (12.34) oznaczają to samo, więc możemy je przyrównać, zatem mamy:
Z różnowartości funkcji eksponencjalnej we wzorze (12.38) dostajemy równoważny do poprzedniego wzór, z którym troszkę go poprzekształcamy:
Gdy wyników pomiarów mamy nieskończenie wiele, wtedy ilość wyników pomiarów dla danego x podzielona przez ilość wszystkich wyników w doświadczeniu pokrywa się z infinitezymalnym prawdopodobieństwem uzyskania tego właśnie wyniku, zatem w przypadku granicznym lewa strona końcowej nierówności (12.39) staje się całką z wariancji po nieskończonym przedziale zmienności, zatem odchylenie standardowe wyniku pomiarowego, która jest pierwiastkiem wariancji charakteryzujących rozkład jest napisana wedle:
W końcu odchylenie standardowe średniej arytmetycznej (12.37) otrzymamy podstawiając do niego wzór (12.40) i dostając na samym końcu wzór (6.18).
Rozkład normalny
edytujRozkład dla wyniku pomiarowego ścisłej jednej wartości xi względem jej wartości dokładnej jest wyrażona:
W zastosowaniach fizycznych często stosujemy wzór na gęstość prawdopodobieństwa uzyskania pomiaru względem wartości średniej arytmetycznej zastępując wartość dokładną średnią arytmetyczną w (12.41), czyli wyprowadźmy rozkład uzyskany z (12.21) dla pojedynczego pomiaru wykorzystując zależność na D (12.36) normując go do jedynki, który mówi jaka jest gęstość prawdopodobieństwa warunkowego względem prawdopodobieństwa uzyskania wartości średniej arytmetycznej, wtedy:
Można udowodnić, że odchylenie standardowe pomiaru według wzoru (12.42) jest równe licząc tą niepewność względem wartości średniej arytmetycznej , a nie wokół wartości dokładnej , licząc podobnie jak w punkcie (12.29). Wzory (12.41) i (12.42) są wartością gęstości prawdopodobieństwa dla pojedynczego wyniku pomiarowego zmiennej losowej statystycznej ciągłej wokół wartości dokładnej lub średniej arytmetycznej. Rozkład wartości doświadczalnej wokół wartości dokładnej serii wyników pomiarowych z liczby wszystkich wyników pomiarowych "n", korzystając przy tym ze wzoru (12.41), wyraża się:
W zastosowaniach fizycznych stosowany jest przede wszystkim wzór wynikający z (12.42), mówiący jaka jest gęstość prawdopodobieństwa warunkowego uzyskania n wyników pomiarów względem wartości średniej:
Należy przy tym pamiętać, że we wzorach (12.43) oraz (12.44), wektor może zawierać w sobie elementy powtarzające się więcej niż raz.
Obliczanie poszczególnych momentów statystycznych, wartość oczekiwana
edytujBędziemy się tutaj zajmować wielkościami ciągłymi lub quasiciągłymi, której gęstość prawdopodobieństwa jest zdefiniowana według (12.31) . Momenty statystyczne ogólnie n-tego rzędu definiujemy według sposobu (3.12). Wykorzystując definicję momentu statystycznego μn, możemy policzyć jego wersję dla numerów nieparzystych, przy czym korzystając ze funkcja gęstości prawdopodobieństwa wspomniana wcześniej jest funkcją parzystą względem parametru x-x0, zatem można powiedzieć przy założeniu, że wartość dokładna zmiennej x jest x0, jest równa wartości oczekiwanej, tzn. :
Wykorzystujemy podstawienie t=x-x0 w całce (12.45) możemy dojść do wniosku, że nasza całka posiada funkcję podcałkową funkcją nieparzystą względem omawianego podstawienia, dzięki czemu ta całka jest równa zero.
Czyli momenty statystyczne o nieparzystym stopniu są zawsze równe zero. Na podstawie obliczeń (12.46) udowodniliśmy rzeczywiście, że wartość oczekiwana jest równa wartości dokładnej dla rozkładu normalnego, bo parametr μ1=0, tak jak powinno zachodzić dla pierwszego momentu statystycznego.
Obliczmy teraz momenty statystycznych o stopniu parzystym. Mając całki (12.26) i jej pochodną względem parametru α (12.27) możemy wyznaczyć dalszą pochodną całki (12.28), zatem ta ostatnia całka jest:
Przestawimy teraz całkę w postaci ogólnej, którą zapisujemy względem parametru n:
Zatem moment statystyczny μ2n możemy zapisać wedle schematu zależnego od parametru n.
Przy definicji momentu statystycznego względem wartości dokładnej (12.49) przyjmujemy (-1)!!=1, to wtedy obejmiemy również szczegół normowania gęstości prawdopodobieństwa dla n=0.
Punkt przegięcia w rozkładzie normalnym
edytujMamy oto rozkład normalny wyprowadzony w (12.31), ogólnie dla zmiennej typu dyskretnego-przypadek quasiciągłym, lub gdy nasz przedział badany jest dość gęsty, co również już na pewno jest spełnione w przypadku ciągłym naszej badanej wielkości. Zatem w celu wyznaczeniu punktu przegięcia wyznaczmy pierwszą pochodną naszej badanej funkcji gęstości prawdopodobieństwa:
Oznaczamy w (12.50) przez C pewne stałe występujące w nim, zatem możemy policzyć drugą pochodną gęstości prawdopodobieństwa rozkładu normalnego, a więc pierwszą pochodną wspomnianej pierwszej pochodnej, zatem dochodzimy do wniosku:
Ponieważ liczymy punkty przegięcia funkcji Gausa rozkładu normalnego, względem drugiej pochodnej, która przyjmuje wartość zerową w tym przypadku, zatem na podstawie obliczeń (12.51) dostajemy wniosek:
W ostatecznych obliczeniach rozwiązanie wynikające z (12.52) jest:
Stąd można z interpretować jako, że otrzymane x w obliczeniach powinno się mieścić w granicach xi∈ (x0-σ,x0+σ), a te wyniki, które nie spełniają tego warunku, powinny być odrzucone z danych doświadczalnych, i odnowa trzeba wyznaczać i σ. Przypominając przy liczeniu ρ(x) trzeba wstawić za x0 jego wartość średnią, tzn. , co dla dużej ilości wyników doświadczalnych jest w przybliżeniu spełniona równość między tymi dwoma wielkościami, ponieważ średnia arytmetyczna ma najmniejszą niepewność pomiarową z tych wszystkich otrzymanych x z danych doświadczalnych. Dla tych wyników doświadczenia, które nie powinny być odrzucone funkcja z punktu widzenia dla tego punktu powinna być wklęsła. Funkcja Gausa dla x∈ (x0-σ,x0+σ) jest funkcją wklęsłą, a dla dopełnienia wcześniej przedstawionego wzoru jest wypukła.