Statystyka matematyczna/Twierdzenie o rozkładzie normalnym jednowymiarowym

Statystyka matematyczna

Twierdzenie o rozkładzie normalnym jednowymiarowym

Licencja
Autor: Mirosław Makowiecki Absolwent UMCS Fizyki Komputerowej Uniwersytetu Marii Curie-Skłodowskiej w Lublinie Email: miroslaw(kropka)makowiecki(małpa)gmail(kropka)pl Dotyczy: książki, do której należy ta strona, oraz w niej zawartych stron i w nich podstron, a także w nich kolumn, wraz z zawartościami. Użytkownika książki, do której należy ta strona, oraz w niej zawartych stron i w nich podstron, a także w nich kolumn, wraz z zawartościami nie zwalnia z odpowiedzialności prawnoautorskiej nieprzeczytanie warunków licencjonowania. Umowa prawna: Creative Commons: uznanie autorstwa, na tych samych warunkach, z możliwością obowiązywania dodatkowych ograniczeń. Autor tej książki dołożył wszelką staranność, aby informacje zawarte w książce były poprawne i najwyższej jakości, jednakże nie udzielana jest żadna gwarancja, czy też rękojma. Autor nie jest odpowiedzialny za wykorzystanie informacji zawarte w książce, nawet jeśli wywołaby jakąś szkodę, straty w zyskach, zastoju w prowadzeniu firmy, przedsiębiorstwa lub spółki bądź utraty informacji, niezależnie czy autor (a nawet Wikibooks) został powiadomiony o możliwości wystąpienie szkód. Informacje zawarte w książce mogą być wykorzystane tylko na własną odpowiedzialność.

Wykaz modułów w książce
1Średnie w matematyce statystycznej 2Wprowadzenie do rozkładów zmiennych losowych 3Momenty statystyczne ciągłe i dyskretne 4Momenty statystyczne dla funkcji złożonej 5Momenty statystyczne w działaniu 6Pobieranie próby 7Metoda największej wiarygodności 8Funkcje charakterystyczne 9Ważniejsze rozkłady statystyczne 10Twierdzenie o rozkładzie Bernoulliego 11Twierdzenie o rozkładzie wielomianowym 12Twierdzenie o rozkładzie normalnym jednowymiarowym 13Twierdzenie o rozkładzie normalnym wielowymiarowym 14Centralne twierdzenie graniczne 15Twierdzenie o rozkładzie χ² 16Twierdzenie o rozkładzie hipergeometrycznym 17Twierdzenie o rozkładzie Poissona 18Błędy pomiarowe w fizyce 19Metoda najmniejszych kwadratów

Spis treści
1Wielomianowa kombinacja trafień w układ doświadczalny 2Wyznaczanie wzoru przybliżonego na n! 3Logarytm kombinacji trafień w układ doświadczalny 4Całkowite prawdopodobieństwo zdarzeń w rozkładzie normalnym 4.1Rozszerzenie przedziałów uzyskania wyników na R lub przedział w R 4.2Gęstość prawdpodobieństwa dla zmiennej typu ciągłego lub quasiciągłego 5Maksymalizacja prawdopodobieństwa dla pomiaru równej wartości dokładnej 6Prawdopodobieństwo warunkowe względem prawdopodobieństwa wartości średniej 7Wyznaczamy stałe D i F we wzorze na rozkład normalny 8Związki w rozkładzie normalnym 9Rozkład normalny 10Obliczanie poszczególnych momentów statystycznych, wartość oczekiwana 11Punkt przegięcia w rozkładzie normalnym

Następny rozdział: Twierdzenie o rozkładzie normalnym wielowymiarowym. Poprzedni rozdział: Twierdzenie o rozkładzie wielomianowym.

Podręcznik: Statystyka matematyczna.

Artykuł zawiera wszystkie informacje dotyczące rozkładu normalnego, które są potrzebne do jego wyprowadzenia oraz prostą jego interpretację, a w szczególności interpretację σ oraz punktu przegięcia, kiedy wyniki pomiaru należy odrzucić, a kiedy przyjąć.

Niżej znajdują się wszystkie momenty statystyczne rozkładu normalnego. Należy zaznaczyć, że momenty statystyczne o nieparzystym stopniu są równe zeru, a pozostałe są od niego różne. Można tak interpretować, że rozrzut wyników doświadczalnych wokół wartości najprawdopodobniej x₀ jest symetryczny, tzn. ilość wyników pomiarowych przed oraz za x₀ jest taka sama, czyli funkcja gęstości prawdopodobieństwa jest funkcją parzystą względem x₀, z tego powodu momenty statystyczne nieparzystego stopnia są równe zero, gdyż funkcja podcałkowa jest funkcją nieparzystą w całce symbolizującej moment statystyczny.

Twierdzenie o rozkładzie normalnym – szczególny przypadek twierdzenia o rozkładzie wielomianowym, dający odpowiedź na pytanie jak postępować z danymi doświadczalnymi: czy je odrzucić jako mało prawdopodobne, czy je przyjąć w zależności od danych doświadczalnych uzyskanych z doświadczenia, poprzez uprzednie obliczenie ${\overline {x}}\;$ i σ, czyli wartość średnią (arytmetyczną) i średnie odchylenie standardowe. Zasady obliczania tych wskaźników ${\overline {x}}\;$ czy σ będziemy tu przyjmować za znane i nie będziemy do tego problemu podchodzić, tylko wyprowadzimy wzory na σ(x) - to jest niepewność standardową pojedynczego wyniku pomiarowego, oraz $\sigma ({\overline {x}})\;$ , to jest niepewność standardową średniej arytmetycznej uzyskanych z doświadczenia wszystkich nie odrzuconych wyników pomiarowych, a także ${\overline {x}}\;$ , określające wartość, której prawdopodobieństwo uzyskanie w naszym doświadczeniu jest największe, wartość ta jest najdokładniejsza ze wszystkich uzyskanych x_i względem wartości dokładnej x₀. Celem doświadczenia jest uzyskanie wartości x₀, ponieważ nie jest możliwe uzyskanie tej wartości, lub dokonania nieskończenie wielu pomiarów, bo wtedy ${\overline {x}}=x_{0}\;$ , to zamiast niej uzyskujemy ${\overline {x}}\;$ średnią arytmetyczną, która jest liczona dla każdej serii danych doświadczalnych, wykorzystując do tego celu rozkład normalny, w którym w miejsce wartości dokładnej wsadzamy ${\overline {x}}\;$ .

Zwykle tak się robi w fizyce doświadczalnej, nie patrząc na opinie matematyków, w których matematycy mówią, że wszystko musi być dokładne, nie ma wartości przybliżonej - a jeśli są, to trzeba określić je w sposób ściśle określony. Jednak według fizyków nie ma wartości dokładnej, są tylko wartości przybliżone. W doświadczeniach fizycznych dane doświadczalne układają się wokół punktu x₀ (wartości dokładnej), i bardzo rzadko się zdarza, że wyjdzie jakiś wynik (pomiar), który jest odległy od x₀ nawet o σ, a nawet o 2σ, i jest to raczej błąd systematyczny, który może mówić o błędzie eksperymentatora, np. niedostosowanej temperatury do warunków doświadczalnych itp., dlatego odrzucanie wyników doświadczalnych bardzo oddalonych od x₀, należy przyjąć jako odrzucone. Gdy $|x_{i}-{\overline {x}}|>\sigma \;$ odrzuca się te x_i z poszczególnych prób i serii. Mówi się, że w przybliżeniu n⇒∞ jest spełniony rozkład normalny, natomiast przy małym n tak nie jest, ponieważ w doświadczeniu powinno się robić co najmniej 30 pomiarów w doświadczeniu w poszczególnych próbach, by rozkład był w miarę spełniony, bo wtedy policzenie wariancji jest bardziej dokładne, a wartość średnia z wyników pomiarowych zbliża się do wartości dokładnej (bo czym, większa jest liczba uzyskanych wyników pomiarowych w wyniku doświadczenia to błąd wartości średniej jest bardziej mniejszy). Rozrzut wyników wokół wartości dokładnej jest porozrzucany po obu stronach x₀ i tak się dzieje, że wyniki doświadczalne znajdują się bardzo blisko wartości dokładnej. Prawdopodobieństwo uzyskania wyników o błędzie większym od σ a nawet o 2σ jest raczej bardzo mało prawdopodobne i nieodrzucanie tychże wyników doświadczalnych wnosi wkładu do obliczania σ, zatem co je należy odrzucić, bo te wartości obliczenia stają się mało-wiarygodne przy nieodrzuceniu tychże wartości. Rozkład normalny jest spełniony dla nieskończonej ilości stopni swobody (liczby uzyskanych danych doświadczalnych), oczywiście minus jeden, bo mamy wzór na wariancję wyniku pomiarowego, licząc je dla poszczególnych prób.

Niepewność pomiarową w doświadczeniu określmy jako średni błąd, który można popełnić, dla poszczególnych doświadczeń w próbach. Jeśli niepewności są większe niż σ, to taki wynik częściowy doświadczenia należy odrzucić, toteż ${\overline {x}}\;$ i $\sigma \;$ należy przeliczyć od nowa, czy nie ma dalszych wyników doświadczenia, tzn.: x_i określić jako odrzucone. Jeśli są, wówczas tę procedurę powtarzamy aż do skutku. Po tej czynności należy przejść do dalszego etapu badania, jakie są zależności w naszym doświadczeniu w poszczególnych próbach.

Dlaczego trzeba odrzucać wyniki dla których $(x_{i}-{\overline {x}})>\sigma \;$ , ale ponieważ gdy zapoznamy się z wyprowadzeniem wzoru na rozkład normalny z zastosowaniem szeregu Taylora wokół wartości x₀, i jak wiemy z analizy matematycznej, gdy większa jest różnica między x_i (wynikiem pomiaru) a x₀ (wartością dokładną), to szereg Taylora przestaje być spełniony poza promieniem zbieżności, dlatego odchyły od x₀ nie powinny być za duże.

Wielomianowa kombinacja trafień w układ doświadczalny

Załóżmy, że mamy "m" punktów doświadczalnych, które będziemy uzyskiwać w "n" doświadczeniach. W "n" doświadczeniach możemy uzyskać w dany punkt o numerze j liczbę k_j dotknięć. Według rozkładu normalnego w doświadczeniu staramy by liczba doświadczeń była nieskończenie duża, a praktycznie bardzo duża, by doświadczenie pokryło prawie wszystkie punkty możliwe do uzyskania w naszym doświadczeniu, przy czym uzyskane wyniki są powtarzane z różną częstością, wtedy liczba trafionych punktów l zbliżała się do liczby punktów w doświadczeniu możliwych do uzyskania. W wzorze (12.1) wliczmy tylko te punkty, które zostały dotknięte w naszym doświadczeniu. Zatem ilość możliwych trafień w te punkty wyraża się:

W_{(k_{1},k_{2},k_{3},...,k_{l})}^{n}={{n!} \over {\prod _{j=1}^{l}k_{j}!}}\;

(12.1)

gdzie:

n jest to ilość przeprowadzonych doświadczeń w danym układzie doświadczalnym.
k_j jest to ilość trafień w dany punkt doświadczalny.

We wzorze (12.1) jest spełniony związek mówiący, że liczba wszystkich poszczególnych trafień w dane punkty doświadczalne jest równe sumie przeprowadzonych doświadczeń.

n=\sum _{j=1}^{l}k_{j}\;

(12.2)

Wyznaczanie wzoru przybliżonego na n!

W rozkładzie dwumianowym bardzo często występuje silnia, korzystanie z niej szczególnie jest niewygodne, gdy zachodzi n→ ∞. Będziemy korzystać ze wzoru Stirlinga, który wylicza w sposób przybliżony silnie z liczby n za pomocą potęgowania i pierwiastkowania, zatem ten wzór mozna napisać wedle sposobu:

n!\simeq \left({{n} \over {e}}\right)^{n}{\sqrt {2\pi n}}

(12.3)

Wzór (12.3) staje się wyrażeniem dokładnym, gdy n→∞. Możemy z logarytmować wyrażenie przybliżone na silnie liczby n przedstawionego wedle wspomnianego wzoru i dokonać dalszych przybliżeń, z którego końcowego przybliżenia będziemy korzystać w dalszych obliczeniach na wyznaczaniem rozkładu normalnego.

\ln n!=n\ln n-n+{{1} \over {2}}\ln(2\pi )+{{1} \over {2}}\ln n=\left(n-{{1} \over {2}}\right)\ln n-n+{{1} \over {2}}\ln(2\pi )\simeq n\ln n-n

(12.4)

Logarytm kombinacji trafień w układ doświadczalny

Policzmy logarytm naturalny wyrażenia na ilość możliwych pewnych dotknięć w "l" ściśle określonych punktów, którego wzór jest napisany tutaj (12.1), korzystając przy tym ze wzoru na przybliżenie wielkości logarytmu naturalnego silni z liczby n, czyli (12.4) i z właściwości logarytmu iloczynu lub ilorazu dwóch liczb:

\ln W_{(k_{1},k_{2},...,k_{l})}^{n}=\ln {{n!} \over {\prod _{j=1}^{l}k_{j}!}}=\ln n!-\sum _{j=1}^{l}k_{j}!=n\ln n-n-\sum _{j=1}^{l}(k_{j}\ln k_{j}-k_{j})=n\ln n-n-\sum _{j=1}^{l}k_{j}\ln k_{j}+\sum _{j=1}^{l}k_{j}=\;

=n\ln n-\sum _{j=1}^{l}k_{j}\ln k_{j}

(12.5)

W równaniu (12.5) możemy wyznaczyć Wⁿ_{(k₁,k₂,...,k_l)}, zatem dostajemy, że ilość możliwości realizacji układu statystycznego trafień w ściśle określony punkty z ilością trafień k_j dla punktu o numerze "j" jest określana:

W_{(k_{1},k_{2},...,k_{l})}^{n}=e^{\sum _{j=1}^{l}k_{j}\ln n-\sum _{j=1}^{l}k_{j}\ln k_{j}}=e^{-\sum _{j=1}^{l}k_{j}\ln {{k_{j}} \over {n}}}

(12.6)

Jeżeli mamy układ doświadczeń, w których uzyskano l dotknięć w punkty doświadczalne przeprowadzając n doświadczeń, wtedy prawdopodobieństwo uzyskania jednego doświadczenia z układów doświadczeń jest równe odwrotności $W_{(k_{1},k_{2},...,k_{l})}^{n}\;$ .

Całkowite prawdopodobieństwo zdarzeń w rozkładzie normalnym

W doświadczeniu ilość możliwych dotknięć w dane punkty doświadczalne jest określone przez wzór (12.6). Prawdopodobieństwo, że nasze doświadczenie tak przejdzie, według określonego schematu jest określone jak jeden ze wszystkich możliwych potnieć w l punktów doświadczalnych: Wⁿ_{{(k₁,k₂,..,k_n)}. Załóżmy, że mamy zbiór doświadczeń, w których otrzymaliśmy takie same dotknięcia w l punktów doświadczalnych, a prawdopodobieństwo tego zbioru jest określone przez stałe $p\;$ , wtedy z definicji prawdopodobieństwa warunkowego prawdopodobieństwo, że uzyskamy dotknięcia w l punktów doświadczalnych jest określone jako iloczyn prawdopodobieństwa p i prawdopodobieństwa, że uzyskamy dotnięcia w l-punktów doświadczalnych z całego zbioru doświadczeń, w których otrzymujemy dotnięcia w te same w l punktów doświadczalnych:

P_{(k_{1},k_{2},...,k_{l})}^{n}=p{{1} \over {W_{(k_{1},k_{2},...,k_{l})}^{n}}}=pe^{\sum _{p=1}^{l}k_{p}\ln {{k_{p}} \over {n}}}=Ce^{\sum _{p=1}^{l}k_{p}\ln {{k_{p}} \over {n}}}

(12.7)

Rozszerzenie przedziałów uzyskania wyników na R lub przedział w R

Załóżmy, że badamy przypadek w bardzo dużej ilości doświadczeń "n" dla zmiennej typu ciągłego w R lub w przedziale (a,b) należących do zbioru liczb rzeczywistych lub w przypadku quasiciągłym. Dla tego przypadku, w doświadczeniu, wiemy jednak że: Δx→0 i (x₀-Δ x/2,x₀+Δ x/2), gdzie jest to malutki przedział dla którego wartości naszego wyniku pomiarowego są nierozróżnialne względem niepewności pomiarowej, ale i też z drugiej strony d → ∞, co przedstawia rozległość pomiarów, co spełnia warunki dla naszego rozkładu normalnego. Prawdopodobieństwo uzyskania jakiegoś wyniku w rozważanym przedziale dąży zera, bo ilość wyników do uzyskania jest nieskończenie duża. Uzyskanie wyników w przedziale (-∞,∞), nie dość że długość przedmiotów miała by wiele do życzenia, jak i prawa fizycznego, które badamy mogą być nie spełnione dla aż tak dużego "d", np. prędkość świata dla "d" względnie miarę małego w porównywana tysiącami kilometrów jaką światła może przebyć, ma wiele do życzenia, a dla "d" bardzo dużego raczej już nie. Również Δ x nie może być nieskończenie małe, ponieważ niepewność pomiarowa przedmiotów jest jakaś tam, tak że rozróżnienie wyników w (x-χ,x+χ) graniczy z cudem. Czyli pomiary jakieś wielkości fizycznej nie mogą być pomiarami zbyt rozległymi względem naszego doświadczenia, jak i pomiarami bardzo małymi względnie wielkości, które mierzymy. Jeśli d jest względnie duże, a Δ x jest względnie małe, to nasz przedział można potraktować jak przedział ciągły o rozmiarach nieskończonych, tzn. (-∞,∞).

Gęstość prawdpodobieństwa dla zmiennej typu ciągłego lub quasiciągłego

Gęstość prawdopodobieństwa w n doświadczeniach należy zdefiniować wedle:

\rho ({\vec {x}}_{\infty })=\lim _{\Delta x\rightarrow 0}{{P_{(k_{1},k_{2},...,k_{n})}^{n}} \over {(\Delta x)^{n}}}

(12.8)

Ponieważ ilość danych do zbadania jest nieskończenie duża, i wtedy dochodzimy do wniosku, że zachodzi P_n→ 0, oczywiste jest, że ma sens stosowanie wtedy definicji gęstości prawdopodobieństwa. Tutaj zastępujemy wielkości k→ k(x) dla nieskończenie przeprowadzonych doświadczeń w przedziale (a,b) lub w "R", wtedy gęstość prawdopodobieństwa uzyskania wyników z przedziału jest równe w naszym przypadku dla "n" (duże "n") doświadczeń:

\rho ({\vec {x}}_{\infty })=Ce^{\int _{a}^{b}D(x)k(x)\ln {{k(x)} \over {n}}dx}

(12.9)

gdzie $D(x)\;$ jest to gęstość ilości stanów ilości trafień dla zmiennej typu ciągłej w przedziale o grubości "dx".

Maksymalizacja prawdopodobieństwa dla pomiaru równej wartości dokładnej

Rozłóżmy sobie logarytm naturalny ilości trafień w dany punkt doświadczalny "x" względem wartości dokładnej napisanej przez x₀ w szereg Taylora, pisząc wszystkie wyrazy włącznie z kwadratowym, a pozostałe wyrazy oznaczając wielokropkami:

\ln {{k} \over {n}}=-A-B(x-x_{0})-{{D} \over {2}}(x-x_{0})^{2}+...\Rightarrow \ln {{k} \over {n}}\simeq -A-B(x-x_{0})-{{D} \over {2}}(x-x_{0})^{2}

(12.10)

Prawdopodobieństwo uzyskania k wyników takich samych uzyskanych w doświadczeniu w n wynikach pomiarowych jest równa na podstawie (12.10):

P_{0}(x)={{k} \over {n}}\simeq e^{-A-B(x-x_{0})-{{D} \over {2}}(x-x_{0})^{2}}=He^{-B(x-x_{0})-{{D} \over {2}}(x-x_{0})^{2}}\Rightarrow P_{0}(x)\simeq He^{-B(x-x_{0})-{{D} \over {2}}(x-x_{0})^{2}}\;

(12.11)

Wzór na prawdopodobieństwo realizacji danego doświadczenia określonych wzorem (12.7), do którego podstawiamy wyrażenie na logarytm ilości trafień w punkt doświadczalny x, określonych według wzoru (12.10), i dostajemy pewne wyrażenie, które jest prawdopodobieństwem trafień w dany punkt doświadczalny od x₁ do x_n, których wyników pomiarowych jest n.

P_{0}({\vec {x}}_{l})=Ce^{\sum _{p=1}^{l}k_{p}\ln {{k_{p}} \over {n}}}=Ce^{\sum _{p=1}^{l}\sum _{s=1}^{k_{p}}\ln {{k_{p}} \over {n}}}=Ce^{\sum _{p=1}^{l}\sum _{s=1}^{k_{p}}\left[-A-B(x_{p}-x_{0})-{{D} \over {2}}(x_{p}-x_{0})^{2}\right]}=Ce^{-\sum _{p=1}^{n}\left[A+B(x_{p}-x_{0})+{{D} \over {2}}(x_{p}-x_{0})^{2}\right]}=\;

=P_{0}({\vec {x}}_{n})\;

(12.12)

Z obliczeń wynikających z przeprowadzonych obliczeń w punkcie (12.12) przepiszmy końcowy wynik dla przejrzystości wykładu.

P_{0}({\vec {x}}_{n})=Ce^{-\sum _{p=1}^{n}\left[A+B(x_{p}-x_{0})+{{D} \over {2}}(x_{p}-x_{0})^{2}\right]}\;

(12.13)

gdzie:
${\vec {x}}_{l}\;$ są to wyniki doświadczalne uzyskane w wyniku doświadczenia, wyniki powtarzające się nie są wliczane do tego wektora.
${\vec {x}}_{n}\;$ są to wyniki doświadczalne uzyskany w wyniku doświadczenia, przy czym do tego wektora są wliczane również wyniki powtarzające się.

Wartość x₀ są tak dobieramy, by rozkład (12.13) dla tej wartości przyjmował wartość największą, czyli wartość dokładna powinna być najbardziej prawdopodobna , zatem dochodzimy do wniosku, że B=0, a stałą związaną z A, możemy włączyć pod stałą C i w końcu dostajemy stałą F, co uwzględnimy poniżej. A to dowód, że stała B ma taką wartość. aby to udowodnić należy policzyć pochodną cząstkową prawdopodobieństwa rozkładu (12.13) względem wartości x_i uzyskanych w wyniku pomiaru i podstawić do niego za x_i wartość dokładną x₀ a cały wynik przyrównać do zera:

0={{\partial P_{0}({\vec {x}}_{n})} \over {\partial x_{i}}}(x_{i}=x_{0})=Ce^{-\sum _{p=1}^{n}\left[A+B(x_{p}-x_{0})+{D \over 2}(x_{p}-x_{0})^{2}\right]}\left[-B-D(x_{i}-x_{0})\right](x_{i}=x_{0})\Rightarrow B=0\;

(12.14)

Na podstawie wcześniejszych rozważań otrzymujemy, że prawdopodobieństwa naszego zdarzenia, że uzyskamy n pewnych wyników doświadczalnych, dla stałej D sformułowanej dla wyników pomiarowych jest zatem określona przez wzór:

P_{0}({\vec {x}}_{n})=Fe^{-{{D} \over {2}}\sum _{p=1}^{n}(x_{p}-x_{0})^{2}}

(12.15)

Prawdopodobieństwa uzyskania średnich arytmetycznych dla stałej D sformułowanej dla wartości średniej arytmetycznej, przy tym korzystając ze wzoru (12.15), jest ono równe wzorowi względem jego odchylenia od wartości dokładnej x₀ zastępując w ostatnim wspomnianym wzorze $x_{i}\;$ przez ${\overline {x}}_{i}\;$ wiedząc, że ten wzór formujemy dla n prób:

P_{0}({\overline {x}}_{n})=Fe^{-{D \over 2}\sum _{i=1}^{n}{({\overline {x}}_{i}-x_{0})^{2}}}\;

(12.16)

Prawdopodobieństwo warunkowe względem prawdopodobieństwa wartości średniej

Określimy czemu jest równa gęstość prawdopodobieństwa względem średniej arytmetycznej, jeśli znamy tylko gęstość prawdopodobieństwo wyniku pomiarowego oraz średniej arytmetycznej względem wartości dokładnej x₀ ,czyli jaka jest gęstość prawdopodobieństwa, gdy mamy wartość średnią ${\overline {x}}\;$ , czyli skorzystajmy z definicji prawdopodobieństwa warunkowego:

P({\vec {x}}_{n})={{F_{1}} \over {F_{2}}}{{e^{-{D \over 2}\sum _{i=1}^{n}(x_{i}-x_{0})^{2}}} \over {e^{-{D \over 2}\sum _{i=1}^{n}({\overline {x}}-x_{0})^{2}}}}=F_{3}e^{-{D \over 2}\left(\sum _{i=1}^{n}\left((x_{i}-x_{0})^{2}-({\overline {x}}-x_{0})^{2}\right)\right)}\;

(12.17)

Dokonajmy obliczeń pomocniczych rozwinięcia wyrazu o numerze "i" występującego w pierwszej sumie w postaci przekształceń jego, które przeprowadzimy poniżej:

(x_{i}-x_{0})^{2}=(x_{i}-{\overline {x}}+{\overline {x}}-x_{0})^{2}=(x_{i}-{\overline {x}})^{2}+({\overline {x}}-x_{0})^{2}+(x_{i}-{\overline {x}})({\overline {x}}-x_{0})\;

(12.18)

Na podstawie obliczeń (12.18), prawdopodobieństwo uzyskania n wyników pomiarowych (12.17) przedstawiamy według:

P({\vec {x}}_{n})=F_{3}e^{-{D \over 2}\sum _{i=1}^{n}(x_{i}-{\overline {x}})^{2}}e^{-{D \over 2}\sum _{i=1}^{n}({\overline {x}}-x_{0})^{2}}e^{-{D \over 2}\sum _{i=1}^{n}((x_{i}-{\overline {x}})({\overline {x}}-x_{0}))}e^{{D \over 2}\sum _{i=1}^{n}(x_{0}-{\overline {x}})^{2}}\;

(12.19)

Redukując drugi i czwarty wyraz, i korzystając z tego, że poszczególne wyniki doświadczenia są niezależne od siebie, co można dla wyrazu trzeciego przeprowadzić obliczenia, który jest równy zero.

\sum _{i=1}^{n}(x_{i}-{\overline {x}})({\overline {x}}-x_{0})=({\overline {x}}-x_{0})\sum _{i=1}^{n}(x_{i}-{\overline {x}})=({\overline {x}}-x_{0})(\sum _{i=1}^{n}x_{i}-n{\overline {x}})=({\overline {x}}-x_{0})(n{\overline {x}}-n{\overline {x}})=0

(12.20)

Wedle obliczeń (12.20) prawdopodobieństwo warunkowe względem średniej arytmetycznej prawdopodobieństwa uzyskania uzyskania pewnej ilości wyników (12.19) jest określone:

P({\vec {x}}_{n})=F_{3}e^{-{D \over 2}\sum _{i=1}^{n}(x_{i}-{\overline {x}})^{2}}\;

(12.21)

Mając wzór na rozkład średniej ${\overline {x}}\;$ wokół wartości dokładnej $x_{0}\;$ (12.17) oraz korzystając z definicji wartości średniej arytmetycznej dla bardzo dużej liczby wyników pomiarowych n, możemy ten wzór przekształcić jeszcze bardziej, zatem dochodzimy do schematu:

P_{0}({\overline {x}})=Fe^{-{D \over 2}{\sum _{i=1}^{n}\left({{\sum _{j=1}^{n}{x_{j}}} \over {n}}-x_{0}\right)^{2}}}=Fe^{-{{Dn} \over {2}}\left[\sum _{i=1}^{n}{{1} \over {n^{2}}}(x_{i}-x_{0})^{2}+{{n-1} \over {n^{2}}}\sum _{ij=1,i\neq j}^{n}{{1} \over {n-1}}(x_{i}-x_{0})(x_{j}-x_{0})\right]}\simeq Fe^{-D{\sum _{i=1}^{n}(x_{i}-x_{0})^{2}} \over {2n}}\;

(12.22)

Przejdźmy jeszcze raz do wzoru (12.17), w której mianownik zastępujemy jej wyrażeniem równoważnym (12.22), wtedy dochodzimy do wniosku, że prawdopodobieństwo uzyskania danego wyniku pomiarowego względem prawdopodobieństwa uzyskania ściśle określonej wartości średniej jest określone równoważnym do wspomnianego wzorem:

P({\vec {x}}_{n})=F_{3}{{e^{-{D \over 2}\sum _{i=1}^{n}(x_{i}-x_{0})^{2}}} \over {e^{-{D \over {2n}}\sum _{i=1}^{n}(x_{i}-x_{0})^{2}}}}=F_{3}e^{-{D \over 2}\left(1-{1 \over n}\right)\sum _{i=1}^{n}(x_{i}-x_{0})^{2}}=F_{3}e^{-{D \over 2}{{{n-1} \over {n}}\sum _{i=1}^{n}(x_{i}-x_{0})^{2}}}\;

(12.23)

Wyznaczamy stałe D i F we wzorze na rozkład normalny

Zajmować będziemy się zajmować wielkością ciągłą zmiennej x, oczywiste jest że rozkład dyskretny można uważać za ciągły, gdy Δ x=x-x_i-1 jest bardzo małe w porównaniu z badanym przedziale (x₀-d/2,x₀+d/2), tzn. Δ x<<d, i dlatego w tym przypadku będziemy używać gęstości prawdopodobieństwa ρ zamiast prawdopodobieństwa uzyskania n wyników pomiarowych P, w przypadku wielkości badanej. Tak by obejmował dwa przypadki, tzn. rozkład normalnym ciągły i quasiciągły. W przypadku quasistatycznym gęstość prawdopodobieństwa uzyskania pojedynczego wyniku pomiaru definiujemy jako iloraz prawdopodobieństwa uzyskania wyniku x_i w przedziale o długości Δ x_i.

\rho _{0}(x_{i})={{P_{0}(x_{i})} \over {\Delta x_{i}}}\;

(12.24)

W przypadku ciągłym w (12.24) możemy zastąpić wielkość dyskretną x_i przez wielkość ciągłą x.

Zakładamy, że mamy rozkład gęstości prawdopodobieństwa gęstości wartości losowej ciągłej zmiennej "x" lub w przypadku quasiciągłym, gdy różnica pomiędzy dwoma najbliższymi punktami doświadczalnymi jest mała w porównaniu z "d"(długością badanego przedziału), zatem tą gęstość prawdopodobieństwa dla stałej D sformułowanej dla wyników pomiarowych, wartości średniej arytmetycznej lub innego typu zmiennej przedstawiamy:

\rho _{0}(x)=Fe^{-{D \over 2}(x-x_{0})^{2}}\;

(12.25)

Będziemy się posługiwać całkami przystępnymi, które będziemy się często posługiwać, które wynikają z rozważań z analizy matematycznej. A także można napisać całkę wynikającego z różniczkowania ciągłego obu stron (12.26) względem parametru α, zatem te dwie całki (przed różniczkowaniem i po różniczkowaniu obu stron) przedstawiamy:

\int \limits _{\infty }^{-\infty }e^{-\alpha x^{2}}dx={\sqrt {{\pi }/{\alpha }}}\;

(12.26)

\int \limits _{\infty }^{-\infty }x^{2}e^{-\alpha x^{2}}dx={{1} \over {2}}{\sqrt {{\pi } \over {\alpha ^{3}}}}\;

(12.27)

Funkcja gęstości prawdopodobieństwa (12.25) powinna być funkcją unormowaną, w tym celu należy skorzystać z tożsamości całkowej (12.26), zatem dochodzimy do wniosku:

1=\int \limits _{-\infty }^{\infty }Fe^{-{D \over 2}(x-x_{0})^{2}}dx=F\int \limits _{-\infty }^{\infty }e^{-{D \over 2}(x-x_{0})^{2}}dx\Rightarrow 1=F{\sqrt {{\pi } \over {D \over 2}}}\Rightarrow F={\sqrt {{D \over 2} \over {\pi }}}

(12.28)

Wariancję możemy policzyć względem rozkładu (12.25), po podstawieniu do niej za stałą F napisanej wedle (12.28) i korzystając z definicji wariancji zmiennej losowej ciągłej (2.15), przedstawiamy tą wielkość wedle obliczeń poniżej:

\sigma ^{2}(x)=\int \limits _{-\infty }^{\infty }{(x-x_{0})^{2}}\overbrace {\underbrace {\sqrt {{D} \over {2\pi }}} _{F}e^{-{{D} \over {2}}(x-x_{0})^{2}}} ^{\rho (x)}dx\Rightarrow \sigma ^{2}={\sqrt {{D} \over {2\pi }}}\int \limits _{-\infty }^{\infty }{t^{2}e^{-{{D} \over {2}}t^{2}}}dt={\sqrt {{D \over 2} \over {\pi }}}{{1} \over {2}}{\sqrt {{\pi } \over {{D^{3}} \over 8}}}={{1} \over {D}}\;

(12.29)

Zatem zmienna F, wynikająca z końcowych obliczeń (12.28), możemy podstawić do niego wzór wynikający też z obliczeń (12.29), wtedy tą stałą możemy przedstawić w zależności od odchylenia standardowego σ(x).

F={\sqrt {{D} \over {2\pi }}}={{1} \over {\sqrt {2\pi \sigma ^{2}(x)}}}={{1} \over {{\sqrt {2\pi }}\sigma (x)}}

(12.30)

Na samym końcu możemy wyznaczyć rozkład ρ(x) zmiennej x (12.25) w pełnej jego okazałości, wykorzystując końcowe wyniki z obliczeń (12.29) (stała D) i (12.30) (stała F), wtedy ten nasz rozkład jest przedstawiony wedle:

\rho _{0}(x)={{1} \over {{\sqrt {2\pi }}\sigma (x)}}e^{-{{(x-x_{0})^{2}} \over {2\sigma ^{2}(x)}}}\;

(12.31)

Jest to rozkład zmiennej losowej ciągłej x (rozkład normalny) względem wartości dokładnej. Wzór przedstawia się też jako gęstość prawdopodobieństwa uzyskania wyniku x: $\rho _{0}(x)={{dP} \over {dx}}={{dk} \over {n}}{{1} \over {dx}}\;$ , na podstawie (12.11)(po podstawieniu do niej stałej B=0 i innych stałych uzyskanych w tym rozdziale), która jest liczbą wyników pomiarowych dk z wynikiem x podzielonej przez liczbę wszystkich wyników pomiarowych n uzyskanych w doświadczeniu w przedziale (x,x+dx) podzieloną też przez dx.

Związki w rozkładzie normalnym

Możemy określić odchylenie standardowe wyników pomiarowych, które podamy poniżej wyprowadzenie tego wzoru, mając kolejno wzory (12.23) i (12.21), które są wzorami wynikających z definicji prawdopodobieństwa warunkowego wyników pomiarowych względem prawdopodobieństwa uzyskania średniej arytmetycznej wokół wartości dokładnej, te wzory kolejno przedstawiamy w postaci:

P({\vec {x}}_{n})=F_{3}e^{-{D \over 2}{{{n-1} \over {n}}\sum _{i=1}^{n}(x_{i}-x_{0})^{2}}}\;

(12.32)

P({\vec {x}}_{n})=F_{3}e^{-{D \over 2}\sum _{i=1}^{n}(x_{i}-{\overline {x}})^{2}}\;

(12.33)

A także ze wzoru na prawdopodobieństwo uzyskania średniej arytmetycznej w n pomiarach wynikającego ze wzoru (12.15):

P_{0}({\overline {x}})=Fe^{-D{\sum _{i=1}^{n}(x_{i}-x_{0})^{2}} \over {2}}=Fe^{-{{Dn} \over {2}}({\overline {x}}-x_{0})^{2}}\;

(12.34)

Wzór (12.34) jest również prawdopodobieństwem uzyskania średniej arytmetycznej ${\overline {x}}\;$ w doświadczeniu. W przypadku quasiciągłym i ciągłym prawdopodobieństwa zastępujemy gęstościami prawdopodobieństwa we wzorach (12.15) i (12.34), wtedy można powiedziać wywody, że według równości (12.15) mamy stałą D określoną przez (12.36) i z drugiej jednak strony stałą D można określić względem równości (12.34), wedle sposobu (12.35):

Dn={{1} \over {\sigma ^{2}({\overline {x}})}}

(12.35)

D={{1} \over {\sigma ^{2}(x)}}

(12.36)

Jeśli wzór (12.36) na stałą D podstawimy do wzoru (12.35), wtedy otrzymamy wyrażenie, które nadal będziemy przekształcać:

{{n} \over {\sigma ^{2}(x)}}={{1} \over {\sigma ^{2}({\overline {x}})}}\Rightarrow \sigma ({\overline {x}})={{\sigma (x)} \over {\sqrt {n}}}

(12.37)

Co zgadza się z wzorem (6.11), więc podejście (12.34) jest prawidłowe. Według obliczeń (12.37) wynika, że odchylenie standardowe średniej arytmetycznej jest równe odchyleniu standardowemu wyniku pomiaru podzielonej przez pierwiastek ilości wszystkich wyników pomiarów.

Wiadomo jednak, że wzory (12.33) i (12.34) oznaczają to samo, więc możemy je przyrównać, zatem mamy:

Fe^{-{D \over 2}{{{n-1} \over {n}}\sum _{i=1}^{n}(x_{i}-x_{0})^{2}}}=Fe^{-{D \over 2}\sum _{i=1}^{n}(x_{i}-{\overline {x}})^{2}}\;

(12.38)

Z różnowartości funkcji eksponencjalnej we wzorze (12.38) dostajemy równoważny do poprzedniego wzór, z którym troszkę go poprzekształcamy:

\sum _{i=1}^{n}{{n-1} \over n}(x_{i}-x_{0})^{2}=\sum _{i=1}^{n}(x_{i}-{\overline {x}})^{2}\Rightarrow {\sum _{i=1}^{n}{{1} \over {n}}(x_{i}-x_{0})^{2}}={1 \over {n-1}}\sum _{i=1}^{n}(x_{i}-{\overline {x}})^{2}\;

(12.39)

Gdy wyników pomiarów mamy nieskończenie wiele, wtedy ilość wyników pomiarów dla danego x podzielona przez ilość wszystkich wyników w doświadczeniu pokrywa się z infinitezymalnym prawdopodobieństwem uzyskania tego właśnie wyniku, zatem w przypadku granicznym lewa strona końcowej nierówności (12.39) staje się całką z wariancji po nieskończonym przedziale zmienności, zatem odchylenie standardowe wyniku pomiarowego, która jest pierwiastkiem wariancji charakteryzujących rozkład jest napisana wedle:

\sigma (x)={\sqrt {\sum _{i=1}^{n}({x_{i}-{\overline {x}})^{2}} \over {n-1}}}\;

(12.40)

W końcu odchylenie standardowe średniej arytmetycznej (12.37) otrzymamy podstawiając do niego wzór (12.40) i dostając na samym końcu wzór (6.18).

Rozkład normalny

Rozkład dla wyniku pomiarowego ścisłej jednej wartości x_i względem jej wartości dokładnej jest wyrażona:

P_{0}(x_{i})={{1} \over {{\sqrt {2\pi }}\sigma (x)}}e^{-{{(x_{i}-x_{0})^{2}} \over {2\sigma ^{2}(x)}}}\;

(12.41)

W zastosowaniach fizycznych często stosujemy wzór na gęstość prawdopodobieństwa uzyskania pomiaru względem wartości średniej arytmetycznej zastępując wartość dokładną średnią arytmetyczną w (12.41), czyli wyprowadźmy rozkład uzyskany z (12.21) dla pojedynczego pomiaru wykorzystując zależność na D (12.36) normując go do jedynki, który mówi jaka jest gęstość prawdopodobieństwa warunkowego względem prawdopodobieństwa uzyskania wartości średniej arytmetycznej, wtedy:

P(x_{i})=F_{30}e^{-{{(x_{i}-{\overline {x}})^{2}} \over {\sigma ^{2}(x)}}}\Rightarrow P(x_{i},{\overline {x}})={{P(x_{i})} \over {\int _{-\infty }^{\infty }P(x_{i})dx_{i}}}={{e^{-{{(x_{i}-{\overline {x}})^{2}} \over {2\sigma ^{2}(x)}}}} \over {\int _{-\infty }^{\infty }e^{-{{(x_{i}-{\overline {x}})^{2}} \over {2\sigma ^{2}(x)}}}dx_{i}}}={{e^{-{{(x_{i}-{\overline {x}})^{2}} \over {2\sigma ^{2}(x)}}}} \over {{\sqrt {2\pi }}\sigma (x)}}={{1} \over {{\sqrt {2\pi }}\sigma (x)}}e^{-{{(x_{i}-{\overline {x}})^{2}} \over {2\sigma ^{2}(x)}}}\Rightarrow

\Rightarrow P(x_{i},{\overline {x}})={{1} \over {{\sqrt {2\pi }}\sigma (x)}}e^{-{{(x_{i}-{\overline {x}})^{2}} \over {2\sigma ^{2}(x)}}}\;

(12.42)

Można udowodnić, że odchylenie standardowe pomiaru według wzoru (12.42) jest równe $\sigma (x)\;$ licząc tą niepewność względem wartości średniej arytmetycznej ${\overline {x}}\;$ , a nie wokół wartości dokładnej $x_{0}\;$ , licząc podobnie jak w punkcie (12.29). Wzory (12.41) i (12.42) są wartością gęstości prawdopodobieństwa dla pojedynczego wyniku pomiarowego zmiennej losowej statystycznej ciągłej wokół wartości dokładnej lub średniej arytmetycznej. Rozkład wartości doświadczalnej wokół wartości dokładnej serii wyników pomiarowych z liczby wszystkich wyników pomiarowych "n", korzystając przy tym ze wzoru (12.41), wyraża się:

P_{0}({\vec {x}}_{n})=\prod _{i=1}^{l}P_{0}(x_{i})={{1} \over {\left({\sqrt {2\pi }}\sigma (x)\right)^{n}}}e^{-{{\sum _{i=1}^{n}(x_{i}-x_{0})^{2}} \over {2\sigma ^{2}(x)}}}\;

(12.43)

W zastosowaniach fizycznych stosowany jest przede wszystkim wzór wynikający z (12.42), mówiący jaka jest gęstość prawdopodobieństwa warunkowego uzyskania n wyników pomiarów względem wartości średniej:

P({\vec {x}}_{n},{\overline {x}})=\prod _{i=1}^{n}P(x_{i},{\overline {x}})={{1} \over {\left({\sqrt {2\pi }}\sigma (x)\right)^{n}}}e^{-{{\sum _{i=1}^{n}(x_{i}-{\overline {x}})^{2}} \over {2\sigma ^{2}(x)}}}\;

(12.44)

Należy przy tym pamiętać, że we wzorach (12.43) oraz (12.44), wektor ${\vec {x}}_{n}\;$ może zawierać w sobie elementy powtarzające się więcej niż raz.

Obliczanie poszczególnych momentów statystycznych, wartość oczekiwana

Będziemy się tutaj zajmować wielkościami ciągłymi lub quasiciągłymi, której gęstość prawdopodobieństwa jest zdefiniowana według (12.31) . Momenty statystyczne ogólnie n-tego rzędu definiujemy według sposobu (3.12). Wykorzystując definicję momentu statystycznego μ_n, możemy policzyć jego wersję dla numerów nieparzystych, przy czym korzystając ze funkcja gęstości prawdopodobieństwa wspomniana wcześniej jest funkcją parzystą względem parametru x-x₀, zatem można powiedzieć przy założeniu, że wartość dokładna zmiennej x jest x₀, jest równa wartości oczekiwanej, tzn. ${\hat {x}}=x_{0}\;$ :

\gamma _{2n+1}=\int \limits _{-\infty }^{\infty }(x-x_{0})^{2n+1}\rho _{0}(x)dx=\left({{\int \limits _{-\infty }^{x_{0}}}+{\int \limits _{x_{0}}^{\infty }}}\right)(x-x_{0})^{2n+1}\rho _{0}(x)dx\;

(12.45)

Wykorzystujemy podstawienie t=x-x₀ w całce (12.45) możemy dojść do wniosku, że nasza całka posiada funkcję podcałkową funkcją nieparzystą względem omawianego podstawienia, dzięki czemu ta całka jest równa zero.

\mu _{2n+1}=\left({\int \limits _{-\infty }^{0}+\int \limits _{0}^{\infty }}\right)t^{2n+1}\rho _{0}(t)dt=\left({\int \limits _{\infty }^{0}+\int \limits _{0}^{\infty }}\right)t^{2n+1}\rho _{0}(t)dt=\left({-\int \limits _{0}^{\infty }+\int \limits _{0}^{\infty }}\right)t^{2n+1}\rho _{0}(t)dt=0\;

(12.46)

Czyli momenty statystyczne o nieparzystym stopniu są zawsze równe zero. Na podstawie obliczeń (12.46) udowodniliśmy rzeczywiście, że wartość oczekiwana jest równa wartości dokładnej dla rozkładu normalnego, bo parametr μ₁=0, tak jak powinno zachodzić dla pierwszego momentu statystycznego.

Obliczmy teraz momenty statystycznych o stopniu parzystym. Mając całki (12.26) i jej pochodną względem parametru α (12.27) możemy wyznaczyć dalszą pochodną całki (12.28), zatem ta ostatnia całka jest:

{\sqrt {\pi }}{1 \over 2}{3 \over 2}\alpha ^{-5 \over 2}=\int \limits _{-\infty }^{\infty }(x-x_{0})^{4}e^{-\alpha (x-x_{0})^{2}}\;

(12.47)

Przestawimy teraz całkę w postaci ogólnej, którą zapisujemy względem parametru n:

{\sqrt {\pi }}{{(2n-1)!!} \over {2^{n}}}\alpha ^{-{2n-1} \over {2}}=\int \limits _{-\infty }^{\infty }(x-x_{0})^{2n}e^{-\alpha (x-x_{0})^{2}}\;

(12.48)

Zatem moment statystyczny μ_2n możemy zapisać wedle schematu zależnego od parametru n.

{\sqrt {\pi }}{{(2n-1)!!} \over {2^{n}}}2^{n+{{1} \over {2}}}\sigma ^{2n+1}=\int \limits _{-\infty }^{\infty }(x-x_{0})^{2n}e^{-{(x-x_{0})^{2}} \over {2\sigma ^{2}}}=\mu _{2n}{\sqrt {2\pi }}\sigma \Rightarrow \mu _{2n}={(2n-1)!!}\sigma ^{2n}\;

(12.49)

Przy definicji momentu statystycznego względem wartości dokładnej (12.49) przyjmujemy (-1)!!=1, to wtedy obejmiemy również szczegół normowania gęstości prawdopodobieństwa dla n=0.

Punkt przegięcia w rozkładzie normalnym

Mamy oto rozkład normalny wyprowadzony w (12.31), ogólnie dla zmiennej typu dyskretnego-przypadek quasiciągłym, lub gdy nasz przedział badany jest dość gęsty, co również już na pewno jest spełnione w przypadku ciągłym naszej badanej wielkości. Zatem w celu wyznaczeniu punktu przegięcia wyznaczmy pierwszą pochodną naszej badanej funkcji gęstości prawdopodobieństwa:

{{d\rho _{0}(x)} \over {dx}}={{1} \over {{\sqrt {2\pi }}\sigma }}e^{-{{(x-x_{0})}^{2}} \over {2\sigma ^{2}}}(-2){{x-x_{0}} \over {2\sigma ^{2}}}\;

(12.50)

Oznaczamy w (12.50) przez C pewne stałe występujące w nim, zatem możemy policzyć drugą pochodną gęstości prawdopodobieństwa rozkładu normalnego, a więc pierwszą pochodną wspomnianej pierwszej pochodnej, zatem dochodzimy do wniosku:

{{d^{2}\rho _{0}} \over {dx^{2}}}=C\left[e^{-{{(x-x_{0})}^{2}} \over {2\sigma ^{2}}}\left(-2\right){{(x-x_{0})^{2}} \over {4\sigma ^{4}}}+e^{-{{(x-x_{0})}^{2}} \over {2\sigma ^{2}}}{{1} \over {2\sigma ^{2}}}\right]=Ce^{-{{(x-x_{0})}^{2}} \over {2\sigma ^{2}}}{{1} \over {2\sigma ^{2}}}\left[1-{{(x-x_{0})^{2}} \over {\sigma ^{2}}}\right]\;

(12.51)

Ponieważ liczymy punkty przegięcia funkcji Gausa rozkładu normalnego, względem drugiej pochodnej, która przyjmuje wartość zerową w tym przypadku, zatem na podstawie obliczeń (12.51) dostajemy wniosek:

1-{{(x-x_{0})^{2}} \over {\sigma ^{2}}}=0\;

(12.52)

W ostatecznych obliczeniach rozwiązanie wynikające z (12.52) jest:

x=x_{0}\pm \sigma \;

(12.53)

Stąd można z interpretować jako, że otrzymane x w obliczeniach powinno się mieścić w granicach x_i∈ (x₀-σ,x₀+σ), a te wyniki, które nie spełniają tego warunku, powinny być odrzucone z danych doświadczalnych, i odnowa trzeba wyznaczać ${\overline {x}}\;$ i σ. Przypominając przy liczeniu ρ(x) trzeba wstawić za x₀ jego wartość średnią, tzn. ${\overline {x}}\;$ , co dla dużej ilości wyników doświadczalnych jest w przybliżeniu spełniona równość między tymi dwoma wielkościami, ponieważ średnia arytmetyczna ma najmniejszą niepewność pomiarową z tych wszystkich otrzymanych x z danych doświadczalnych. Dla tych wyników doświadczenia, które nie powinny być odrzucone funkcja z punktu widzenia dla tego punktu powinna być wklęsła. Funkcja Gausa dla x∈ (x₀-σ,x₀+σ) jest funkcją wklęsłą, a dla dopełnienia wcześniej przedstawionego wzoru jest wypukła.