Brain-wiki - Wkład użytkownika [pl]

WnioskowanieStatystyczne/Test serii

2026-03-29T14:38:45Z

Durka: /* Pozostaje jeszcze rozważyć sytuację */

[[Wnioskowanie_Statystyczne_-_wykład]]

=Test serii Walda-Wolfowitza=

Serią nazywamy ciąg jednakowych elementów. W poniższym przykładzie
mamy sześć serii (po trzy serie zer i jedynek):
<center>
<math>\underline{1}\overline{00}\underline{1}\overline{00}\underline{111}
\overline{0}</math>
</center>
Nie jest to oczywiście jedyna kombinacja kolejności pięciu zer i pięciu jedynek,
dająca w wyniku sześć serii. Ponieważ każda pojedyncza kombinacja jest jednakowo
prawdopodobna (jeśli jest wynikiem niezależnych losowań), to prawdopodobieństwo
uzyskania danej liczby serii będzie tym większe, im więcej różnych kombinacji
będzie dawać w wyniku tę liczbę serii. Sformułujmy więc problem ogólnie:

<blockquote>
Mamy <math>N=n_1+n_2</math> elementów, w tym <math>n_1</math> zer i <math>n_2</math> jedynek.
Na ile sposobów możemy je rozłożyć, aby uzyskać <math>k</math> serii?
</blockquote>

{| role="presentation" class="wikitable mw-collapsible mw-collapsed"
| kod 
|-
| <pre>

import matplotlib.pyplot as plt
import numpy

n1=25 # zera
n2=30 # jedynki
n=n1+n2
ile_losowan=1000

wynik=numpy.zeros(ile_losowan, dtype=numpy.int32)

for i in range(0, ile_losowan):
losowanie=numpy.zeros(n, dtype=numpy.int32)
while numpy.sum(losowanie) < n2:
losowanie[numpy.random.randint(0,n)]=1
#print(numpy.array_str(losowanie,max_line_width=numpy.inf).replace(" ",""), "\n")
zmiany=1
for j in range(1, n):
if(losowanie[j] != losowanie[j-1]):
zmiany += 1
wynik[i]=zmiany

plt.hist(wynik, bins=range(0,n))
plt.xlabel("$k$")
plt.ylabel("$P(k)$")
plt.title(f"$n_1$ = {n1}, $n_2$ = {n2}, {ile_losowan} losowań")
plt.show()
</pre>
|}

{| role="presentation" class="wikitable mw-collapsible mw-collapsed"
| animacja dla 1000 
|-
|[[Plik:Testserii1000.png|center|thumb|600px|<figure id="fig:132"></figure>Histogram liczby serii <math>k</math> w <math>10^3</math> niezależnych losowaniach 30 zer i 25 jedynek.]]
|}

[[Plik:Testserii.png|center|thumb|600px|<figure id="fig:132"></figure>Histogram liczby serii <math>k</math> w <math>10^5</math> niezależnych losowaniach 30 zer i 25 jedynek.]]
[[Plik:Testserii_10.9.png|center|thumb|600px|<figure id="fig:132"></figure>Histogram liczby serii <math>k</math> w <math>10^9</math> niezależnych losowaniach 30 zer i 25 jedynek.]]
[[Plik:Testserii_10.9.log.png|center|thumb|600px|<figure id="fig:132"></figure>Histogram liczby serii <math>k</math> w <math>10^9</math> niezależnych losowaniach 30 zer i 25 jedynek (skala logarytmiczna).]]



==Wyprowadzenie analityczne==

Wróćmy do prostszego przykładu, zawierającego pięć jedynek i pięć zer.
Podział na serie możemy interpretować jak przypisanie liczbom od jeden do dziesięciu
(pozycje w ciągu) zera lub jedynki:
<center>
{| class="wikitable"
|-
|'''1'''
|'''0'''
|'''0'''
|'''1'''
|'''0'''
|'''0'''
|'''1'''
|'''1'''
|'''1'''
|'''0'''
|-
|1
|2
|3
|4
|5
|6
|7
|8
|9
|10
|}
</center>

Inaczej mówiąc, konkretny ciąg <math>N</math> zer i jedynek wyznaczony
jest przez wylosowanie spośród liczb od jednego do <math>N</math> tych
liczb, którym mają być przypisane jedynki (pozostałym będą przypisane
zera — lub odwrotnie). Czyli wszystkich możliwych ciągów
<math>n_1</math> zer i <math>n_2</math> jedynek będzie tyle, na ile
sposobów można wylosować <math>n_1</math> elementów spośród
<math>N</math>. Policzmy: pozycję (czyli numer, wypisany w dolnym
rzędzie powyższej tabeli) pierwszego elementu losujemy spośród
<math>N</math> możliwości, drugiego — spośród <math>N-1</math>
pozostałych możliwości (jedna pozycja jest już zajęta), i tak dalej,
aż pozycję ostatniego z <math>n_1</math> elementów losujemy spośród
<math>N-n_1</math> pozostałych możliwości. Liczba możliwych wyników
będzie iloczynem tych wszystkich liczb, czyli wyniesie
<math>N\cdot(N-1)\cdot(N-2)\cdot\ \dots\ \cdot (N-n_1) =
N!/(N-n_1)!</math> Skoro wszystkie jedynki są jednakowe i nie
rozróżniamy wyników różniących się ich kolejnością, to wynik ten
musimy podzielić przez liczbę różnych ustawień kolejności elementów
(liczbę permutacji) zbioru <math>n_1</math>-elementowego. Wyniesie ona
<math>n_1\cdot(n_1-1)\cdot\ \dots\ \cdot 1</math>, czyli
<math>n_1!</math> Ostatecznie jako liczbę różnych ustawień
<math>n_1</math> zer i <math>N-n_1</math> jedynek dostajemy:

<center>
<math>\displaystyle
\frac{N!}{(N-n_1)!\ n_1!} = \binom{N}{n_1}
</math>
</center>

Jest to znany z [[WnioskowanieStatystyczne/Rozklady-przyklady#Rozkład dwumianowy|rozdziału o rozkładzie dwumianowym]] symbol Newtona <math>\binom{N}{n_1}</math>. Jego własności
symetrii zgadzają się z sytuacją, w ktorej "wybierać" możemy albo <math>n_1</math> zer
albo <math>n_2</math> jedynek:

<center><math>\displaystyle
\binom{N}{n_1}=\binom{n_1+n_2}{n_1}=\frac{(n_1+n_2)!}{n_1! n_2!}=\binom{n_1+n_2}{n_2}=\binom{N}{n_2}
</math></center>

Pozostaje policzyć, ile z tych możliwości (przy ustalonych liczbach
<math>n_1</math> jedynek i <math>n_2</math> zer) wygeneruje ciąg
wyników, w którym będzie dokładnie <math>k</math> serii?

<center>
<math>\displaystyle\underline{1}\overline{00}\underline{1}\overline{00}\underline{111}
\overline{0}</math>
</center>

===Jeśli liczba serii <math>k</math> jest parzysta===
będziemy mieć tyle samo serii jedynek i zer (po <math>k/2</math>). Aby rozmieścić <math>n_1</math> jedynek w <math>k/2</math> seriach musimy wyznaczyć <math>k/2-1</math> punktów podziału na serie; w powyższym przykładzie będą to (kropki) '''1.1.111''' — było 6 serii, więc mamy 2 punkty podziału. Inaczej losujemy spośród <math>n_1-1</math> możliwych punktów podziału <math>k/2-1</math> podziałów, jak wynika z liczby serii <math>k</math>. Daje to <math>\binom{n_1-1}{k/2-1}</math> możliwości. W miejsca podziału (oznaczone kropkami) wstawiamy serie zer; analogicznie możemy to zrobić na <math>\binom{n_2-1}{k/2-1}</math> możliwości (w przykładzie: '''00.00.0'''). Liczbę tę należy pomnożyć przez dwa ze względu na możliwość zamiany miejscami zer i jedynek. Prawdopodobieństwo danej liczby serii dostaniemy — zgodnie z klasyczną definicją prawdopodobieństwa — dzieląc liczbę wszystkich tych kombinacji <math>n_1</math> jedynek i <math>n_2</math> zer, które generują dokładnie <math>k</math> serii, przez liczbę wszystkich możliwych kombinacji:

<center>
<math>\displaystyle
P=\frac{ 2\binom{n_1-1}{k/2-1} \binom{n_2-1}{k/2-1}} { \binom{N}{n_1}} \qquad\textrm{dla }\ k\ \textrm{parzystych.}
</math>
</center>

===Jeśli liczba serii <math>k</math> jest nieparzysta===
którychś serii — zer lub jedynek — będzie dokładnie o jeden więcej. <equation id="eq:127"></equation>

<center>
<math>\displaystyle\underline{1}\overline{00}\underline{1}\overline{000}\underline{111}
</math>
</center>

'''Jeśli więcej jest serii jedynek''', mamy <math>(k-1)/2</math> serii zer i <math>(k-1)/2+1</math> serii jedynek. <math>n_1</math> jedynek dzielimy na <math>(k-1)/2+1</math> serii, czyli wyznaczamy <math>(k-1)/2</math> punktów podziału spośród <math>n_1-1</math> możliwych — daje to <math>\binom{n_1-1}{(k-1)/2}</math> możliwości. Z kolei <math>n_2</math> zer dzielimy na <math>(k-1)/2</math> serii, co daje <math>\binom{n_2-1}{(k-1)/2-1}</math> możliwości. Iloczyn tych dwóch wielkości określa liczbę możliwości dających <math>k</math> serii, jeśli więcej jest serii jedynek:

<center>
<equation id="eq:128"><math>\displaystyle \binom{n_1-1}{(k-1)/2} \binom{n_2-1}{(k-1)/2-1} </math></equation>
</center>

'''Jeśli więcej jest serii zer''', to na drodze analogicznego rozumowania dostajemy

<center>
<equation id="eq:129"><math>\displaystyle \binom{n_1-1}{(k-1)/2-1} \binom{n_2-1}{(k-1)/2} </math></equation>
</center>

Prawdopodobieństwo dla przypadku nieparzystej liczby serii będzie sumą tych dwóch wielkości, podzieloną, jak w przypadku parzystego <math>k</math>, przez liczbę wszystkich możliwości:

<center>
<equation id="eq:130">
<math>\displaystyle
P=\frac{\binom{n_1-1}{(k-1)/2} \binom{n_2-1}{(k-1)/2-1} +
\binom{n_1-1}{(k-1)/2-1} \binom{n_2-1}{(k-1)/2}}
{{\binom{N}{n_1}}}
</math></equation>
</center>
dla <math>k</math> nieparzystych.

===Pozostaje jeszcze rozważyć sytuację===
w której liczba serii jest nieparzysta, jak w punkcie 2., ale mniej liczne
elementy rozłożone są wyłącznie w serie jednoelementowe, na przykład
001010010100, czyli liczba serii wynosi <math>2n+1</math>, gdzie
<math>n</math> jest liczbą mniej licznych elementów (w tym
przykładzie jedynek). Wtedy znika jeden ze składników sumy z licznika
powyższego równania, gdyż zachodzić może wyłącznie
przypadek 2.1 lub 2.2.

Ostatecznie dostajemy następujący wzór na
prawdopodobieństwo wystąpienia <math>k</math> serii w próbie, w której
drogą niezależnych losowań wylosowano <math>n_1</math> zer i
<math>n_2</math> jedynek:

<center>
<equation id="eq:131">
<math>\displaystyle
P(k\mid n_1, n_2)=\begin{cases}
\frac{ 2\binom{n_1-1}{k/2-1} \binom{n_2-1}{k/2-1}}
{ \binom{N}{n_1}}
\qquad\qquad\qquad\qquad \textrm{dla }\ k\ \textrm{ parzystych}
\\
\frac{
\binom{n_1-1}{(k-1)/2} \binom{n_2-1}{(k-1)/2-1} +
\binom{n_1-1}{(k-1)/2-1} \binom{n_2-1}{(k-1)/2}
}
{{ \binom{N}{n_1}}}
\quad \textrm{dla }\ k\ \textrm{ nieparzystych}
\\
\frac{
\binom{n_\textrm{max}-1}{(k-1)/2}
}
{{ \binom{N}{(k-1)/2}}}
\ \quad\qquad\qquad\qquad\qquad \textrm{dla }\ k\ \textrm{ nieparzystych i }
n_\textrm{min}=\frac{k-1}{2},
\end{cases}
</math></equation>
</center>

gdzie <math>n_\textrm{min}=\min(n_1, n_2)</math> i
<math>n_\textrm{max}=\max(n_1, n_2)</math>.

Wzór ten określa rozkład statystyki, będącej liczbą serii w próbie złożonej
z dowolnych dwóch rodzajów elementów (oznaczanych powyżej jako '''0''' i '''1'''). Dzięki niemu możemy wreszcie skonstruować kompletny test hipotezy
mówiącej, że dany ciąg jest wynikiem niezależnych losowań. Przypomnijmy dane
z [[WnioskowanieStatystyczne/Testy_nieprametryczne|przykładu o nieuczciwym ankieterze]]:

<center>
'''1101101000101001011101101111010110010101001010100011101'''
</center>

W ciągu tym występuje 25 zer i 30 jedynek, układających się w 37
serii. Na podstawie wzoru <xr id="eq:131">(%i)</xr> możemy obliczyć
rozkład prawdopodobieństwa wylosowania ciągu 25 zer i 30 jedynek, w
którym będzie <math>k</math> serii. Możliwe wartości <math>k</math>
będą w tym przypadku zawierać się między 2 (jedna seria zer i jedna
jedynek) a 51 (ponieważ mniej jest zer, największa liczba serii
odpowiada przypadkowi, w którym wszystkie zera układają się w serie
jednoelementowe). Rozkład prawdopodobieństwa dla tego przypadku
przedstawia poniższy rysunek.

[[Plik:serie.png|center|thumb|600px|<figure id="fig:132"></figure>Rozkład prawdopodobieństw <math>P(k)</math> liczby serii <math>k</math> w niezależnym losowaniu 30 zer i 25 jedynek.]]

Zastosowania testów opartych na tej statystyce nie ograniczają się do
analizy ciągów zer i jedynek (lub innych dwóch elementów). Poniżej
przedstawiamy jeszcze dwa testy korzystające ze statystyki <xr
id="eq:131">(%i)</xr>.

==Testowanie, czy próba jest wynikiem niezależnych losowań==

Podobny problem — pytanie, czy elementy próby są wynikiem
niezależnych losowań — występuje np. przy testowaniu generatorów
liczb losowych ([[WnioskowanieStatystyczne/Z_komputerem#cite_note-0|będących kluczowym
elementem metod opisywanych w pierwszej części książki]]). Jednak w
tej sytuacji mamy do czynienia z ciągiem dowolnych liczb, a nie dwóch
symboli.

Pomysł jest prosty: ciąg wyników wyrażających się dowolnymi liczbami
możemy zamienić na ciąg zer i jedynek, wybierając próg <math>M</math>
i przypisując wynikom większym od <math>M</math> jedynkę, a mniejszym
— zero. Jeśli chcemy mieć tyle samo zer i jedynek, jako
<math>M</math> możemy wziąć [[WnioskowanieStatystyczne/Momenty#Mediana|medianę]] próby. Do
takiej serii możemy już z powodzeniem stosować opisany w poprzednim
rozdziale test oparty na statystyce <xr id="eq:131">(%i)</xr> —
oczywiście zachowując kolejność elementów w próbie.

==Test zgodności rozkładów w dwóch populacjach==

Mamy dwie próby. Hipoteza zerowa mówi, że zostały wylosowane z tego
samego rozkładu. Ciąg zer i jedynek tworzymy w następujący sposób:

Elementy obu prób ustawiamy w jeden ciąg w kolejności od najmniejszej
do największej<ref>Jeśli wartości losowane są z rozkładów ciągłych, to
wystąpienie jednakowych wartości jest teoretycznie niemożliwe. W
praktyce wartości zapisujemy ze skończoną dokładnością; zwykle
przyjmuje się, że jednakowe wartości można pominąć.</ref>. Elementom
pierwszej próby przypisujemy jedynki, a drugiej — zera.

Jeśli obie próby losowano z tej samej populacji, to liczba serii w tak określonym
ciągu podlega statystyce <xr
id="eq:131">(%i)</xr>, czyli ponownie możemy
stosować test Walda-Wolfowitza.

---------------
<references>

WnioskowanieStatystyczne/Test serii

2026-03-29T14:35:21Z

Durka: /* Pozostaje jeszcze rozważyć sytuację */

[[Wnioskowanie_Statystyczne_-_wykład]]

=Test serii Walda-Wolfowitza=

Serią nazywamy ciąg jednakowych elementów. W poniższym przykładzie
mamy sześć serii (po trzy serie zer i jedynek):
<center>
<math>\underline{1}\overline{00}\underline{1}\overline{00}\underline{111}
\overline{0}</math>
</center>
Nie jest to oczywiście jedyna kombinacja kolejności pięciu zer i pięciu jedynek,
dająca w wyniku sześć serii. Ponieważ każda pojedyncza kombinacja jest jednakowo
prawdopodobna (jeśli jest wynikiem niezależnych losowań), to prawdopodobieństwo
uzyskania danej liczby serii będzie tym większe, im więcej różnych kombinacji
będzie dawać w wyniku tę liczbę serii. Sformułujmy więc problem ogólnie:

<blockquote>
Mamy <math>N=n_1+n_2</math> elementów, w tym <math>n_1</math> zer i <math>n_2</math> jedynek.
Na ile sposobów możemy je rozłożyć, aby uzyskać <math>k</math> serii?
</blockquote>

{| role="presentation" class="wikitable mw-collapsible mw-collapsed"
| kod 
|-
| <pre>

import matplotlib.pyplot as plt
import numpy

n1=25 # zera
n2=30 # jedynki
n=n1+n2
ile_losowan=1000

wynik=numpy.zeros(ile_losowan, dtype=numpy.int32)

for i in range(0, ile_losowan):
losowanie=numpy.zeros(n, dtype=numpy.int32)
while numpy.sum(losowanie) < n2:
losowanie[numpy.random.randint(0,n)]=1
#print(numpy.array_str(losowanie,max_line_width=numpy.inf).replace(" ",""), "\n")
zmiany=1
for j in range(1, n):
if(losowanie[j] != losowanie[j-1]):
zmiany += 1
wynik[i]=zmiany

plt.hist(wynik, bins=range(0,n))
plt.xlabel("$k$")
plt.ylabel("$P(k)$")
plt.title(f"$n_1$ = {n1}, $n_2$ = {n2}, {ile_losowan} losowań")
plt.show()
</pre>
|}

{| role="presentation" class="wikitable mw-collapsible mw-collapsed"
| animacja dla 1000 
|-
|[[Plik:Testserii1000.png|center|thumb|600px|<figure id="fig:132"></figure>Histogram liczby serii <math>k</math> w <math>10^3</math> niezależnych losowaniach 30 zer i 25 jedynek.]]
|}

[[Plik:Testserii.png|center|thumb|600px|<figure id="fig:132"></figure>Histogram liczby serii <math>k</math> w <math>10^5</math> niezależnych losowaniach 30 zer i 25 jedynek.]]
[[Plik:Testserii_10.9.png|center|thumb|600px|<figure id="fig:132"></figure>Histogram liczby serii <math>k</math> w <math>10^9</math> niezależnych losowaniach 30 zer i 25 jedynek.]]
[[Plik:Testserii_10.9.log.png|center|thumb|600px|<figure id="fig:132"></figure>Histogram liczby serii <math>k</math> w <math>10^9</math> niezależnych losowaniach 30 zer i 25 jedynek (skala logarytmiczna).]]



==Wyprowadzenie analityczne==

Wróćmy do prostszego przykładu, zawierającego pięć jedynek i pięć zer.
Podział na serie możemy interpretować jak przypisanie liczbom od jeden do dziesięciu
(pozycje w ciągu) zera lub jedynki:
<center>
{| class="wikitable"
|-
|'''1'''
|'''0'''
|'''0'''
|'''1'''
|'''0'''
|'''0'''
|'''1'''
|'''1'''
|'''1'''
|'''0'''
|-
|1
|2
|3
|4
|5
|6
|7
|8
|9
|10
|}
</center>

Inaczej mówiąc, konkretny ciąg <math>N</math> zer i jedynek wyznaczony
jest przez wylosowanie spośród liczb od jednego do <math>N</math> tych
liczb, którym mają być przypisane jedynki (pozostałym będą przypisane
zera — lub odwrotnie). Czyli wszystkich możliwych ciągów
<math>n_1</math> zer i <math>n_2</math> jedynek będzie tyle, na ile
sposobów można wylosować <math>n_1</math> elementów spośród
<math>N</math>. Policzmy: pozycję (czyli numer, wypisany w dolnym
rzędzie powyższej tabeli) pierwszego elementu losujemy spośród
<math>N</math> możliwości, drugiego — spośród <math>N-1</math>
pozostałych możliwości (jedna pozycja jest już zajęta), i tak dalej,
aż pozycję ostatniego z <math>n_1</math> elementów losujemy spośród
<math>N-n_1</math> pozostałych możliwości. Liczba możliwych wyników
będzie iloczynem tych wszystkich liczb, czyli wyniesie
<math>N\cdot(N-1)\cdot(N-2)\cdot\ \dots\ \cdot (N-n_1) =
N!/(N-n_1)!</math> Skoro wszystkie jedynki są jednakowe i nie
rozróżniamy wyników różniących się ich kolejnością, to wynik ten
musimy podzielić przez liczbę różnych ustawień kolejności elementów
(liczbę permutacji) zbioru <math>n_1</math>-elementowego. Wyniesie ona
<math>n_1\cdot(n_1-1)\cdot\ \dots\ \cdot 1</math>, czyli
<math>n_1!</math> Ostatecznie jako liczbę różnych ustawień
<math>n_1</math> zer i <math>N-n_1</math> jedynek dostajemy:

<center>
<math>\displaystyle
\frac{N!}{(N-n_1)!\ n_1!} = \binom{N}{n_1}
</math>
</center>

Jest to znany z [[WnioskowanieStatystyczne/Rozklady-przyklady#Rozkład dwumianowy|rozdziału o rozkładzie dwumianowym]] symbol Newtona <math>\binom{N}{n_1}</math>. Jego własności
symetrii zgadzają się z sytuacją, w ktorej "wybierać" możemy albo <math>n_1</math> zer
albo <math>n_2</math> jedynek:

<center><math>\displaystyle
\binom{N}{n_1}=\binom{n_1+n_2}{n_1}=\frac{(n_1+n_2)!}{n_1! n_2!}=\binom{n_1+n_2}{n_2}=\binom{N}{n_2}
</math></center>

Pozostaje policzyć, ile z tych możliwości (przy ustalonych liczbach
<math>n_1</math> jedynek i <math>n_2</math> zer) wygeneruje ciąg
wyników, w którym będzie dokładnie <math>k</math> serii?

<center>
<math>\displaystyle\underline{1}\overline{00}\underline{1}\overline{00}\underline{111}
\overline{0}</math>
</center>

===Jeśli liczba serii <math>k</math> jest parzysta===
będziemy mieć tyle samo serii jedynek i zer (po <math>k/2</math>). Aby rozmieścić <math>n_1</math> jedynek w <math>k/2</math> seriach musimy wyznaczyć <math>k/2-1</math> punktów podziału na serie; w powyższym przykładzie będą to (kropki) '''1.1.111''' — było 6 serii, więc mamy 2 punkty podziału. Inaczej losujemy spośród <math>n_1-1</math> możliwych punktów podziału <math>k/2-1</math> podziałów, jak wynika z liczby serii <math>k</math>. Daje to <math>\binom{n_1-1}{k/2-1}</math> możliwości. W miejsca podziału (oznaczone kropkami) wstawiamy serie zer; analogicznie możemy to zrobić na <math>\binom{n_2-1}{k/2-1}</math> możliwości (w przykładzie: '''00.00.0'''). Liczbę tę należy pomnożyć przez dwa ze względu na możliwość zamiany miejscami zer i jedynek. Prawdopodobieństwo danej liczby serii dostaniemy — zgodnie z klasyczną definicją prawdopodobieństwa — dzieląc liczbę wszystkich tych kombinacji <math>n_1</math> jedynek i <math>n_2</math> zer, które generują dokładnie <math>k</math> serii, przez liczbę wszystkich możliwych kombinacji:

<center>
<math>\displaystyle
P=\frac{ 2\binom{n_1-1}{k/2-1} \binom{n_2-1}{k/2-1}} { \binom{N}{n_1}} \qquad\textrm{dla }\ k\ \textrm{parzystych.}
</math>
</center>

===Jeśli liczba serii <math>k</math> jest nieparzysta===
którychś serii — zer lub jedynek — będzie dokładnie o jeden więcej. <equation id="eq:127"></equation>

<center>
<math>\displaystyle\underline{1}\overline{00}\underline{1}\overline{000}\underline{111}
</math>
</center>

'''Jeśli więcej jest serii jedynek''', mamy <math>(k-1)/2</math> serii zer i <math>(k-1)/2+1</math> serii jedynek. <math>n_1</math> jedynek dzielimy na <math>(k-1)/2+1</math> serii, czyli wyznaczamy <math>(k-1)/2</math> punktów podziału spośród <math>n_1-1</math> możliwych — daje to <math>\binom{n_1-1}{(k-1)/2}</math> możliwości. Z kolei <math>n_2</math> zer dzielimy na <math>(k-1)/2</math> serii, co daje <math>\binom{n_2-1}{(k-1)/2-1}</math> możliwości. Iloczyn tych dwóch wielkości określa liczbę możliwości dających <math>k</math> serii, jeśli więcej jest serii jedynek:

<center>
<equation id="eq:128"><math>\displaystyle \binom{n_1-1}{(k-1)/2} \binom{n_2-1}{(k-1)/2-1} </math></equation>
</center>

'''Jeśli więcej jest serii zer''', to na drodze analogicznego rozumowania dostajemy

<center>
<equation id="eq:129"><math>\displaystyle \binom{n_1-1}{(k-1)/2-1} \binom{n_2-1}{(k-1)/2} </math></equation>
</center>

Prawdopodobieństwo dla przypadku nieparzystej liczby serii będzie sumą tych dwóch wielkości, podzieloną, jak w przypadku parzystego <math>k</math>, przez liczbę wszystkich możliwości:

<center>
<equation id="eq:130">
<math>\displaystyle
P=\frac{\binom{n_1-1}{(k-1)/2} \binom{n_2-1}{(k-1)/2-1} +
\binom{n_1-1}{(k-1)/2-1} \binom{n_2-1}{(k-1)/2}}
{{\binom{N}{n_1}}}
</math></equation>
</center>
dla <math>k</math> nieparzystych.

===Pozostaje jeszcze rozważyć sytuację===
w której liczba serii jest nieparzysta, jak w punkcie 2., ale mniej liczne
elementy rozłożone są wyłącznie w serie jednoelementowe, na przykład
001010010100, czyli liczba serii wynosi <math>2n+1</math>, gdzie
<math>n</math> jest liczbą mniej licznych elementów (w tym
przykładzie jedynek). Wtedy znika jeden ze składników sumy z licznika
powyższego równania, gdyż zachodzić może wyłącznie
przypadek 2.1 lub 2.2.

Ostatecznie dostajemy następujący wzór na
prawdopodobieństwo wystąpienia <math>k</math> serii w próbie, w której
drogą niezależnych losowań wylosowano <math>n_1</math> zer i
<math>n_2</math> jedynek:

<center>
<equation id="eq:131">
<math>\displaystyle
P(k\mid n_1, n_2)=\begin{cases}
\frac{ 2\binom{n_1-1}{k/2-1} \binom{n_2-1}{k/2-1}}
{ \binom{N}{n_1}}
\qquad\qquad\qquad\qquad \textrm{dla }\ k\ \textrm{ parzystych}
\\
\frac{
\binom{n_1-1}{(k-1)/2} \binom{n_2-1}{(k-1)/2-1} +
\binom{n_1-1}{(k-1)/2-1} \binom{n_2-1}{(k-1)/2}
}
{{ \binom{N}{n_1}}}
\quad \textrm{dla }\ k\ \textrm{ nieparzystych}
\\
\frac{
\binom{n_\textrm{max}-1}{(k-1)/2}
}
{{ \binom{N}{(k-1)/2}}}
\ \quad\qquad\qquad\qquad\qquad \textrm{dla }\ k\ \textrm{ nieparzystych i }
n_\textrm{min}=\frac{k-1}{2},
\end{cases}
</math></equation>
</center>

gdzie <math>n_\textrm{min}=\min(n_1, n_2)</math> i
<math>n_\textrm{max}=\max(n_1, n_2)</math>.

Wzór ten określa rozkład statystyki, będącej liczbą serii w próbie złożonej
z dowolnych dwóch rodzajów elementów (oznaczanych powyżej jako '''0''' i '''1'''). Dzięki niemu możemy wreszcie skonstruować kompletny test hipotezy
mówiącej, że dany ciąg jest wynikiem niezależnych losowań. Przypomnijmy dane
z [[WnioskowanieStatystyczne/Testy_nieprametryczne|przykładu o nieuczciwym ankieterze]]:

<center>
'''1101101000101001011101101111010110010101001010100011101'''
</center>

W ciągu tym występuje 25 zer i 30 jedynek, układających się w 37
serii. Na podstawie wzoru <xr id="eq:131">(%i)</xr> możemy obliczyć
rozkład prawdopodobieństwa wylosowania ciągu 25 zer i 30 jedynek, w
którym będzie <math>k</math> serii. Możliwe wartości <math>k</math>
będą w tym przypadku zawierać się między 2 (jedna seria zer i jedna
jedynek) a 51 (ponieważ mniej jest zer, największa liczba serii
odpowiada przypadkowi, w którym wszystkie zera układają się w serie
jednoelementowe). Rozkład prawdopodobieństwa dla tego przypadku
przedstawia rysunek <xr id="fig:132"> %i</xr>.

[[Plik:serie.png|center|thumb|600px|<figure id="fig:132"></figure>Rozkład prawdopodobieństw <math>P(k)</math> liczby serii <math>k</math> w niezależnym losowaniu 30 zer i 25 jedynek.]]

Zastosowania testów opartych na tej statystyce nie ograniczają się do
analizy ciągów zer i jedynek (lub innych dwóch elementów). Poniżej
przedstawiamy jeszcze dwa testy korzystające ze statystyki <xr
id="eq:131">(%i)</xr>.

==Testowanie, czy próba jest wynikiem niezależnych losowań==

Podobny problem — pytanie, czy elementy próby są wynikiem
niezależnych losowań — występuje np. przy testowaniu generatorów
liczb losowych ([[WnioskowanieStatystyczne/Z_komputerem#cite_note-0|będących kluczowym
elementem metod opisywanych w pierwszej części książki]]). Jednak w
tej sytuacji mamy do czynienia z ciągiem dowolnych liczb, a nie dwóch
symboli.

Pomysł jest prosty: ciąg wyników wyrażających się dowolnymi liczbami
możemy zamienić na ciąg zer i jedynek, wybierając próg <math>M</math>
i przypisując wynikom większym od <math>M</math> jedynkę, a mniejszym
— zero. Jeśli chcemy mieć tyle samo zer i jedynek, jako
<math>M</math> możemy wziąć [[WnioskowanieStatystyczne/Momenty#Mediana|medianę]] próby. Do
takiej serii możemy już z powodzeniem stosować opisany w poprzednim
rozdziale test oparty na statystyce <xr id="eq:131">(%i)</xr> —
oczywiście zachowując kolejność elementów w próbie.

==Test zgodności rozkładów w dwóch populacjach==

Mamy dwie próby. Hipoteza zerowa mówi, że zostały wylosowane z tego
samego rozkładu. Ciąg zer i jedynek tworzymy w następujący sposób:

Elementy obu prób ustawiamy w jeden ciąg w kolejności od najmniejszej
do największej<ref>Jeśli wartości losowane są z rozkładów ciągłych, to
wystąpienie jednakowych wartości jest teoretycznie niemożliwe. W
praktyce wartości zapisujemy ze skończoną dokładnością; zwykle
przyjmuje się, że jednakowe wartości można pominąć.</ref>. Elementom
pierwszej próby przypisujemy jedynki, a drugiej — zera.

Jeśli obie próby losowano z tej samej populacji, to liczba serii w tak określonym
ciągu podlega statystyce <xr
id="eq:131">(%i)</xr>, czyli ponownie możemy
stosować test Walda-Wolfowitza.

---------------
<references>

WnioskowanieStatystyczne/Test serii

2026-03-29T14:33:54Z

Durka: /* Pozostaje jeszcze rozważyć sytuację */

[[Wnioskowanie_Statystyczne_-_wykład]]

=Test serii Walda-Wolfowitza=

Serią nazywamy ciąg jednakowych elementów. W poniższym przykładzie
mamy sześć serii (po trzy serie zer i jedynek):
<center>
<math>\underline{1}\overline{00}\underline{1}\overline{00}\underline{111}
\overline{0}</math>
</center>
Nie jest to oczywiście jedyna kombinacja kolejności pięciu zer i pięciu jedynek,
dająca w wyniku sześć serii. Ponieważ każda pojedyncza kombinacja jest jednakowo
prawdopodobna (jeśli jest wynikiem niezależnych losowań), to prawdopodobieństwo
uzyskania danej liczby serii będzie tym większe, im więcej różnych kombinacji
będzie dawać w wyniku tę liczbę serii. Sformułujmy więc problem ogólnie:

<blockquote>
Mamy <math>N=n_1+n_2</math> elementów, w tym <math>n_1</math> zer i <math>n_2</math> jedynek.
Na ile sposobów możemy je rozłożyć, aby uzyskać <math>k</math> serii?
</blockquote>

{| role="presentation" class="wikitable mw-collapsible mw-collapsed"
| kod 
|-
| <pre>

import matplotlib.pyplot as plt
import numpy

n1=25 # zera
n2=30 # jedynki
n=n1+n2
ile_losowan=1000

wynik=numpy.zeros(ile_losowan, dtype=numpy.int32)

for i in range(0, ile_losowan):
losowanie=numpy.zeros(n, dtype=numpy.int32)
while numpy.sum(losowanie) < n2:
losowanie[numpy.random.randint(0,n)]=1
#print(numpy.array_str(losowanie,max_line_width=numpy.inf).replace(" ",""), "\n")
zmiany=1
for j in range(1, n):
if(losowanie[j] != losowanie[j-1]):
zmiany += 1
wynik[i]=zmiany

plt.hist(wynik, bins=range(0,n))
plt.xlabel("$k$")
plt.ylabel("$P(k)$")
plt.title(f"$n_1$ = {n1}, $n_2$ = {n2}, {ile_losowan} losowań")
plt.show()
</pre>
|}

{| role="presentation" class="wikitable mw-collapsible mw-collapsed"
| animacja dla 1000 
|-
|[[Plik:Testserii1000.png|center|thumb|600px|<figure id="fig:132"></figure>Histogram liczby serii <math>k</math> w <math>10^3</math> niezależnych losowaniach 30 zer i 25 jedynek.]]
|}

[[Plik:Testserii.png|center|thumb|600px|<figure id="fig:132"></figure>Histogram liczby serii <math>k</math> w <math>10^5</math> niezależnych losowaniach 30 zer i 25 jedynek.]]
[[Plik:Testserii_10.9.png|center|thumb|600px|<figure id="fig:132"></figure>Histogram liczby serii <math>k</math> w <math>10^9</math> niezależnych losowaniach 30 zer i 25 jedynek.]]
[[Plik:Testserii_10.9.log.png|center|thumb|600px|<figure id="fig:132"></figure>Histogram liczby serii <math>k</math> w <math>10^9</math> niezależnych losowaniach 30 zer i 25 jedynek (skala logarytmiczna).]]



==Wyprowadzenie analityczne==

Wróćmy do prostszego przykładu, zawierającego pięć jedynek i pięć zer.
Podział na serie możemy interpretować jak przypisanie liczbom od jeden do dziesięciu
(pozycje w ciągu) zera lub jedynki:
<center>
{| class="wikitable"
|-
|'''1'''
|'''0'''
|'''0'''
|'''1'''
|'''0'''
|'''0'''
|'''1'''
|'''1'''
|'''1'''
|'''0'''
|-
|1
|2
|3
|4
|5
|6
|7
|8
|9
|10
|}
</center>

Inaczej mówiąc, konkretny ciąg <math>N</math> zer i jedynek wyznaczony
jest przez wylosowanie spośród liczb od jednego do <math>N</math> tych
liczb, którym mają być przypisane jedynki (pozostałym będą przypisane
zera — lub odwrotnie). Czyli wszystkich możliwych ciągów
<math>n_1</math> zer i <math>n_2</math> jedynek będzie tyle, na ile
sposobów można wylosować <math>n_1</math> elementów spośród
<math>N</math>. Policzmy: pozycję (czyli numer, wypisany w dolnym
rzędzie powyższej tabeli) pierwszego elementu losujemy spośród
<math>N</math> możliwości, drugiego — spośród <math>N-1</math>
pozostałych możliwości (jedna pozycja jest już zajęta), i tak dalej,
aż pozycję ostatniego z <math>n_1</math> elementów losujemy spośród
<math>N-n_1</math> pozostałych możliwości. Liczba możliwych wyników
będzie iloczynem tych wszystkich liczb, czyli wyniesie
<math>N\cdot(N-1)\cdot(N-2)\cdot\ \dots\ \cdot (N-n_1) =
N!/(N-n_1)!</math> Skoro wszystkie jedynki są jednakowe i nie
rozróżniamy wyników różniących się ich kolejnością, to wynik ten
musimy podzielić przez liczbę różnych ustawień kolejności elementów
(liczbę permutacji) zbioru <math>n_1</math>-elementowego. Wyniesie ona
<math>n_1\cdot(n_1-1)\cdot\ \dots\ \cdot 1</math>, czyli
<math>n_1!</math> Ostatecznie jako liczbę różnych ustawień
<math>n_1</math> zer i <math>N-n_1</math> jedynek dostajemy:

<center>
<math>\displaystyle
\frac{N!}{(N-n_1)!\ n_1!} = \binom{N}{n_1}
</math>
</center>

Jest to znany z [[WnioskowanieStatystyczne/Rozklady-przyklady#Rozkład dwumianowy|rozdziału o rozkładzie dwumianowym]] symbol Newtona <math>\binom{N}{n_1}</math>. Jego własności
symetrii zgadzają się z sytuacją, w ktorej "wybierać" możemy albo <math>n_1</math> zer
albo <math>n_2</math> jedynek:

<center><math>\displaystyle
\binom{N}{n_1}=\binom{n_1+n_2}{n_1}=\frac{(n_1+n_2)!}{n_1! n_2!}=\binom{n_1+n_2}{n_2}=\binom{N}{n_2}
</math></center>

Pozostaje policzyć, ile z tych możliwości (przy ustalonych liczbach
<math>n_1</math> jedynek i <math>n_2</math> zer) wygeneruje ciąg
wyników, w którym będzie dokładnie <math>k</math> serii?

<center>
<math>\displaystyle\underline{1}\overline{00}\underline{1}\overline{00}\underline{111}
\overline{0}</math>
</center>

===Jeśli liczba serii <math>k</math> jest parzysta===
będziemy mieć tyle samo serii jedynek i zer (po <math>k/2</math>). Aby rozmieścić <math>n_1</math> jedynek w <math>k/2</math> seriach musimy wyznaczyć <math>k/2-1</math> punktów podziału na serie; w powyższym przykładzie będą to (kropki) '''1.1.111''' — było 6 serii, więc mamy 2 punkty podziału. Inaczej losujemy spośród <math>n_1-1</math> możliwych punktów podziału <math>k/2-1</math> podziałów, jak wynika z liczby serii <math>k</math>. Daje to <math>\binom{n_1-1}{k/2-1}</math> możliwości. W miejsca podziału (oznaczone kropkami) wstawiamy serie zer; analogicznie możemy to zrobić na <math>\binom{n_2-1}{k/2-1}</math> możliwości (w przykładzie: '''00.00.0'''). Liczbę tę należy pomnożyć przez dwa ze względu na możliwość zamiany miejscami zer i jedynek. Prawdopodobieństwo danej liczby serii dostaniemy — zgodnie z klasyczną definicją prawdopodobieństwa — dzieląc liczbę wszystkich tych kombinacji <math>n_1</math> jedynek i <math>n_2</math> zer, które generują dokładnie <math>k</math> serii, przez liczbę wszystkich możliwych kombinacji:

<center>
<math>\displaystyle
P=\frac{ 2\binom{n_1-1}{k/2-1} \binom{n_2-1}{k/2-1}} { \binom{N}{n_1}} \qquad\textrm{dla }\ k\ \textrm{parzystych.}
</math>
</center>

===Jeśli liczba serii <math>k</math> jest nieparzysta===
którychś serii — zer lub jedynek — będzie dokładnie o jeden więcej. <equation id="eq:127"></equation>

<center>
<math>\displaystyle\underline{1}\overline{00}\underline{1}\overline{000}\underline{111}
</math>
</center>

'''Jeśli więcej jest serii jedynek''', mamy <math>(k-1)/2</math> serii zer i <math>(k-1)/2+1</math> serii jedynek. <math>n_1</math> jedynek dzielimy na <math>(k-1)/2+1</math> serii, czyli wyznaczamy <math>(k-1)/2</math> punktów podziału spośród <math>n_1-1</math> możliwych — daje to <math>\binom{n_1-1}{(k-1)/2}</math> możliwości. Z kolei <math>n_2</math> zer dzielimy na <math>(k-1)/2</math> serii, co daje <math>\binom{n_2-1}{(k-1)/2-1}</math> możliwości. Iloczyn tych dwóch wielkości określa liczbę możliwości dających <math>k</math> serii, jeśli więcej jest serii jedynek:

<center>
<equation id="eq:128"><math>\displaystyle \binom{n_1-1}{(k-1)/2} \binom{n_2-1}{(k-1)/2-1} </math></equation>
</center>

'''Jeśli więcej jest serii zer''', to na drodze analogicznego rozumowania dostajemy

<center>
<equation id="eq:129"><math>\displaystyle \binom{n_1-1}{(k-1)/2-1} \binom{n_2-1}{(k-1)/2} </math></equation>
</center>

Prawdopodobieństwo dla przypadku nieparzystej liczby serii będzie sumą tych dwóch wielkości, podzieloną, jak w przypadku parzystego <math>k</math>, przez liczbę wszystkich możliwości:

<center>
<equation id="eq:130">
<math>\displaystyle
P=\frac{\binom{n_1-1}{(k-1)/2} \binom{n_2-1}{(k-1)/2-1} +
\binom{n_1-1}{(k-1)/2-1} \binom{n_2-1}{(k-1)/2}}
{{\binom{N}{n_1}}}
</math></equation>
</center>
dla <math>k</math> nieparzystych.

===Pozostaje jeszcze rozważyć sytuację===
w której liczba serii jest nieparzysta, jak w punkcie 2., ale mniej liczne
elementy rozłożone są wyłącznie w serie jednoelementowe, na przykład
001010010100, czyli liczba serii wynosi <math>2n+1</math>, gdzie
<math>n</math> jest liczbą mniej licznych elementów (w tym
przykładzie jedynek). Wtedy znika jeden ze składników sumy z licznika
powyższego równania, gdyż zachodzić może wyłącznie
przypadek 2.1 lub 2.2.

Ostatecznie dostajemy następujący wzór na
prawdopodobieństwo wystąpienia <math>k</math> serii w próbie, w której
drogą niezależnych losowań wylosowano <math>n_1</math> zer i
<math>n_2</math> jedynek:

<center>
<equation id="eq:131">
<math>\displaystyle
P(k\mid n_1, n_2)=\begin{cases}
\frac{ 2\binom{n_1-1}{k/2-1} \binom{n_2-1}{k/2-1}}
{ \binom{N}{n_1}}
\qquad\qquad\qquad \textrm{dla }\ k\ \textrm{ parzystych}
\\
\frac{
\binom{n_1-1}{(k-1)/2} \binom{n_2-1}{(k-1)/2-1} +
\binom{n_1-1}{(k-1)/2-1} \binom{n_2-1}{(k-1)/2}
}
{{ \binom{N}{n_1}}}
\\
\quad\qquad\qquad\qquad\qquad\qquad \textrm{dla }\ k\ \textrm{ nieparzystych}
\\
\frac{
\binom{n_\textrm{max}-1}{(k-1)/2}
}
{{ \binom{N}{(k-1)/2}}}
\ \quad\qquad\qquad\qquad\textrm{dla }\ k\ \textrm{ nieparzystych i }
n_\textrm{min}=\frac{k-1}{2},
\end{cases}
</math></equation>
</center>

gdzie <math>n_\textrm{min}=\min(n_1, n_2)</math> i
<math>n_\textrm{max}=\max(n_1, n_2)</math>.

Wzór ten określa rozkład statystyki, będącej liczbą serii w próbie złożonej
z dowolnych dwóch rodzajów elementów (oznaczanych powyżej jako '''0''' i '''1'''). Dzięki niemu możemy wreszcie skonstruować kompletny test hipotezy
mówiącej, że dany ciąg jest wynikiem niezależnych losowań. Przypomnijmy dane
z [[WnioskowanieStatystyczne/Testy_nieprametryczne|przykładu o nieuczciwym ankieterze]]:

<center>
'''1101101000101001011101101111010110010101001010100011101'''
</center>

W ciągu tym występuje 25 zer i 30 jedynek, układających się w 37
serii. Na podstawie wzoru <xr id="eq:131">(%i)</xr> możemy obliczyć
rozkład prawdopodobieństwa wylosowania ciągu 25 zer i 30 jedynek, w
którym będzie <math>k</math> serii. Możliwe wartości <math>k</math>
będą w tym przypadku zawierać się między 2 (jedna seria zer i jedna
jedynek) a 51 (ponieważ mniej jest zer, największa liczba serii
odpowiada przypadkowi, w którym wszystkie zera układają się w serie
jednoelementowe). Rozkład prawdopodobieństwa dla tego przypadku
przedstawia rysunek <xr id="fig:132"> %i</xr>.

[[Plik:serie.png|center|thumb|600px|<figure id="fig:132"></figure>Rozkład prawdopodobieństw <math>P(k)</math> liczby serii <math>k</math> w niezależnym losowaniu 30 zer i 25 jedynek.]]

Zastosowania testów opartych na tej statystyce nie ograniczają się do
analizy ciągów zer i jedynek (lub innych dwóch elementów). Poniżej
przedstawiamy jeszcze dwa testy korzystające ze statystyki <xr
id="eq:131">(%i)</xr>.

==Testowanie, czy próba jest wynikiem niezależnych losowań==

Podobny problem — pytanie, czy elementy próby są wynikiem
niezależnych losowań — występuje np. przy testowaniu generatorów
liczb losowych ([[WnioskowanieStatystyczne/Z_komputerem#cite_note-0|będących kluczowym
elementem metod opisywanych w pierwszej części książki]]). Jednak w
tej sytuacji mamy do czynienia z ciągiem dowolnych liczb, a nie dwóch
symboli.

Pomysł jest prosty: ciąg wyników wyrażających się dowolnymi liczbami
możemy zamienić na ciąg zer i jedynek, wybierając próg <math>M</math>
i przypisując wynikom większym od <math>M</math> jedynkę, a mniejszym
— zero. Jeśli chcemy mieć tyle samo zer i jedynek, jako
<math>M</math> możemy wziąć [[WnioskowanieStatystyczne/Momenty#Mediana|medianę]] próby. Do
takiej serii możemy już z powodzeniem stosować opisany w poprzednim
rozdziale test oparty na statystyce <xr id="eq:131">(%i)</xr> —
oczywiście zachowując kolejność elementów w próbie.

==Test zgodności rozkładów w dwóch populacjach==

Mamy dwie próby. Hipoteza zerowa mówi, że zostały wylosowane z tego
samego rozkładu. Ciąg zer i jedynek tworzymy w następujący sposób:

Elementy obu prób ustawiamy w jeden ciąg w kolejności od najmniejszej
do największej<ref>Jeśli wartości losowane są z rozkładów ciągłych, to
wystąpienie jednakowych wartości jest teoretycznie niemożliwe. W
praktyce wartości zapisujemy ze skończoną dokładnością; zwykle
przyjmuje się, że jednakowe wartości można pominąć.</ref>. Elementom
pierwszej próby przypisujemy jedynki, a drugiej — zera.

Jeśli obie próby losowano z tej samej populacji, to liczba serii w tak określonym
ciągu podlega statystyce <xr
id="eq:131">(%i)</xr>, czyli ponownie możemy
stosować test Walda-Wolfowitza.

---------------
<references>

WnioskowanieStatystyczne/Test serii

2026-03-29T14:32:42Z

Durka: /* Jeśli liczba serii k jest nieparzysta */

[[Wnioskowanie_Statystyczne_-_wykład]]

=Test serii Walda-Wolfowitza=

Serią nazywamy ciąg jednakowych elementów. W poniższym przykładzie
mamy sześć serii (po trzy serie zer i jedynek):
<center>
<math>\underline{1}\overline{00}\underline{1}\overline{00}\underline{111}
\overline{0}</math>
</center>
Nie jest to oczywiście jedyna kombinacja kolejności pięciu zer i pięciu jedynek,
dająca w wyniku sześć serii. Ponieważ każda pojedyncza kombinacja jest jednakowo
prawdopodobna (jeśli jest wynikiem niezależnych losowań), to prawdopodobieństwo
uzyskania danej liczby serii będzie tym większe, im więcej różnych kombinacji
będzie dawać w wyniku tę liczbę serii. Sformułujmy więc problem ogólnie:

<blockquote>
Mamy <math>N=n_1+n_2</math> elementów, w tym <math>n_1</math> zer i <math>n_2</math> jedynek.
Na ile sposobów możemy je rozłożyć, aby uzyskać <math>k</math> serii?
</blockquote>

{| role="presentation" class="wikitable mw-collapsible mw-collapsed"
| kod 
|-
| <pre>

import matplotlib.pyplot as plt
import numpy

n1=25 # zera
n2=30 # jedynki
n=n1+n2
ile_losowan=1000

wynik=numpy.zeros(ile_losowan, dtype=numpy.int32)

for i in range(0, ile_losowan):
losowanie=numpy.zeros(n, dtype=numpy.int32)
while numpy.sum(losowanie) < n2:
losowanie[numpy.random.randint(0,n)]=1
#print(numpy.array_str(losowanie,max_line_width=numpy.inf).replace(" ",""), "\n")
zmiany=1
for j in range(1, n):
if(losowanie[j] != losowanie[j-1]):
zmiany += 1
wynik[i]=zmiany

plt.hist(wynik, bins=range(0,n))
plt.xlabel("$k$")
plt.ylabel("$P(k)$")
plt.title(f"$n_1$ = {n1}, $n_2$ = {n2}, {ile_losowan} losowań")
plt.show()
</pre>
|}

{| role="presentation" class="wikitable mw-collapsible mw-collapsed"
| animacja dla 1000 
|-
|[[Plik:Testserii1000.png|center|thumb|600px|<figure id="fig:132"></figure>Histogram liczby serii <math>k</math> w <math>10^3</math> niezależnych losowaniach 30 zer i 25 jedynek.]]
|}

[[Plik:Testserii.png|center|thumb|600px|<figure id="fig:132"></figure>Histogram liczby serii <math>k</math> w <math>10^5</math> niezależnych losowaniach 30 zer i 25 jedynek.]]
[[Plik:Testserii_10.9.png|center|thumb|600px|<figure id="fig:132"></figure>Histogram liczby serii <math>k</math> w <math>10^9</math> niezależnych losowaniach 30 zer i 25 jedynek.]]
[[Plik:Testserii_10.9.log.png|center|thumb|600px|<figure id="fig:132"></figure>Histogram liczby serii <math>k</math> w <math>10^9</math> niezależnych losowaniach 30 zer i 25 jedynek (skala logarytmiczna).]]



==Wyprowadzenie analityczne==

Wróćmy do prostszego przykładu, zawierającego pięć jedynek i pięć zer.
Podział na serie możemy interpretować jak przypisanie liczbom od jeden do dziesięciu
(pozycje w ciągu) zera lub jedynki:
<center>
{| class="wikitable"
|-
|'''1'''
|'''0'''
|'''0'''
|'''1'''
|'''0'''
|'''0'''
|'''1'''
|'''1'''
|'''1'''
|'''0'''
|-
|1
|2
|3
|4
|5
|6
|7
|8
|9
|10
|}
</center>

Inaczej mówiąc, konkretny ciąg <math>N</math> zer i jedynek wyznaczony
jest przez wylosowanie spośród liczb od jednego do <math>N</math> tych
liczb, którym mają być przypisane jedynki (pozostałym będą przypisane
zera — lub odwrotnie). Czyli wszystkich możliwych ciągów
<math>n_1</math> zer i <math>n_2</math> jedynek będzie tyle, na ile
sposobów można wylosować <math>n_1</math> elementów spośród
<math>N</math>. Policzmy: pozycję (czyli numer, wypisany w dolnym
rzędzie powyższej tabeli) pierwszego elementu losujemy spośród
<math>N</math> możliwości, drugiego — spośród <math>N-1</math>
pozostałych możliwości (jedna pozycja jest już zajęta), i tak dalej,
aż pozycję ostatniego z <math>n_1</math> elementów losujemy spośród
<math>N-n_1</math> pozostałych możliwości. Liczba możliwych wyników
będzie iloczynem tych wszystkich liczb, czyli wyniesie
<math>N\cdot(N-1)\cdot(N-2)\cdot\ \dots\ \cdot (N-n_1) =
N!/(N-n_1)!</math> Skoro wszystkie jedynki są jednakowe i nie
rozróżniamy wyników różniących się ich kolejnością, to wynik ten
musimy podzielić przez liczbę różnych ustawień kolejności elementów
(liczbę permutacji) zbioru <math>n_1</math>-elementowego. Wyniesie ona
<math>n_1\cdot(n_1-1)\cdot\ \dots\ \cdot 1</math>, czyli
<math>n_1!</math> Ostatecznie jako liczbę różnych ustawień
<math>n_1</math> zer i <math>N-n_1</math> jedynek dostajemy:

<center>
<math>\displaystyle
\frac{N!}{(N-n_1)!\ n_1!} = \binom{N}{n_1}
</math>
</center>

Jest to znany z [[WnioskowanieStatystyczne/Rozklady-przyklady#Rozkład dwumianowy|rozdziału o rozkładzie dwumianowym]] symbol Newtona <math>\binom{N}{n_1}</math>. Jego własności
symetrii zgadzają się z sytuacją, w ktorej "wybierać" możemy albo <math>n_1</math> zer
albo <math>n_2</math> jedynek:

<center><math>\displaystyle
\binom{N}{n_1}=\binom{n_1+n_2}{n_1}=\frac{(n_1+n_2)!}{n_1! n_2!}=\binom{n_1+n_2}{n_2}=\binom{N}{n_2}
</math></center>

Pozostaje policzyć, ile z tych możliwości (przy ustalonych liczbach
<math>n_1</math> jedynek i <math>n_2</math> zer) wygeneruje ciąg
wyników, w którym będzie dokładnie <math>k</math> serii?

<center>
<math>\displaystyle\underline{1}\overline{00}\underline{1}\overline{00}\underline{111}
\overline{0}</math>
</center>

===Jeśli liczba serii <math>k</math> jest parzysta===
będziemy mieć tyle samo serii jedynek i zer (po <math>k/2</math>). Aby rozmieścić <math>n_1</math> jedynek w <math>k/2</math> seriach musimy wyznaczyć <math>k/2-1</math> punktów podziału na serie; w powyższym przykładzie będą to (kropki) '''1.1.111''' — było 6 serii, więc mamy 2 punkty podziału. Inaczej losujemy spośród <math>n_1-1</math> możliwych punktów podziału <math>k/2-1</math> podziałów, jak wynika z liczby serii <math>k</math>. Daje to <math>\binom{n_1-1}{k/2-1}</math> możliwości. W miejsca podziału (oznaczone kropkami) wstawiamy serie zer; analogicznie możemy to zrobić na <math>\binom{n_2-1}{k/2-1}</math> możliwości (w przykładzie: '''00.00.0'''). Liczbę tę należy pomnożyć przez dwa ze względu na możliwość zamiany miejscami zer i jedynek. Prawdopodobieństwo danej liczby serii dostaniemy — zgodnie z klasyczną definicją prawdopodobieństwa — dzieląc liczbę wszystkich tych kombinacji <math>n_1</math> jedynek i <math>n_2</math> zer, które generują dokładnie <math>k</math> serii, przez liczbę wszystkich możliwych kombinacji:

<center>
<math>\displaystyle
P=\frac{ 2\binom{n_1-1}{k/2-1} \binom{n_2-1}{k/2-1}} { \binom{N}{n_1}} \qquad\textrm{dla }\ k\ \textrm{parzystych.}
</math>
</center>

===Jeśli liczba serii <math>k</math> jest nieparzysta===
którychś serii — zer lub jedynek — będzie dokładnie o jeden więcej. <equation id="eq:127"></equation>

<center>
<math>\displaystyle\underline{1}\overline{00}\underline{1}\overline{000}\underline{111}
</math>
</center>

'''Jeśli więcej jest serii jedynek''', mamy <math>(k-1)/2</math> serii zer i <math>(k-1)/2+1</math> serii jedynek. <math>n_1</math> jedynek dzielimy na <math>(k-1)/2+1</math> serii, czyli wyznaczamy <math>(k-1)/2</math> punktów podziału spośród <math>n_1-1</math> możliwych — daje to <math>\binom{n_1-1}{(k-1)/2}</math> możliwości. Z kolei <math>n_2</math> zer dzielimy na <math>(k-1)/2</math> serii, co daje <math>\binom{n_2-1}{(k-1)/2-1}</math> możliwości. Iloczyn tych dwóch wielkości określa liczbę możliwości dających <math>k</math> serii, jeśli więcej jest serii jedynek:

<center>
<equation id="eq:128"><math>\displaystyle \binom{n_1-1}{(k-1)/2} \binom{n_2-1}{(k-1)/2-1} </math></equation>
</center>

'''Jeśli więcej jest serii zer''', to na drodze analogicznego rozumowania dostajemy

<center>
<equation id="eq:129"><math>\displaystyle \binom{n_1-1}{(k-1)/2-1} \binom{n_2-1}{(k-1)/2} </math></equation>
</center>

Prawdopodobieństwo dla przypadku nieparzystej liczby serii będzie sumą tych dwóch wielkości, podzieloną, jak w przypadku parzystego <math>k</math>, przez liczbę wszystkich możliwości:

<center>
<equation id="eq:130">
<math>\displaystyle
P=\frac{\binom{n_1-1}{(k-1)/2} \binom{n_2-1}{(k-1)/2-1} +
\binom{n_1-1}{(k-1)/2-1} \binom{n_2-1}{(k-1)/2}}
{{\binom{N}{n_1}}}
</math></equation>
</center>
dla <math>k</math> nieparzystych.

===Pozostaje jeszcze rozważyć sytuację===
w której liczba serii jest nieparzysta, jak w punkcie 2., ale mniej liczne
elementy rozłożone są wyłącznie w serie jednoelementowe, na przykład
001010010100, czyli liczba serii wynosi <math>2n+1</math>, gdzie
<math>n</math> jest liczbą mniej licznych elementów (w tym
przykładzie jedynek). Wtedy znika jeden ze składników sumy z licznika
powyższego równania, gdyż zachodzić może wyłącznie
przypadek 2.1 lub 2.2.

Ostatecznie dostajemy następujący wzór na
prawdopodobieństwo wystąpienia <math>k</math> serii w próbie, w której
drogą niezależnych losowań wylosowano <math>n_1</math> zer i
<math>n_2</math> jedynek:

<center>
<equation id="eq:131">
<math>\displaystyle
P(k\mid n_1, n_2)=\begin{cases}
\frac{ 2\binom{n_1-1}{k/2-1} \binom{n_2-1}{k/2-1}}
{ \binom{N}{n_1}}
\quad \textrm{dla }\ k\ \textrm{ parzystych}
\\
\frac{
\binom{n_1-1}{(k-1)/2} \binom{n_2-1}{(k-1)/2-1} +
\binom{n_1-1}{(k-1)/2-1} \binom{n_2-1}{(k-1)/2}
}
{{ \binom{N}{n_1}}}
\\
\quad\qquad\qquad\qquad\qquad\qquad \textrm{dla }\ k\ \textrm{ nieparzystych}
\\
\frac{
\binom{n_\textrm{max}-1}{(k-1)/2}
}
{{ \binom{N}{(k-1)/2}}}
\ \quad\qquad\qquad\textrm{dla }\ k\ \textrm{ nieparzystych i }
n_\textrm{min}=\frac{k-1}{2},
\end{cases}
</math></equation>
</center>

gdzie <math>n_\textrm{min}=\min(n_1, n_2)</math> i
<math>n_\textrm{max}=\max(n_1, n_2)</math>.

Wzór ten określa rozkład statystyki, będącej liczbą serii w próbie złożonej
z dowolnych dwóch rodzajów elementów (oznaczanych powyżej jako '''0''' i '''1'''). Dzięki niemu możemy wreszcie skonstruować kompletny test hipotezy
mówiącej, że dany ciąg jest wynikiem niezależnych losowań. Przypomnijmy dane
z [[WnioskowanieStatystyczne/Testy_nieprametryczne|przykładu o nieuczciwym ankieterze]]:

<center>
'''1101101000101001011101101111010110010101001010100011101'''
</center>

W ciągu tym występuje 25 zer i 30 jedynek, układających się w 37
serii. Na podstawie wzoru <xr id="eq:131">(%i)</xr> możemy obliczyć
rozkład prawdopodobieństwa wylosowania ciągu 25 zer i 30 jedynek, w
którym będzie <math>k</math> serii. Możliwe wartości <math>k</math>
będą w tym przypadku zawierać się między 2 (jedna seria zer i jedna
jedynek) a 51 (ponieważ mniej jest zer, największa liczba serii
odpowiada przypadkowi, w którym wszystkie zera układają się w serie
jednoelementowe). Rozkład prawdopodobieństwa dla tego przypadku
przedstawia rysunek <xr id="fig:132"> %i</xr>.

[[Plik:serie.png|center|thumb|600px|<figure id="fig:132"></figure>Rozkład prawdopodobieństw <math>P(k)</math> liczby serii <math>k</math> w niezależnym losowaniu 30 zer i 25 jedynek.]]

Zastosowania testów opartych na tej statystyce nie ograniczają się do
analizy ciągów zer i jedynek (lub innych dwóch elementów). Poniżej
przedstawiamy jeszcze dwa testy korzystające ze statystyki <xr
id="eq:131">(%i)</xr>.

==Testowanie, czy próba jest wynikiem niezależnych losowań==

Podobny problem — pytanie, czy elementy próby są wynikiem
niezależnych losowań — występuje np. przy testowaniu generatorów
liczb losowych ([[WnioskowanieStatystyczne/Z_komputerem#cite_note-0|będących kluczowym
elementem metod opisywanych w pierwszej części książki]]). Jednak w
tej sytuacji mamy do czynienia z ciągiem dowolnych liczb, a nie dwóch
symboli.

Pomysł jest prosty: ciąg wyników wyrażających się dowolnymi liczbami
możemy zamienić na ciąg zer i jedynek, wybierając próg <math>M</math>
i przypisując wynikom większym od <math>M</math> jedynkę, a mniejszym
— zero. Jeśli chcemy mieć tyle samo zer i jedynek, jako
<math>M</math> możemy wziąć [[WnioskowanieStatystyczne/Momenty#Mediana|medianę]] próby. Do
takiej serii możemy już z powodzeniem stosować opisany w poprzednim
rozdziale test oparty na statystyce <xr id="eq:131">(%i)</xr> —
oczywiście zachowując kolejność elementów w próbie.

==Test zgodności rozkładów w dwóch populacjach==

Mamy dwie próby. Hipoteza zerowa mówi, że zostały wylosowane z tego
samego rozkładu. Ciąg zer i jedynek tworzymy w następujący sposób:

Elementy obu prób ustawiamy w jeden ciąg w kolejności od najmniejszej
do największej<ref>Jeśli wartości losowane są z rozkładów ciągłych, to
wystąpienie jednakowych wartości jest teoretycznie niemożliwe. W
praktyce wartości zapisujemy ze skończoną dokładnością; zwykle
przyjmuje się, że jednakowe wartości można pominąć.</ref>. Elementom
pierwszej próby przypisujemy jedynki, a drugiej — zera.

Jeśli obie próby losowano z tej samej populacji, to liczba serii w tak określonym
ciągu podlega statystyce <xr
id="eq:131">(%i)</xr>, czyli ponownie możemy
stosować test Walda-Wolfowitza.

---------------
<references>

WnioskowanieStatystyczne/Test serii

2026-03-29T14:30:42Z

Durka: /* Jeśli liczba serii k jest nieparzysta */

[[Wnioskowanie_Statystyczne_-_wykład]]

=Test serii Walda-Wolfowitza=

Serią nazywamy ciąg jednakowych elementów. W poniższym przykładzie
mamy sześć serii (po trzy serie zer i jedynek):
<center>
<math>\underline{1}\overline{00}\underline{1}\overline{00}\underline{111}
\overline{0}</math>
</center>
Nie jest to oczywiście jedyna kombinacja kolejności pięciu zer i pięciu jedynek,
dająca w wyniku sześć serii. Ponieważ każda pojedyncza kombinacja jest jednakowo
prawdopodobna (jeśli jest wynikiem niezależnych losowań), to prawdopodobieństwo
uzyskania danej liczby serii będzie tym większe, im więcej różnych kombinacji
będzie dawać w wyniku tę liczbę serii. Sformułujmy więc problem ogólnie:

<blockquote>
Mamy <math>N=n_1+n_2</math> elementów, w tym <math>n_1</math> zer i <math>n_2</math> jedynek.
Na ile sposobów możemy je rozłożyć, aby uzyskać <math>k</math> serii?
</blockquote>

{| role="presentation" class="wikitable mw-collapsible mw-collapsed"
| kod 
|-
| <pre>

import matplotlib.pyplot as plt
import numpy

n1=25 # zera
n2=30 # jedynki
n=n1+n2
ile_losowan=1000

wynik=numpy.zeros(ile_losowan, dtype=numpy.int32)

for i in range(0, ile_losowan):
losowanie=numpy.zeros(n, dtype=numpy.int32)
while numpy.sum(losowanie) < n2:
losowanie[numpy.random.randint(0,n)]=1
#print(numpy.array_str(losowanie,max_line_width=numpy.inf).replace(" ",""), "\n")
zmiany=1
for j in range(1, n):
if(losowanie[j] != losowanie[j-1]):
zmiany += 1
wynik[i]=zmiany

plt.hist(wynik, bins=range(0,n))
plt.xlabel("$k$")
plt.ylabel("$P(k)$")
plt.title(f"$n_1$ = {n1}, $n_2$ = {n2}, {ile_losowan} losowań")
plt.show()
</pre>
|}

{| role="presentation" class="wikitable mw-collapsible mw-collapsed"
| animacja dla 1000 
|-
|[[Plik:Testserii1000.png|center|thumb|600px|<figure id="fig:132"></figure>Histogram liczby serii <math>k</math> w <math>10^3</math> niezależnych losowaniach 30 zer i 25 jedynek.]]
|}

[[Plik:Testserii.png|center|thumb|600px|<figure id="fig:132"></figure>Histogram liczby serii <math>k</math> w <math>10^5</math> niezależnych losowaniach 30 zer i 25 jedynek.]]
[[Plik:Testserii_10.9.png|center|thumb|600px|<figure id="fig:132"></figure>Histogram liczby serii <math>k</math> w <math>10^9</math> niezależnych losowaniach 30 zer i 25 jedynek.]]
[[Plik:Testserii_10.9.log.png|center|thumb|600px|<figure id="fig:132"></figure>Histogram liczby serii <math>k</math> w <math>10^9</math> niezależnych losowaniach 30 zer i 25 jedynek (skala logarytmiczna).]]



==Wyprowadzenie analityczne==

Wróćmy do prostszego przykładu, zawierającego pięć jedynek i pięć zer.
Podział na serie możemy interpretować jak przypisanie liczbom od jeden do dziesięciu
(pozycje w ciągu) zera lub jedynki:
<center>
{| class="wikitable"
|-
|'''1'''
|'''0'''
|'''0'''
|'''1'''
|'''0'''
|'''0'''
|'''1'''
|'''1'''
|'''1'''
|'''0'''
|-
|1
|2
|3
|4
|5
|6
|7
|8
|9
|10
|}
</center>

Inaczej mówiąc, konkretny ciąg <math>N</math> zer i jedynek wyznaczony
jest przez wylosowanie spośród liczb od jednego do <math>N</math> tych
liczb, którym mają być przypisane jedynki (pozostałym będą przypisane
zera — lub odwrotnie). Czyli wszystkich możliwych ciągów
<math>n_1</math> zer i <math>n_2</math> jedynek będzie tyle, na ile
sposobów można wylosować <math>n_1</math> elementów spośród
<math>N</math>. Policzmy: pozycję (czyli numer, wypisany w dolnym
rzędzie powyższej tabeli) pierwszego elementu losujemy spośród
<math>N</math> możliwości, drugiego — spośród <math>N-1</math>
pozostałych możliwości (jedna pozycja jest już zajęta), i tak dalej,
aż pozycję ostatniego z <math>n_1</math> elementów losujemy spośród
<math>N-n_1</math> pozostałych możliwości. Liczba możliwych wyników
będzie iloczynem tych wszystkich liczb, czyli wyniesie
<math>N\cdot(N-1)\cdot(N-2)\cdot\ \dots\ \cdot (N-n_1) =
N!/(N-n_1)!</math> Skoro wszystkie jedynki są jednakowe i nie
rozróżniamy wyników różniących się ich kolejnością, to wynik ten
musimy podzielić przez liczbę różnych ustawień kolejności elementów
(liczbę permutacji) zbioru <math>n_1</math>-elementowego. Wyniesie ona
<math>n_1\cdot(n_1-1)\cdot\ \dots\ \cdot 1</math>, czyli
<math>n_1!</math> Ostatecznie jako liczbę różnych ustawień
<math>n_1</math> zer i <math>N-n_1</math> jedynek dostajemy:

<center>
<math>\displaystyle
\frac{N!}{(N-n_1)!\ n_1!} = \binom{N}{n_1}
</math>
</center>

Jest to znany z [[WnioskowanieStatystyczne/Rozklady-przyklady#Rozkład dwumianowy|rozdziału o rozkładzie dwumianowym]] symbol Newtona <math>\binom{N}{n_1}</math>. Jego własności
symetrii zgadzają się z sytuacją, w ktorej "wybierać" możemy albo <math>n_1</math> zer
albo <math>n_2</math> jedynek:

<center><math>\displaystyle
\binom{N}{n_1}=\binom{n_1+n_2}{n_1}=\frac{(n_1+n_2)!}{n_1! n_2!}=\binom{n_1+n_2}{n_2}=\binom{N}{n_2}
</math></center>

Pozostaje policzyć, ile z tych możliwości (przy ustalonych liczbach
<math>n_1</math> jedynek i <math>n_2</math> zer) wygeneruje ciąg
wyników, w którym będzie dokładnie <math>k</math> serii?

<center>
<math>\displaystyle\underline{1}\overline{00}\underline{1}\overline{00}\underline{111}
\overline{0}</math>
</center>

===Jeśli liczba serii <math>k</math> jest parzysta===
będziemy mieć tyle samo serii jedynek i zer (po <math>k/2</math>). Aby rozmieścić <math>n_1</math> jedynek w <math>k/2</math> seriach musimy wyznaczyć <math>k/2-1</math> punktów podziału na serie; w powyższym przykładzie będą to (kropki) '''1.1.111''' — było 6 serii, więc mamy 2 punkty podziału. Inaczej losujemy spośród <math>n_1-1</math> możliwych punktów podziału <math>k/2-1</math> podziałów, jak wynika z liczby serii <math>k</math>. Daje to <math>\binom{n_1-1}{k/2-1}</math> możliwości. W miejsca podziału (oznaczone kropkami) wstawiamy serie zer; analogicznie możemy to zrobić na <math>\binom{n_2-1}{k/2-1}</math> możliwości (w przykładzie: '''00.00.0'''). Liczbę tę należy pomnożyć przez dwa ze względu na możliwość zamiany miejscami zer i jedynek. Prawdopodobieństwo danej liczby serii dostaniemy — zgodnie z klasyczną definicją prawdopodobieństwa — dzieląc liczbę wszystkich tych kombinacji <math>n_1</math> jedynek i <math>n_2</math> zer, które generują dokładnie <math>k</math> serii, przez liczbę wszystkich możliwych kombinacji:

<center>
<math>\displaystyle
P=\frac{ 2\binom{n_1-1}{k/2-1} \binom{n_2-1}{k/2-1}} { \binom{N}{n_1}} \qquad\textrm{dla }\ k\ \textrm{parzystych.}
</math>
</center>

===Jeśli liczba serii <math>k</math> jest nieparzysta===
którychś serii — zer lub jedynek — będzie dokładnie o jeden więcej. <equation id="eq:127"></equation>

<center>
<math>\displaystyle\underline{1}\overline{00}\underline{1}\overline{000}\underline{111}
</math>
</center>

'''Jeśli więcej jest serii jedynek''', mamy <math>(k-1)/2</math> serii zer i <math>(k-1)/2+1</math> serii jedynek. <math>n_1</math> jedynek dzielimy na <math>(k-1)/2+1</math> serii, czyli wyznaczamy <math>(k-1)/2</math> punktów podziału spośród <math>n_1-1</math> możliwych — daje to <math>\binom{n_1-1}{(k-1)/2}</math> możliwości. Z kolei <math>n_2</math> zer dzielimy na <math>(k-1)/2</math> serii, co daje <math>\binom{n_2-1}{(k-1)/2-1}</math> możliwości. Iloczyn tych dwóch wielkości określa liczbę możliwości dających <math>k</math> serii, jeśli więcej jest serii jedynek:

<center>
<equation id="eq:128"><math>\displaystyle \binom{n_1-1}{(k-1)/2} \binom{n_2-1}{(k-1)/2-1} </math></equation>
</center>

'''Jeśli więcej jest serii zer''', to na drodze analogicznego rozumowania dostajemy

<center>
<equation id="eq:129"><math>\displaystyle \binom{n_1-1}{(k-1)/2-1} \binom{n_2-1}{(k-1)/2} </math></equation>
</center>

Prawdopodobieństwo dla przypadku nieparzystej liczby serii będzie sumą tych dwóch wielkości, podzieloną, jak w przypadku parzystego <math>k</math>, przez liczbę wszystkich możliwości:

<center>
<equation id="eq:130">
<math>\displaystyle\begin{matrix}
P&\!\!\!\!=&\!\!\!\!\frac{
\binom{n_1-1}{(k-1)/2} \binom{n_2-1}{(k-1)/2-1} +
\binom{n_1-1}{(k-1)/2-1} \binom{n_2-1}{(k-1)/2}
}
{{ \binom{N}{n_1}}}
\end{matrix}</math></equation>
</center>
dla <math>k</math> nieparzystych.

===Pozostaje jeszcze rozważyć sytuację===
w której liczba serii jest nieparzysta, jak w punkcie 2., ale mniej liczne
elementy rozłożone są wyłącznie w serie jednoelementowe, na przykład
001010010100, czyli liczba serii wynosi <math>2n+1</math>, gdzie
<math>n</math> jest liczbą mniej licznych elementów (w tym
przykładzie jedynek). Wtedy znika jeden ze składników sumy z licznika
powyższego równania, gdyż zachodzić może wyłącznie
przypadek 2.1 lub 2.2.

Ostatecznie dostajemy następujący wzór na
prawdopodobieństwo wystąpienia <math>k</math> serii w próbie, w której
drogą niezależnych losowań wylosowano <math>n_1</math> zer i
<math>n_2</math> jedynek:

<center>
<equation id="eq:131">
<math>\displaystyle
P(k\mid n_1, n_2)=\begin{cases}
\frac{ 2\binom{n_1-1}{k/2-1} \binom{n_2-1}{k/2-1}}
{ \binom{N}{n_1}}
\quad \textrm{dla }\ k\ \textrm{ parzystych}
\\
\frac{
\binom{n_1-1}{(k-1)/2} \binom{n_2-1}{(k-1)/2-1} +
\binom{n_1-1}{(k-1)/2-1} \binom{n_2-1}{(k-1)/2}
}
{{ \binom{N}{n_1}}}
\\
\quad\qquad\qquad\qquad\qquad\qquad \textrm{dla }\ k\ \textrm{ nieparzystych}
\\
\frac{
\binom{n_\textrm{max}-1}{(k-1)/2}
}
{{ \binom{N}{(k-1)/2}}}
\ \quad\qquad\qquad\textrm{dla }\ k\ \textrm{ nieparzystych i }
n_\textrm{min}=\frac{k-1}{2},
\end{cases}
</math></equation>
</center>

gdzie <math>n_\textrm{min}=\min(n_1, n_2)</math> i
<math>n_\textrm{max}=\max(n_1, n_2)</math>.

Wzór ten określa rozkład statystyki, będącej liczbą serii w próbie złożonej
z dowolnych dwóch rodzajów elementów (oznaczanych powyżej jako '''0''' i '''1'''). Dzięki niemu możemy wreszcie skonstruować kompletny test hipotezy
mówiącej, że dany ciąg jest wynikiem niezależnych losowań. Przypomnijmy dane
z [[WnioskowanieStatystyczne/Testy_nieprametryczne|przykładu o nieuczciwym ankieterze]]:

<center>
'''1101101000101001011101101111010110010101001010100011101'''
</center>

W ciągu tym występuje 25 zer i 30 jedynek, układających się w 37
serii. Na podstawie wzoru <xr id="eq:131">(%i)</xr> możemy obliczyć
rozkład prawdopodobieństwa wylosowania ciągu 25 zer i 30 jedynek, w
którym będzie <math>k</math> serii. Możliwe wartości <math>k</math>
będą w tym przypadku zawierać się między 2 (jedna seria zer i jedna
jedynek) a 51 (ponieważ mniej jest zer, największa liczba serii
odpowiada przypadkowi, w którym wszystkie zera układają się w serie
jednoelementowe). Rozkład prawdopodobieństwa dla tego przypadku
przedstawia rysunek <xr id="fig:132"> %i</xr>.

[[Plik:serie.png|center|thumb|600px|<figure id="fig:132"></figure>Rozkład prawdopodobieństw <math>P(k)</math> liczby serii <math>k</math> w niezależnym losowaniu 30 zer i 25 jedynek.]]

Zastosowania testów opartych na tej statystyce nie ograniczają się do
analizy ciągów zer i jedynek (lub innych dwóch elementów). Poniżej
przedstawiamy jeszcze dwa testy korzystające ze statystyki <xr
id="eq:131">(%i)</xr>.

==Testowanie, czy próba jest wynikiem niezależnych losowań==

Podobny problem — pytanie, czy elementy próby są wynikiem
niezależnych losowań — występuje np. przy testowaniu generatorów
liczb losowych ([[WnioskowanieStatystyczne/Z_komputerem#cite_note-0|będących kluczowym
elementem metod opisywanych w pierwszej części książki]]). Jednak w
tej sytuacji mamy do czynienia z ciągiem dowolnych liczb, a nie dwóch
symboli.

Pomysł jest prosty: ciąg wyników wyrażających się dowolnymi liczbami
możemy zamienić na ciąg zer i jedynek, wybierając próg <math>M</math>
i przypisując wynikom większym od <math>M</math> jedynkę, a mniejszym
— zero. Jeśli chcemy mieć tyle samo zer i jedynek, jako
<math>M</math> możemy wziąć [[WnioskowanieStatystyczne/Momenty#Mediana|medianę]] próby. Do
takiej serii możemy już z powodzeniem stosować opisany w poprzednim
rozdziale test oparty na statystyce <xr id="eq:131">(%i)</xr> —
oczywiście zachowując kolejność elementów w próbie.

==Test zgodności rozkładów w dwóch populacjach==

Mamy dwie próby. Hipoteza zerowa mówi, że zostały wylosowane z tego
samego rozkładu. Ciąg zer i jedynek tworzymy w następujący sposób:

Elementy obu prób ustawiamy w jeden ciąg w kolejności od najmniejszej
do największej<ref>Jeśli wartości losowane są z rozkładów ciągłych, to
wystąpienie jednakowych wartości jest teoretycznie niemożliwe. W
praktyce wartości zapisujemy ze skończoną dokładnością; zwykle
przyjmuje się, że jednakowe wartości można pominąć.</ref>. Elementom
pierwszej próby przypisujemy jedynki, a drugiej — zera.

Jeśli obie próby losowano z tej samej populacji, to liczba serii w tak określonym
ciągu podlega statystyce <xr
id="eq:131">(%i)</xr>, czyli ponownie możemy
stosować test Walda-Wolfowitza.

---------------
<references>

WnioskowanieStatystyczne/Test serii

2026-03-29T14:28:48Z

Durka: /* Wyprowadzenie analityczne */

[[Wnioskowanie_Statystyczne_-_wykład]]

=Test serii Walda-Wolfowitza=

Serią nazywamy ciąg jednakowych elementów. W poniższym przykładzie
mamy sześć serii (po trzy serie zer i jedynek):
<center>
<math>\underline{1}\overline{00}\underline{1}\overline{00}\underline{111}
\overline{0}</math>
</center>
Nie jest to oczywiście jedyna kombinacja kolejności pięciu zer i pięciu jedynek,
dająca w wyniku sześć serii. Ponieważ każda pojedyncza kombinacja jest jednakowo
prawdopodobna (jeśli jest wynikiem niezależnych losowań), to prawdopodobieństwo
uzyskania danej liczby serii będzie tym większe, im więcej różnych kombinacji
będzie dawać w wyniku tę liczbę serii. Sformułujmy więc problem ogólnie:

<blockquote>
Mamy <math>N=n_1+n_2</math> elementów, w tym <math>n_1</math> zer i <math>n_2</math> jedynek.
Na ile sposobów możemy je rozłożyć, aby uzyskać <math>k</math> serii?
</blockquote>

{| role="presentation" class="wikitable mw-collapsible mw-collapsed"
| kod 
|-
| <pre>

import matplotlib.pyplot as plt
import numpy

n1=25 # zera
n2=30 # jedynki
n=n1+n2
ile_losowan=1000

wynik=numpy.zeros(ile_losowan, dtype=numpy.int32)

for i in range(0, ile_losowan):
losowanie=numpy.zeros(n, dtype=numpy.int32)
while numpy.sum(losowanie) < n2:
losowanie[numpy.random.randint(0,n)]=1
#print(numpy.array_str(losowanie,max_line_width=numpy.inf).replace(" ",""), "\n")
zmiany=1
for j in range(1, n):
if(losowanie[j] != losowanie[j-1]):
zmiany += 1
wynik[i]=zmiany

plt.hist(wynik, bins=range(0,n))
plt.xlabel("$k$")
plt.ylabel("$P(k)$")
plt.title(f"$n_1$ = {n1}, $n_2$ = {n2}, {ile_losowan} losowań")
plt.show()
</pre>
|}

{| role="presentation" class="wikitable mw-collapsible mw-collapsed"
| animacja dla 1000 
|-
|[[Plik:Testserii1000.png|center|thumb|600px|<figure id="fig:132"></figure>Histogram liczby serii <math>k</math> w <math>10^3</math> niezależnych losowaniach 30 zer i 25 jedynek.]]
|}

[[Plik:Testserii.png|center|thumb|600px|<figure id="fig:132"></figure>Histogram liczby serii <math>k</math> w <math>10^5</math> niezależnych losowaniach 30 zer i 25 jedynek.]]
[[Plik:Testserii_10.9.png|center|thumb|600px|<figure id="fig:132"></figure>Histogram liczby serii <math>k</math> w <math>10^9</math> niezależnych losowaniach 30 zer i 25 jedynek.]]
[[Plik:Testserii_10.9.log.png|center|thumb|600px|<figure id="fig:132"></figure>Histogram liczby serii <math>k</math> w <math>10^9</math> niezależnych losowaniach 30 zer i 25 jedynek (skala logarytmiczna).]]



==Wyprowadzenie analityczne==

Wróćmy do prostszego przykładu, zawierającego pięć jedynek i pięć zer.
Podział na serie możemy interpretować jak przypisanie liczbom od jeden do dziesięciu
(pozycje w ciągu) zera lub jedynki:
<center>
{| class="wikitable"
|-
|'''1'''
|'''0'''
|'''0'''
|'''1'''
|'''0'''
|'''0'''
|'''1'''
|'''1'''
|'''1'''
|'''0'''
|-
|1
|2
|3
|4
|5
|6
|7
|8
|9
|10
|}
</center>

Inaczej mówiąc, konkretny ciąg <math>N</math> zer i jedynek wyznaczony
jest przez wylosowanie spośród liczb od jednego do <math>N</math> tych
liczb, którym mają być przypisane jedynki (pozostałym będą przypisane
zera — lub odwrotnie). Czyli wszystkich możliwych ciągów
<math>n_1</math> zer i <math>n_2</math> jedynek będzie tyle, na ile
sposobów można wylosować <math>n_1</math> elementów spośród
<math>N</math>. Policzmy: pozycję (czyli numer, wypisany w dolnym
rzędzie powyższej tabeli) pierwszego elementu losujemy spośród
<math>N</math> możliwości, drugiego — spośród <math>N-1</math>
pozostałych możliwości (jedna pozycja jest już zajęta), i tak dalej,
aż pozycję ostatniego z <math>n_1</math> elementów losujemy spośród
<math>N-n_1</math> pozostałych możliwości. Liczba możliwych wyników
będzie iloczynem tych wszystkich liczb, czyli wyniesie
<math>N\cdot(N-1)\cdot(N-2)\cdot\ \dots\ \cdot (N-n_1) =
N!/(N-n_1)!</math> Skoro wszystkie jedynki są jednakowe i nie
rozróżniamy wyników różniących się ich kolejnością, to wynik ten
musimy podzielić przez liczbę różnych ustawień kolejności elementów
(liczbę permutacji) zbioru <math>n_1</math>-elementowego. Wyniesie ona
<math>n_1\cdot(n_1-1)\cdot\ \dots\ \cdot 1</math>, czyli
<math>n_1!</math> Ostatecznie jako liczbę różnych ustawień
<math>n_1</math> zer i <math>N-n_1</math> jedynek dostajemy:

<center>
<math>\displaystyle
\frac{N!}{(N-n_1)!\ n_1!} = \binom{N}{n_1}
</math>
</center>

Jest to znany z [[WnioskowanieStatystyczne/Rozklady-przyklady#Rozkład dwumianowy|rozdziału o rozkładzie dwumianowym]] symbol Newtona <math>\binom{N}{n_1}</math>. Jego własności
symetrii zgadzają się z sytuacją, w ktorej "wybierać" możemy albo <math>n_1</math> zer
albo <math>n_2</math> jedynek:

<center><math>\displaystyle
\binom{N}{n_1}=\binom{n_1+n_2}{n_1}=\frac{(n_1+n_2)!}{n_1! n_2!}=\binom{n_1+n_2}{n_2}=\binom{N}{n_2}
</math></center>

Pozostaje policzyć, ile z tych możliwości (przy ustalonych liczbach
<math>n_1</math> jedynek i <math>n_2</math> zer) wygeneruje ciąg
wyników, w którym będzie dokładnie <math>k</math> serii?

<center>
<math>\displaystyle\underline{1}\overline{00}\underline{1}\overline{00}\underline{111}
\overline{0}</math>
</center>

===Jeśli liczba serii <math>k</math> jest parzysta===
będziemy mieć tyle samo serii jedynek i zer (po <math>k/2</math>). Aby rozmieścić <math>n_1</math> jedynek w <math>k/2</math> seriach musimy wyznaczyć <math>k/2-1</math> punktów podziału na serie; w powyższym przykładzie będą to (kropki) '''1.1.111''' — było 6 serii, więc mamy 2 punkty podziału. Inaczej losujemy spośród <math>n_1-1</math> możliwych punktów podziału <math>k/2-1</math> podziałów, jak wynika z liczby serii <math>k</math>. Daje to <math>\binom{n_1-1}{k/2-1}</math> możliwości. W miejsca podziału (oznaczone kropkami) wstawiamy serie zer; analogicznie możemy to zrobić na <math>\binom{n_2-1}{k/2-1}</math> możliwości (w przykładzie: '''00.00.0'''). Liczbę tę należy pomnożyć przez dwa ze względu na możliwość zamiany miejscami zer i jedynek. Prawdopodobieństwo danej liczby serii dostaniemy — zgodnie z klasyczną definicją prawdopodobieństwa — dzieląc liczbę wszystkich tych kombinacji <math>n_1</math> jedynek i <math>n_2</math> zer, które generują dokładnie <math>k</math> serii, przez liczbę wszystkich możliwych kombinacji:

<center>
<math>\displaystyle
P=\frac{ 2\binom{n_1-1}{k/2-1} \binom{n_2-1}{k/2-1}} { \binom{N}{n_1}} \qquad\textrm{dla }\ k\ \textrm{parzystych.}
</math>
</center>

===Jeśli liczba serii <math>k</math> jest nieparzysta===
którychś serii — zer lub jedynek — będzie dokładnie o jeden więcej. <equation id="eq:127"></equation>

<center>
<math>\displaystyle\underline{1}\overline{00}\underline{1}\overline{000}\underline{111}
</math>
</center>

'''Jeśli więcej jest serii jedynek''', mamy <math>(k-1)/2</math> serii zer i <math>(k-1)/2+1</math> serii jedynek. <math>n_1</math> jedynek dzielimy na <math>(k-1)/2+1</math> serii, czyli wyznaczamy <math>(k-1)/2</math> punktów podziału spośród <math>n_1-1</math> możliwych — daje to <math>\binom{n_1-1}{(k-1)/2}</math> możliwości. Z kolei <math>n_2</math> zer dzielimy na <math>(k-1)/2</math> serii, co daje <math>\binom{n_2-1}{(k-1)/2-1}</math> możliwości. Iloczyn tych dwóch wielkości określa liczbę możliwości dających <math>k</math> serii, jeśli więcej jest serii jedynek:

<center>
<equation id="eq:128"><math>\displaystyle \binom{n_1-1}{(k-1)/2} \binom{n_2-1}{(k-1)/2-1} </math></equation>
</center>

'''Jeśli więcej jest serii zer''', to na drodze analogicznego rozumowania dostajemy

<center>
<equation id="eq:129"><math>\displaystyle \binom{n_1-1}{(k-1)/2-1} \binom{n_2-1}{(k-1)/2}. </math></equation>
</center>

Prawdopodobieństwo dla przypadku nieparzystej liczby serii będzie sumą tych dwóch wielkości, podzieloną, jak w przypadku parzystego <math>k</math>, przez liczbę wszystkich możliwości:

<center>
<equation id="eq:130">
<math>\displaystyle\begin{matrix}
P&\!\!\!\!=&\!\!\!\!\frac{
\binom{n_1-1}{(k-1)/2} \binom{n_2-1}{(k-1)/2-1} +
\binom{n_1-1}{(k-1)/2-1} \binom{n_2-1}{(k-1)/2}
}
{{ \binom{N}{n_1}}} \\
&&\textrm{dla }\ k\ \textrm{ nieparzystych.}
\end{matrix}</math></equation>
</center>

===Pozostaje jeszcze rozważyć sytuację===
w której liczba serii jest nieparzysta, jak w punkcie 2., ale mniej liczne
elementy rozłożone są wyłącznie w serie jednoelementowe, na przykład
001010010100, czyli liczba serii wynosi <math>2n+1</math>, gdzie
<math>n</math> jest liczbą mniej licznych elementów (w tym
przykładzie jedynek). Wtedy znika jeden ze składników sumy z licznika
powyższego równania, gdyż zachodzić może wyłącznie
przypadek 2.1 lub 2.2.

Ostatecznie dostajemy następujący wzór na
prawdopodobieństwo wystąpienia <math>k</math> serii w próbie, w której
drogą niezależnych losowań wylosowano <math>n_1</math> zer i
<math>n_2</math> jedynek:

<center>
<equation id="eq:131">
<math>\displaystyle
P(k\mid n_1, n_2)=\begin{cases}
\frac{ 2\binom{n_1-1}{k/2-1} \binom{n_2-1}{k/2-1}}
{ \binom{N}{n_1}}
\quad \textrm{dla }\ k\ \textrm{ parzystych}
\\
\frac{
\binom{n_1-1}{(k-1)/2} \binom{n_2-1}{(k-1)/2-1} +
\binom{n_1-1}{(k-1)/2-1} \binom{n_2-1}{(k-1)/2}
}
{{ \binom{N}{n_1}}}
\\
\quad\qquad\qquad\qquad\qquad\qquad \textrm{dla }\ k\ \textrm{ nieparzystych}
\\
\frac{
\binom{n_\textrm{max}-1}{(k-1)/2}
}
{{ \binom{N}{(k-1)/2}}}
\ \quad\qquad\qquad\textrm{dla }\ k\ \textrm{ nieparzystych i }
n_\textrm{min}=\frac{k-1}{2},
\end{cases}
</math></equation>
</center>

gdzie <math>n_\textrm{min}=\min(n_1, n_2)</math> i
<math>n_\textrm{max}=\max(n_1, n_2)</math>.

Wzór ten określa rozkład statystyki, będącej liczbą serii w próbie złożonej
z dowolnych dwóch rodzajów elementów (oznaczanych powyżej jako '''0''' i '''1'''). Dzięki niemu możemy wreszcie skonstruować kompletny test hipotezy
mówiącej, że dany ciąg jest wynikiem niezależnych losowań. Przypomnijmy dane
z [[WnioskowanieStatystyczne/Testy_nieprametryczne|przykładu o nieuczciwym ankieterze]]:

<center>
'''1101101000101001011101101111010110010101001010100011101'''
</center>

W ciągu tym występuje 25 zer i 30 jedynek, układających się w 37
serii. Na podstawie wzoru <xr id="eq:131">(%i)</xr> możemy obliczyć
rozkład prawdopodobieństwa wylosowania ciągu 25 zer i 30 jedynek, w
którym będzie <math>k</math> serii. Możliwe wartości <math>k</math>
będą w tym przypadku zawierać się między 2 (jedna seria zer i jedna
jedynek) a 51 (ponieważ mniej jest zer, największa liczba serii
odpowiada przypadkowi, w którym wszystkie zera układają się w serie
jednoelementowe). Rozkład prawdopodobieństwa dla tego przypadku
przedstawia rysunek <xr id="fig:132"> %i</xr>.

[[Plik:serie.png|center|thumb|600px|<figure id="fig:132"></figure>Rozkład prawdopodobieństw <math>P(k)</math> liczby serii <math>k</math> w niezależnym losowaniu 30 zer i 25 jedynek.]]

Zastosowania testów opartych na tej statystyce nie ograniczają się do
analizy ciągów zer i jedynek (lub innych dwóch elementów). Poniżej
przedstawiamy jeszcze dwa testy korzystające ze statystyki <xr
id="eq:131">(%i)</xr>.

==Testowanie, czy próba jest wynikiem niezależnych losowań==

Podobny problem — pytanie, czy elementy próby są wynikiem
niezależnych losowań — występuje np. przy testowaniu generatorów
liczb losowych ([[WnioskowanieStatystyczne/Z_komputerem#cite_note-0|będących kluczowym
elementem metod opisywanych w pierwszej części książki]]). Jednak w
tej sytuacji mamy do czynienia z ciągiem dowolnych liczb, a nie dwóch
symboli.

Pomysł jest prosty: ciąg wyników wyrażających się dowolnymi liczbami
możemy zamienić na ciąg zer i jedynek, wybierając próg <math>M</math>
i przypisując wynikom większym od <math>M</math> jedynkę, a mniejszym
— zero. Jeśli chcemy mieć tyle samo zer i jedynek, jako
<math>M</math> możemy wziąć [[WnioskowanieStatystyczne/Momenty#Mediana|medianę]] próby. Do
takiej serii możemy już z powodzeniem stosować opisany w poprzednim
rozdziale test oparty na statystyce <xr id="eq:131">(%i)</xr> —
oczywiście zachowując kolejność elementów w próbie.

==Test zgodności rozkładów w dwóch populacjach==

Mamy dwie próby. Hipoteza zerowa mówi, że zostały wylosowane z tego
samego rozkładu. Ciąg zer i jedynek tworzymy w następujący sposób:

Elementy obu prób ustawiamy w jeden ciąg w kolejności od najmniejszej
do największej<ref>Jeśli wartości losowane są z rozkładów ciągłych, to
wystąpienie jednakowych wartości jest teoretycznie niemożliwe. W
praktyce wartości zapisujemy ze skończoną dokładnością; zwykle
przyjmuje się, że jednakowe wartości można pominąć.</ref>. Elementom
pierwszej próby przypisujemy jedynki, a drugiej — zera.

Jeśli obie próby losowano z tej samej populacji, to liczba serii w tak określonym
ciągu podlega statystyce <xr
id="eq:131">(%i)</xr>, czyli ponownie możemy
stosować test Walda-Wolfowitza.

---------------
<references>

WnioskowanieStatystyczne/Test serii

2026-03-29T14:28:06Z

Durka: /* Test serii Walda-Wolfowitza */

[[Wnioskowanie_Statystyczne_-_wykład]]

=Test serii Walda-Wolfowitza=

Serią nazywamy ciąg jednakowych elementów. W poniższym przykładzie
mamy sześć serii (po trzy serie zer i jedynek):
<center>
<math>\underline{1}\overline{00}\underline{1}\overline{00}\underline{111}
\overline{0}</math>
</center>
Nie jest to oczywiście jedyna kombinacja kolejności pięciu zer i pięciu jedynek,
dająca w wyniku sześć serii. Ponieważ każda pojedyncza kombinacja jest jednakowo
prawdopodobna (jeśli jest wynikiem niezależnych losowań), to prawdopodobieństwo
uzyskania danej liczby serii będzie tym większe, im więcej różnych kombinacji
będzie dawać w wyniku tę liczbę serii. Sformułujmy więc problem ogólnie:

<blockquote>
Mamy <math>N=n_1+n_2</math> elementów, w tym <math>n_1</math> zer i <math>n_2</math> jedynek.
Na ile sposobów możemy je rozłożyć, aby uzyskać <math>k</math> serii?
</blockquote>

{| role="presentation" class="wikitable mw-collapsible mw-collapsed"
| kod 
|-
| <pre>

import matplotlib.pyplot as plt
import numpy

n1=25 # zera
n2=30 # jedynki
n=n1+n2
ile_losowan=1000

wynik=numpy.zeros(ile_losowan, dtype=numpy.int32)

for i in range(0, ile_losowan):
losowanie=numpy.zeros(n, dtype=numpy.int32)
while numpy.sum(losowanie) < n2:
losowanie[numpy.random.randint(0,n)]=1
#print(numpy.array_str(losowanie,max_line_width=numpy.inf).replace(" ",""), "\n")
zmiany=1
for j in range(1, n):
if(losowanie[j] != losowanie[j-1]):
zmiany += 1
wynik[i]=zmiany

plt.hist(wynik, bins=range(0,n))
plt.xlabel("$k$")
plt.ylabel("$P(k)$")
plt.title(f"$n_1$ = {n1}, $n_2$ = {n2}, {ile_losowan} losowań")
plt.show()
</pre>
|}

{| role="presentation" class="wikitable mw-collapsible mw-collapsed"
| animacja dla 1000 
|-
|[[Plik:Testserii1000.png|center|thumb|600px|<figure id="fig:132"></figure>Histogram liczby serii <math>k</math> w <math>10^3</math> niezależnych losowaniach 30 zer i 25 jedynek.]]
|}

[[Plik:Testserii.png|center|thumb|600px|<figure id="fig:132"></figure>Histogram liczby serii <math>k</math> w <math>10^5</math> niezależnych losowaniach 30 zer i 25 jedynek.]]
[[Plik:Testserii_10.9.png|center|thumb|600px|<figure id="fig:132"></figure>Histogram liczby serii <math>k</math> w <math>10^9</math> niezależnych losowaniach 30 zer i 25 jedynek.]]
[[Plik:Testserii_10.9.log.png|center|thumb|600px|<figure id="fig:132"></figure>Histogram liczby serii <math>k</math> w <math>10^9</math> niezależnych losowaniach 30 zer i 25 jedynek (skala logarytmiczna).]]



==Wyprowadzenie analityczne==

Wróćmy do prostszego przykładu, zawierającego pięć jedynek i pięć zer.
Podział na serie możemy interpretować jak przypisanie liczbom od jeden do dziesięciu
(pozycje w ciągu) zera lub jedynki:
<center>
{| class="wikitable"
|-
|'''1'''
|'''0'''
|'''0'''
|'''1'''
|'''0'''
|'''0'''
|'''1'''
|'''1'''
|'''1'''
|'''0'''
|-
|1
|2
|3
|4
|5
|6
|7
|8
|9
|10
|}
</center>

Inaczej mówiąc, konkretny ciąg <math>N</math> zer i jedynek wyznaczony
jest przez wylosowanie spośród liczb od jednego do <math>N</math> tych
liczb, którym mają być przypisane jedynki (pozostałym będą przypisane
zera — lub odwrotnie). Czyli wszystkich możliwych ciągów
<math>n_1</math> zer i <math>n_2</math> jedynek będzie tyle, na ile
sposobów można wylosować <math>n_1</math> elementów spośród
<math>N</math>. Policzmy: pozycję (czyli numer, wypisany w dolnym
rzędzie powyższej tabeli) pierwszego elementu losujemy spośród
<math>N</math> możliwości, drugiego — spośród <math>N-1</math>
pozostałych możliwości (jedna pozycja jest już zajęta), i tak dalej,
aż pozycję ostatniego z <math>n_1</math> elementów losujemy spośród
<math>N-n_1</math> pozostałych możliwości. Liczba możliwych wyników
będzie iloczynem tych wszystkich liczb, czyli wyniesie
<math>N\cdot(N-1)\cdot(N-2)\cdot\ \dots\ \cdot (N-n_1) =
N!/(N-n_1)!</math> Skoro wszystkie jedynki są jednakowe i nie
rozróżniamy wyników różniących się ich kolejnością, to wynik ten
musimy podzielić przez liczbę różnych ustawień kolejności elementów
(liczbę permutacji) zbioru <math>n_1</math>-elementowego. Wyniesie ona
<math>n_1\cdot(n_1-1)\cdot\ \dots\ \cdot 1</math>, czyli
<math>n_1!</math> Ostatecznie jako liczbę różnych ustawień
<math>n_1</math> zer i <math>N-n_1</math> jedynek dostajemy:

<center>
<math>\displaystyle
\frac{N!}{(N-n_1)!\ n_1!} = \binom{N}{n_1}.
</math>
</center>

Jest to znany z [[WnioskowanieStatystyczne/Rozklady-przyklady#Rozkład dwumianowy|rozdziału o rozkładzie dwumianowym]] symbol Newtona <math>\binom{N}{n_1}</math>. Jego własności
symetrii zgadzają się z sytuacją, w ktorej "wybierać" możemy albo <math>n_1</math> zer
albo <math>n_2</math> jedynek:

<center><math>\displaystyle
\binom{N}{n_1}=\binom{n_1+n_2}{n_1}=\frac{(n_1+n_2)!}{n_1! n_2!}=\binom{n_1+n_2}{n_2}=\binom{N}{n_2}.
</math></center>

Pozostaje policzyć, ile z tych możliwości (przy ustalonych liczbach
<math>n_1</math> jedynek i <math>n_2</math> zer) wygeneruje ciąg
wyników, w którym będzie dokładnie <math>k</math> serii?

<center>
<math>\displaystyle\underline{1}\overline{00}\underline{1}\overline{00}\underline{111}
\overline{0}</math>
</center>

===Jeśli liczba serii <math>k</math> jest parzysta===
będziemy mieć tyle samo serii jedynek i zer (po <math>k/2</math>). Aby rozmieścić <math>n_1</math> jedynek w <math>k/2</math> seriach musimy wyznaczyć <math>k/2-1</math> punktów podziału na serie; w powyższym przykładzie będą to (kropki) '''1.1.111''' — było 6 serii, więc mamy 2 punkty podziału. Inaczej losujemy spośród <math>n_1-1</math> możliwych punktów podziału <math>k/2-1</math> podziałów, jak wynika z liczby serii <math>k</math>. Daje to <math>\binom{n_1-1}{k/2-1}</math> możliwości. W miejsca podziału (oznaczone kropkami) wstawiamy serie zer; analogicznie możemy to zrobić na <math>\binom{n_2-1}{k/2-1}</math> możliwości (w przykładzie: '''00.00.0'''). Liczbę tę należy pomnożyć przez dwa ze względu na możliwość zamiany miejscami zer i jedynek. Prawdopodobieństwo danej liczby serii dostaniemy — zgodnie z klasyczną definicją prawdopodobieństwa — dzieląc liczbę wszystkich tych kombinacji <math>n_1</math> jedynek i <math>n_2</math> zer, które generują dokładnie <math>k</math> serii, przez liczbę wszystkich możliwych kombinacji:

<center>
<math>\displaystyle
P=\frac{ 2\binom{n_1-1}{k/2-1} \binom{n_2-1}{k/2-1}} { \binom{N}{n_1}} \qquad\textrm{dla }\ k\ \textrm{parzystych.}
</math>
</center>

===Jeśli liczba serii <math>k</math> jest nieparzysta===
którychś serii — zer lub jedynek — będzie dokładnie o jeden więcej. <equation id="eq:127"></equation>

<center>
<math>\displaystyle\underline{1}\overline{00}\underline{1}\overline{000}\underline{111}
</math>
</center>

'''Jeśli więcej jest serii jedynek''', mamy <math>(k-1)/2</math> serii zer i <math>(k-1)/2+1</math> serii jedynek. <math>n_1</math> jedynek dzielimy na <math>(k-1)/2+1</math> serii, czyli wyznaczamy <math>(k-1)/2</math> punktów podziału spośród <math>n_1-1</math> możliwych — daje to <math>\binom{n_1-1}{(k-1)/2}</math> możliwości. Z kolei <math>n_2</math> zer dzielimy na <math>(k-1)/2</math> serii, co daje <math>\binom{n_2-1}{(k-1)/2-1}</math> możliwości. Iloczyn tych dwóch wielkości określa liczbę możliwości dających <math>k</math> serii, jeśli więcej jest serii jedynek:

<center>
<equation id="eq:128"><math>\displaystyle \binom{n_1-1}{(k-1)/2} \binom{n_2-1}{(k-1)/2-1} </math></equation>
</center>

'''Jeśli więcej jest serii zer''', to na drodze analogicznego rozumowania dostajemy

<center>
<equation id="eq:129"><math>\displaystyle \binom{n_1-1}{(k-1)/2-1} \binom{n_2-1}{(k-1)/2}. </math></equation>
</center>

Prawdopodobieństwo dla przypadku nieparzystej liczby serii będzie sumą tych dwóch wielkości, podzieloną, jak w przypadku parzystego <math>k</math>, przez liczbę wszystkich możliwości:

<center>
<equation id="eq:130">
<math>\displaystyle\begin{matrix}
P&\!\!\!\!=&\!\!\!\!\frac{
\binom{n_1-1}{(k-1)/2} \binom{n_2-1}{(k-1)/2-1} +
\binom{n_1-1}{(k-1)/2-1} \binom{n_2-1}{(k-1)/2}
}
{{ \binom{N}{n_1}}} \\
&&\textrm{dla }\ k\ \textrm{ nieparzystych.}
\end{matrix}</math></equation>
</center>

===Pozostaje jeszcze rozważyć sytuację===
w której liczba serii jest nieparzysta, jak w punkcie 2., ale mniej liczne
elementy rozłożone są wyłącznie w serie jednoelementowe, na przykład
001010010100, czyli liczba serii wynosi <math>2n+1</math>, gdzie
<math>n</math> jest liczbą mniej licznych elementów (w tym
przykładzie jedynek). Wtedy znika jeden ze składników sumy z licznika
powyższego równania, gdyż zachodzić może wyłącznie
przypadek 2.1 lub 2.2.

Ostatecznie dostajemy następujący wzór na
prawdopodobieństwo wystąpienia <math>k</math> serii w próbie, w której
drogą niezależnych losowań wylosowano <math>n_1</math> zer i
<math>n_2</math> jedynek:

<center>
<equation id="eq:131">
<math>\displaystyle
P(k\mid n_1, n_2)=\begin{cases}
\frac{ 2\binom{n_1-1}{k/2-1} \binom{n_2-1}{k/2-1}}
{ \binom{N}{n_1}}
\quad \textrm{dla }\ k\ \textrm{ parzystych}
\\
\frac{
\binom{n_1-1}{(k-1)/2} \binom{n_2-1}{(k-1)/2-1} +
\binom{n_1-1}{(k-1)/2-1} \binom{n_2-1}{(k-1)/2}
}
{{ \binom{N}{n_1}}}
\\
\quad\qquad\qquad\qquad\qquad\qquad \textrm{dla }\ k\ \textrm{ nieparzystych}
\\
\frac{
\binom{n_\textrm{max}-1}{(k-1)/2}
}
{{ \binom{N}{(k-1)/2}}}
\ \quad\qquad\qquad\textrm{dla }\ k\ \textrm{ nieparzystych i }
n_\textrm{min}=\frac{k-1}{2},
\end{cases}
</math></equation>
</center>

gdzie <math>n_\textrm{min}=\min(n_1, n_2)</math> i
<math>n_\textrm{max}=\max(n_1, n_2)</math>.

Wzór ten określa rozkład statystyki, będącej liczbą serii w próbie złożonej
z dowolnych dwóch rodzajów elementów (oznaczanych powyżej jako '''0''' i '''1'''). Dzięki niemu możemy wreszcie skonstruować kompletny test hipotezy
mówiącej, że dany ciąg jest wynikiem niezależnych losowań. Przypomnijmy dane
z [[WnioskowanieStatystyczne/Testy_nieprametryczne|przykładu o nieuczciwym ankieterze]]:

<center>
'''1101101000101001011101101111010110010101001010100011101'''
</center>

W ciągu tym występuje 25 zer i 30 jedynek, układających się w 37
serii. Na podstawie wzoru <xr id="eq:131">(%i)</xr> możemy obliczyć
rozkład prawdopodobieństwa wylosowania ciągu 25 zer i 30 jedynek, w
którym będzie <math>k</math> serii. Możliwe wartości <math>k</math>
będą w tym przypadku zawierać się między 2 (jedna seria zer i jedna
jedynek) a 51 (ponieważ mniej jest zer, największa liczba serii
odpowiada przypadkowi, w którym wszystkie zera układają się w serie
jednoelementowe). Rozkład prawdopodobieństwa dla tego przypadku
przedstawia rysunek <xr id="fig:132"> %i</xr>.

[[Plik:serie.png|center|thumb|600px|<figure id="fig:132"></figure>Rozkład prawdopodobieństw <math>P(k)</math> liczby serii <math>k</math> w niezależnym losowaniu 30 zer i 25 jedynek.]]

Zastosowania testów opartych na tej statystyce nie ograniczają się do
analizy ciągów zer i jedynek (lub innych dwóch elementów). Poniżej
przedstawiamy jeszcze dwa testy korzystające ze statystyki <xr
id="eq:131">(%i)</xr>.

==Testowanie, czy próba jest wynikiem niezależnych losowań==

Podobny problem — pytanie, czy elementy próby są wynikiem
niezależnych losowań — występuje np. przy testowaniu generatorów
liczb losowych ([[WnioskowanieStatystyczne/Z_komputerem#cite_note-0|będących kluczowym
elementem metod opisywanych w pierwszej części książki]]). Jednak w
tej sytuacji mamy do czynienia z ciągiem dowolnych liczb, a nie dwóch
symboli.

Pomysł jest prosty: ciąg wyników wyrażających się dowolnymi liczbami
możemy zamienić na ciąg zer i jedynek, wybierając próg <math>M</math>
i przypisując wynikom większym od <math>M</math> jedynkę, a mniejszym
— zero. Jeśli chcemy mieć tyle samo zer i jedynek, jako
<math>M</math> możemy wziąć [[WnioskowanieStatystyczne/Momenty#Mediana|medianę]] próby. Do
takiej serii możemy już z powodzeniem stosować opisany w poprzednim
rozdziale test oparty na statystyce <xr id="eq:131">(%i)</xr> —
oczywiście zachowując kolejność elementów w próbie.

==Test zgodności rozkładów w dwóch populacjach==

Mamy dwie próby. Hipoteza zerowa mówi, że zostały wylosowane z tego
samego rozkładu. Ciąg zer i jedynek tworzymy w następujący sposób:

Elementy obu prób ustawiamy w jeden ciąg w kolejności od najmniejszej
do największej<ref>Jeśli wartości losowane są z rozkładów ciągłych, to
wystąpienie jednakowych wartości jest teoretycznie niemożliwe. W
praktyce wartości zapisujemy ze skończoną dokładnością; zwykle
przyjmuje się, że jednakowe wartości można pominąć.</ref>. Elementom
pierwszej próby przypisujemy jedynki, a drugiej — zera.

Jeśli obie próby losowano z tej samej populacji, to liczba serii w tak określonym
ciągu podlega statystyce <xr
id="eq:131">(%i)</xr>, czyli ponownie możemy
stosować test Walda-Wolfowitza.

---------------
<references>

WnioskowanieStatystyczne/Test serii

2026-03-29T14:27:49Z

Durka: /* Wyprowadzenie analityczne */

[[Wnioskowanie_Statystyczne_-_wykład]]

=Test serii Walda-Wolfowitza=

Serią nazywamy ciąg jednakowych elementów. W poniższym przykładzie
mamy sześć serii (po trzy serie zer i jedynek):
<center>
<math>\underline{1}\overline{00}\underline{1}\overline{00}\underline{111}
\overline{0}</math>.
</center>
Nie jest to oczywiście jedyna kombinacja kolejności pięciu zer i pięciu jedynek,
dająca w wyniku sześć serii. Ponieważ każda pojedyncza kombinacja jest jednakowo
prawdopodobna (jeśli jest wynikiem niezależnych losowań), to prawdopodobieństwo
uzyskania danej liczby serii będzie tym większe, im więcej różnych kombinacji
będzie dawać w wyniku tę liczbę serii. Sformułujmy więc problem ogólnie:

<blockquote>
Mamy <math>N=n_1+n_2</math> elementów, w tym <math>n_1</math> zer i <math>n_2</math> jedynek.
Na ile sposobów możemy je rozłożyć, aby uzyskać <math>k</math> serii?
</blockquote>

{| role="presentation" class="wikitable mw-collapsible mw-collapsed"
| kod 
|-
| <pre>

import matplotlib.pyplot as plt
import numpy

n1=25 # zera
n2=30 # jedynki
n=n1+n2
ile_losowan=1000

wynik=numpy.zeros(ile_losowan, dtype=numpy.int32)

for i in range(0, ile_losowan):
losowanie=numpy.zeros(n, dtype=numpy.int32)
while numpy.sum(losowanie) < n2:
losowanie[numpy.random.randint(0,n)]=1
#print(numpy.array_str(losowanie,max_line_width=numpy.inf).replace(" ",""), "\n")
zmiany=1
for j in range(1, n):
if(losowanie[j] != losowanie[j-1]):
zmiany += 1
wynik[i]=zmiany

plt.hist(wynik, bins=range(0,n))
plt.xlabel("$k$")
plt.ylabel("$P(k)$")
plt.title(f"$n_1$ = {n1}, $n_2$ = {n2}, {ile_losowan} losowań")
plt.show()
</pre>
|}

{| role="presentation" class="wikitable mw-collapsible mw-collapsed"
| animacja dla 1000 
|-
|[[Plik:Testserii1000.png|center|thumb|600px|<figure id="fig:132"></figure>Histogram liczby serii <math>k</math> w <math>10^3</math> niezależnych losowaniach 30 zer i 25 jedynek.]]
|}

[[Plik:Testserii.png|center|thumb|600px|<figure id="fig:132"></figure>Histogram liczby serii <math>k</math> w <math>10^5</math> niezależnych losowaniach 30 zer i 25 jedynek.]]
[[Plik:Testserii_10.9.png|center|thumb|600px|<figure id="fig:132"></figure>Histogram liczby serii <math>k</math> w <math>10^9</math> niezależnych losowaniach 30 zer i 25 jedynek.]]
[[Plik:Testserii_10.9.log.png|center|thumb|600px|<figure id="fig:132"></figure>Histogram liczby serii <math>k</math> w <math>10^9</math> niezależnych losowaniach 30 zer i 25 jedynek (skala logarytmiczna).]]



==Wyprowadzenie analityczne==

Wróćmy do prostszego przykładu, zawierającego pięć jedynek i pięć zer.
Podział na serie możemy interpretować jak przypisanie liczbom od jeden do dziesięciu
(pozycje w ciągu) zera lub jedynki:
<center>
{| class="wikitable"
|-
|'''1'''
|'''0'''
|'''0'''
|'''1'''
|'''0'''
|'''0'''
|'''1'''
|'''1'''
|'''1'''
|'''0'''
|-
|1
|2
|3
|4
|5
|6
|7
|8
|9
|10
|}
</center>

Inaczej mówiąc, konkretny ciąg <math>N</math> zer i jedynek wyznaczony
jest przez wylosowanie spośród liczb od jednego do <math>N</math> tych
liczb, którym mają być przypisane jedynki (pozostałym będą przypisane
zera — lub odwrotnie). Czyli wszystkich możliwych ciągów
<math>n_1</math> zer i <math>n_2</math> jedynek będzie tyle, na ile
sposobów można wylosować <math>n_1</math> elementów spośród
<math>N</math>. Policzmy: pozycję (czyli numer, wypisany w dolnym
rzędzie powyższej tabeli) pierwszego elementu losujemy spośród
<math>N</math> możliwości, drugiego — spośród <math>N-1</math>
pozostałych możliwości (jedna pozycja jest już zajęta), i tak dalej,
aż pozycję ostatniego z <math>n_1</math> elementów losujemy spośród
<math>N-n_1</math> pozostałych możliwości. Liczba możliwych wyników
będzie iloczynem tych wszystkich liczb, czyli wyniesie
<math>N\cdot(N-1)\cdot(N-2)\cdot\ \dots\ \cdot (N-n_1) =
N!/(N-n_1)!</math> Skoro wszystkie jedynki są jednakowe i nie
rozróżniamy wyników różniących się ich kolejnością, to wynik ten
musimy podzielić przez liczbę różnych ustawień kolejności elementów
(liczbę permutacji) zbioru <math>n_1</math>-elementowego. Wyniesie ona
<math>n_1\cdot(n_1-1)\cdot\ \dots\ \cdot 1</math>, czyli
<math>n_1!</math> Ostatecznie jako liczbę różnych ustawień
<math>n_1</math> zer i <math>N-n_1</math> jedynek dostajemy:

<center>
<math>\displaystyle
\frac{N!}{(N-n_1)!\ n_1!} = \binom{N}{n_1}.
</math>
</center>

Jest to znany z [[WnioskowanieStatystyczne/Rozklady-przyklady#Rozkład dwumianowy|rozdziału o rozkładzie dwumianowym]] symbol Newtona <math>\binom{N}{n_1}</math>. Jego własności
symetrii zgadzają się z sytuacją, w ktorej "wybierać" możemy albo <math>n_1</math> zer
albo <math>n_2</math> jedynek:

<center><math>\displaystyle
\binom{N}{n_1}=\binom{n_1+n_2}{n_1}=\frac{(n_1+n_2)!}{n_1! n_2!}=\binom{n_1+n_2}{n_2}=\binom{N}{n_2}.
</math></center>

Pozostaje policzyć, ile z tych możliwości (przy ustalonych liczbach
<math>n_1</math> jedynek i <math>n_2</math> zer) wygeneruje ciąg
wyników, w którym będzie dokładnie <math>k</math> serii?

<center>
<math>\displaystyle\underline{1}\overline{00}\underline{1}\overline{00}\underline{111}
\overline{0}</math>
</center>

===Jeśli liczba serii <math>k</math> jest parzysta===
będziemy mieć tyle samo serii jedynek i zer (po <math>k/2</math>). Aby rozmieścić <math>n_1</math> jedynek w <math>k/2</math> seriach musimy wyznaczyć <math>k/2-1</math> punktów podziału na serie; w powyższym przykładzie będą to (kropki) '''1.1.111''' — było 6 serii, więc mamy 2 punkty podziału. Inaczej losujemy spośród <math>n_1-1</math> możliwych punktów podziału <math>k/2-1</math> podziałów, jak wynika z liczby serii <math>k</math>. Daje to <math>\binom{n_1-1}{k/2-1}</math> możliwości. W miejsca podziału (oznaczone kropkami) wstawiamy serie zer; analogicznie możemy to zrobić na <math>\binom{n_2-1}{k/2-1}</math> możliwości (w przykładzie: '''00.00.0'''). Liczbę tę należy pomnożyć przez dwa ze względu na możliwość zamiany miejscami zer i jedynek. Prawdopodobieństwo danej liczby serii dostaniemy — zgodnie z klasyczną definicją prawdopodobieństwa — dzieląc liczbę wszystkich tych kombinacji <math>n_1</math> jedynek i <math>n_2</math> zer, które generują dokładnie <math>k</math> serii, przez liczbę wszystkich możliwych kombinacji:

<center>
<math>\displaystyle
P=\frac{ 2\binom{n_1-1}{k/2-1} \binom{n_2-1}{k/2-1}} { \binom{N}{n_1}} \qquad\textrm{dla }\ k\ \textrm{parzystych.}
</math>
</center>

===Jeśli liczba serii <math>k</math> jest nieparzysta===
którychś serii — zer lub jedynek — będzie dokładnie o jeden więcej. <equation id="eq:127"></equation>

<center>
<math>\displaystyle\underline{1}\overline{00}\underline{1}\overline{000}\underline{111}
</math>
</center>

'''Jeśli więcej jest serii jedynek''', mamy <math>(k-1)/2</math> serii zer i <math>(k-1)/2+1</math> serii jedynek. <math>n_1</math> jedynek dzielimy na <math>(k-1)/2+1</math> serii, czyli wyznaczamy <math>(k-1)/2</math> punktów podziału spośród <math>n_1-1</math> możliwych — daje to <math>\binom{n_1-1}{(k-1)/2}</math> możliwości. Z kolei <math>n_2</math> zer dzielimy na <math>(k-1)/2</math> serii, co daje <math>\binom{n_2-1}{(k-1)/2-1}</math> możliwości. Iloczyn tych dwóch wielkości określa liczbę możliwości dających <math>k</math> serii, jeśli więcej jest serii jedynek:

<center>
<equation id="eq:128"><math>\displaystyle \binom{n_1-1}{(k-1)/2} \binom{n_2-1}{(k-1)/2-1} </math></equation>
</center>

'''Jeśli więcej jest serii zer''', to na drodze analogicznego rozumowania dostajemy

<center>
<equation id="eq:129"><math>\displaystyle \binom{n_1-1}{(k-1)/2-1} \binom{n_2-1}{(k-1)/2}. </math></equation>
</center>

Prawdopodobieństwo dla przypadku nieparzystej liczby serii będzie sumą tych dwóch wielkości, podzieloną, jak w przypadku parzystego <math>k</math>, przez liczbę wszystkich możliwości:

<center>
<equation id="eq:130">
<math>\displaystyle\begin{matrix}
P&\!\!\!\!=&\!\!\!\!\frac{
\binom{n_1-1}{(k-1)/2} \binom{n_2-1}{(k-1)/2-1} +
\binom{n_1-1}{(k-1)/2-1} \binom{n_2-1}{(k-1)/2}
}
{{ \binom{N}{n_1}}} \\
&&\textrm{dla }\ k\ \textrm{ nieparzystych.}
\end{matrix}</math></equation>
</center>

===Pozostaje jeszcze rozważyć sytuację===
w której liczba serii jest nieparzysta, jak w punkcie 2., ale mniej liczne
elementy rozłożone są wyłącznie w serie jednoelementowe, na przykład
001010010100, czyli liczba serii wynosi <math>2n+1</math>, gdzie
<math>n</math> jest liczbą mniej licznych elementów (w tym
przykładzie jedynek). Wtedy znika jeden ze składników sumy z licznika
powyższego równania, gdyż zachodzić może wyłącznie
przypadek 2.1 lub 2.2.

Ostatecznie dostajemy następujący wzór na
prawdopodobieństwo wystąpienia <math>k</math> serii w próbie, w której
drogą niezależnych losowań wylosowano <math>n_1</math> zer i
<math>n_2</math> jedynek:

<center>
<equation id="eq:131">
<math>\displaystyle
P(k\mid n_1, n_2)=\begin{cases}
\frac{ 2\binom{n_1-1}{k/2-1} \binom{n_2-1}{k/2-1}}
{ \binom{N}{n_1}}
\quad \textrm{dla }\ k\ \textrm{ parzystych}
\\
\frac{
\binom{n_1-1}{(k-1)/2} \binom{n_2-1}{(k-1)/2-1} +
\binom{n_1-1}{(k-1)/2-1} \binom{n_2-1}{(k-1)/2}
}
{{ \binom{N}{n_1}}}
\\
\quad\qquad\qquad\qquad\qquad\qquad \textrm{dla }\ k\ \textrm{ nieparzystych}
\\
\frac{
\binom{n_\textrm{max}-1}{(k-1)/2}
}
{{ \binom{N}{(k-1)/2}}}
\ \quad\qquad\qquad\textrm{dla }\ k\ \textrm{ nieparzystych i }
n_\textrm{min}=\frac{k-1}{2},
\end{cases}
</math></equation>
</center>

gdzie <math>n_\textrm{min}=\min(n_1, n_2)</math> i
<math>n_\textrm{max}=\max(n_1, n_2)</math>.

Wzór ten określa rozkład statystyki, będącej liczbą serii w próbie złożonej
z dowolnych dwóch rodzajów elementów (oznaczanych powyżej jako '''0''' i '''1'''). Dzięki niemu możemy wreszcie skonstruować kompletny test hipotezy
mówiącej, że dany ciąg jest wynikiem niezależnych losowań. Przypomnijmy dane
z [[WnioskowanieStatystyczne/Testy_nieprametryczne|przykładu o nieuczciwym ankieterze]]:

<center>
'''1101101000101001011101101111010110010101001010100011101'''
</center>

W ciągu tym występuje 25 zer i 30 jedynek, układających się w 37
serii. Na podstawie wzoru <xr id="eq:131">(%i)</xr> możemy obliczyć
rozkład prawdopodobieństwa wylosowania ciągu 25 zer i 30 jedynek, w
którym będzie <math>k</math> serii. Możliwe wartości <math>k</math>
będą w tym przypadku zawierać się między 2 (jedna seria zer i jedna
jedynek) a 51 (ponieważ mniej jest zer, największa liczba serii
odpowiada przypadkowi, w którym wszystkie zera układają się w serie
jednoelementowe). Rozkład prawdopodobieństwa dla tego przypadku
przedstawia rysunek <xr id="fig:132"> %i</xr>.

[[Plik:serie.png|center|thumb|600px|<figure id="fig:132"></figure>Rozkład prawdopodobieństw <math>P(k)</math> liczby serii <math>k</math> w niezależnym losowaniu 30 zer i 25 jedynek.]]

Zastosowania testów opartych na tej statystyce nie ograniczają się do
analizy ciągów zer i jedynek (lub innych dwóch elementów). Poniżej
przedstawiamy jeszcze dwa testy korzystające ze statystyki <xr
id="eq:131">(%i)</xr>.

==Testowanie, czy próba jest wynikiem niezależnych losowań==

Podobny problem — pytanie, czy elementy próby są wynikiem
niezależnych losowań — występuje np. przy testowaniu generatorów
liczb losowych ([[WnioskowanieStatystyczne/Z_komputerem#cite_note-0|będących kluczowym
elementem metod opisywanych w pierwszej części książki]]). Jednak w
tej sytuacji mamy do czynienia z ciągiem dowolnych liczb, a nie dwóch
symboli.

Pomysł jest prosty: ciąg wyników wyrażających się dowolnymi liczbami
możemy zamienić na ciąg zer i jedynek, wybierając próg <math>M</math>
i przypisując wynikom większym od <math>M</math> jedynkę, a mniejszym
— zero. Jeśli chcemy mieć tyle samo zer i jedynek, jako
<math>M</math> możemy wziąć [[WnioskowanieStatystyczne/Momenty#Mediana|medianę]] próby. Do
takiej serii możemy już z powodzeniem stosować opisany w poprzednim
rozdziale test oparty na statystyce <xr id="eq:131">(%i)</xr> —
oczywiście zachowując kolejność elementów w próbie.

==Test zgodności rozkładów w dwóch populacjach==

Mamy dwie próby. Hipoteza zerowa mówi, że zostały wylosowane z tego
samego rozkładu. Ciąg zer i jedynek tworzymy w następujący sposób:

Elementy obu prób ustawiamy w jeden ciąg w kolejności od najmniejszej
do największej<ref>Jeśli wartości losowane są z rozkładów ciągłych, to
wystąpienie jednakowych wartości jest teoretycznie niemożliwe. W
praktyce wartości zapisujemy ze skończoną dokładnością; zwykle
przyjmuje się, że jednakowe wartości można pominąć.</ref>. Elementom
pierwszej próby przypisujemy jedynki, a drugiej — zera.

Jeśli obie próby losowano z tej samej populacji, to liczba serii w tak określonym
ciągu podlega statystyce <xr
id="eq:131">(%i)</xr>, czyli ponownie możemy
stosować test Walda-Wolfowitza.

---------------
<references>

WnioskowanieStatystyczne/Test serii

2026-03-29T14:26:37Z

Durka: /* Wyprowadzenie analityczne */

[[Wnioskowanie_Statystyczne_-_wykład]]

=Test serii Walda-Wolfowitza=

Serią nazywamy ciąg jednakowych elementów. W poniższym przykładzie
mamy sześć serii (po trzy serie zer i jedynek):
<center>
<math>\underline{1}\overline{00}\underline{1}\overline{00}\underline{111}
\overline{0}</math>.
</center>
Nie jest to oczywiście jedyna kombinacja kolejności pięciu zer i pięciu jedynek,
dająca w wyniku sześć serii. Ponieważ każda pojedyncza kombinacja jest jednakowo
prawdopodobna (jeśli jest wynikiem niezależnych losowań), to prawdopodobieństwo
uzyskania danej liczby serii będzie tym większe, im więcej różnych kombinacji
będzie dawać w wyniku tę liczbę serii. Sformułujmy więc problem ogólnie:

<blockquote>
Mamy <math>N=n_1+n_2</math> elementów, w tym <math>n_1</math> zer i <math>n_2</math> jedynek.
Na ile sposobów możemy je rozłożyć, aby uzyskać <math>k</math> serii?
</blockquote>

{| role="presentation" class="wikitable mw-collapsible mw-collapsed"
| kod 
|-
| <pre>

import matplotlib.pyplot as plt
import numpy

n1=25 # zera
n2=30 # jedynki
n=n1+n2
ile_losowan=1000

wynik=numpy.zeros(ile_losowan, dtype=numpy.int32)

for i in range(0, ile_losowan):
losowanie=numpy.zeros(n, dtype=numpy.int32)
while numpy.sum(losowanie) < n2:
losowanie[numpy.random.randint(0,n)]=1
#print(numpy.array_str(losowanie,max_line_width=numpy.inf).replace(" ",""), "\n")
zmiany=1
for j in range(1, n):
if(losowanie[j] != losowanie[j-1]):
zmiany += 1
wynik[i]=zmiany

plt.hist(wynik, bins=range(0,n))
plt.xlabel("$k$")
plt.ylabel("$P(k)$")
plt.title(f"$n_1$ = {n1}, $n_2$ = {n2}, {ile_losowan} losowań")
plt.show()
</pre>
|}

{| role="presentation" class="wikitable mw-collapsible mw-collapsed"
| animacja dla 1000 
|-
|[[Plik:Testserii1000.png|center|thumb|600px|<figure id="fig:132"></figure>Histogram liczby serii <math>k</math> w <math>10^3</math> niezależnych losowaniach 30 zer i 25 jedynek.]]
|}

[[Plik:Testserii.png|center|thumb|600px|<figure id="fig:132"></figure>Histogram liczby serii <math>k</math> w <math>10^5</math> niezależnych losowaniach 30 zer i 25 jedynek.]]
[[Plik:Testserii_10.9.png|center|thumb|600px|<figure id="fig:132"></figure>Histogram liczby serii <math>k</math> w <math>10^9</math> niezależnych losowaniach 30 zer i 25 jedynek.]]
[[Plik:Testserii_10.9.log.png|center|thumb|600px|<figure id="fig:132"></figure>Histogram liczby serii <math>k</math> w <math>10^9</math> niezależnych losowaniach 30 zer i 25 jedynek (skala logarytmiczna).]]



==Wyprowadzenie analityczne==

Wróćmy do prostszego przykładu, zawierającego pięć jedynek i pięć zer.
Podział na serie możemy interpretować jak przypisanie liczbom od jeden do dziesięciu
(pozycje w ciągu) zera lub jedynki:
<center>
{| class="wikitable"
|-
|'''1'''
|'''0'''
|'''0'''
|'''1'''
|'''0'''
|'''0'''
|'''1'''
|'''1'''
|'''1'''
|'''0'''
|-
|1
|2
|3
|4
|5
|6
|7
|8
|9
|10
|}
</center>

Inaczej mówiąc, konkretny ciąg <math>N</math> zer i jedynek wyznaczony
jest przez wylosowanie spośród liczb od jednego do <math>N</math> tych
liczb, którym mają być przypisane jedynki (pozostałym będą przypisane
zera — lub odwrotnie). Czyli wszystkich możliwych ciągów
<math>n_1</math> zer i <math>n_2</math> jedynek będzie tyle, na ile
sposobów można wylosować <math>n_1</math> elementów spośród
<math>N</math>. Policzmy: pozycję (czyli numer, wypisany w dolnym
rzędzie powyższej tabeli) pierwszego elementu losujemy spośród
<math>N</math> możliwości, drugiego — spośród <math>N-1</math>
pozostałych możliwości (jedna pozycja jest już zajęta), i tak dalej,
aż pozycję ostatniego z <math>n_1</math> elementów losujemy spośród
<math>N-n_1</math> pozostałych możliwości. Liczba możliwych wyników
będzie iloczynem tych wszystkich liczb, czyli wyniesie
<math>N\cdot(N-1)\cdot(N-2)\cdot\ \dots\ \cdot (N-n_1) =
N!/(N-n_1)!</math> Skoro wszystkie jedynki są jednakowe i nie
rozróżniamy wyników różniących się ich kolejnością, to wynik ten
musimy podzielić przez liczbę różnych ustawień kolejności elementów
(liczbę permutacji) zbioru <math>n_1</math>-elementowego. Wyniesie ona
<math>n_1\cdot(n_1-1)\cdot\ \dots\ \cdot 1</math>, czyli
<math>n_1!</math> Ostatecznie jako liczbę różnych ustawień
<math>n_1</math> zer i <math>N-n_1</math> jedynek dostajemy:

<center>
<math>\displaystyle
\frac{N!}{(N-n_1)!\ n_1!} = \binom{N}{n_1}.
</math>
</center>

Jest to znany z [[WnioskowanieStatystyczne/Rozklady-przyklady#Rozkład dwumianowy|rozdziału o rozkładzie dwumianowym]] symbol Newtona <math>\binom{N}{n_1}</math>. Jego własności
symetrii zgadzają się z sytuacją, w ktorej "wybierać" możemy albo <math>n_1</math> zer
albo <math>n_2</math> jedynek:

<center><math>\displaystyle
\binom{N}{n_1}=\binom{n_1+n_2}{n_1}=\frac{(n_1+n_2)!}{n_1! n_2!}=\binom{n_1+n_2}{n_2}=\binom{N}{n_2}.
</math></center>

Pozostaje policzyć, ile z tych możliwości (przy ustalonych liczbach
<math>n_1</math> jedynek i <math>n_2</math> zer) wygeneruje ciąg
wyników, w którym będzie dokładnie <math>k</math> serii?

<center>
<math>\displaystyle\underline{1}\overline{00}\underline{1}\overline{00}\underline{111}
\overline{0}</math>.
</center>

===Jeśli liczba serii <math>k</math> jest parzysta===
będziemy mieć tyle samo serii jedynek i zer (po <math>k/2</math>). Aby rozmieścić <math>n_1</math> jedynek w <math>k/2</math> seriach musimy wyznaczyć <math>k/2-1</math> punktów podziału na serie; w powyższym przykładzie będą to (kropki) '''1.1.111''' — było 6 serii, więc mamy 2 punkty podziału. Inaczej losujemy spośród <math>n_1-1</math> możliwych punktów podziału <math>k/2-1</math> podziałów, jak wynika z liczby serii <math>k</math>. Daje to <math>\binom{n_1-1}{k/2-1}</math> możliwości. W miejsca podziału (oznaczone kropkami) wstawiamy serie zer; analogicznie możemy to zrobić na <math>\binom{n_2-1}{k/2-1}</math> możliwości (w przykładzie: '''00.00.0'''). Liczbę tę należy pomnożyć przez dwa ze względu na możliwość zamiany miejscami zer i jedynek. Prawdopodobieństwo danej liczby serii dostaniemy — zgodnie z klasyczną definicją prawdopodobieństwa — dzieląc liczbę wszystkich tych kombinacji <math>n_1</math> jedynek i <math>n_2</math> zer, które generują dokładnie <math>k</math> serii, przez liczbę wszystkich możliwych kombinacji:

<center>
<math>\displaystyle
P=\frac{ 2\binom{n_1-1}{k/2-1} \binom{n_2-1}{k/2-1}} { \binom{N}{n_1}} \qquad\textrm{dla }\ k\ \textrm{parzystych.}
</math>
</center>

===Jeśli liczba serii <math>k</math> jest nieparzysta===
którychś serii — zer lub jedynek — będzie dokładnie o jeden więcej. <equation id="eq:127"></equation>

<center>
<math>\displaystyle\underline{1}\overline{00}\underline{1}\overline{000}\underline{111}
</math>.
</center>

'''Jeśli więcej jest serii jedynek''', mamy <math>(k-1)/2</math> serii zer i <math>(k-1)/2+1</math> serii jedynek. <math>n_1</math> jedynek dzielimy na <math>(k-1)/2+1</math> serii, czyli wyznaczamy <math>(k-1)/2</math> punktów podziału spośród <math>n_1-1</math> możliwych — daje to <math>\binom{n_1-1}{(k-1)/2}</math> możliwości. Z kolei <math>n_2</math> zer dzielimy na <math>(k-1)/2</math> serii, co daje <math>\binom{n_2-1}{(k-1)/2-1}</math> możliwości. Iloczyn tych dwóch wielkości określa liczbę możliwości dających <math>k</math> serii, jeśli więcej jest serii jedynek:

<center>
<equation id="eq:128"><math>\displaystyle \binom{n_1-1}{(k-1)/2} \binom{n_2-1}{(k-1)/2-1} </math></equation>
</center>

'''Jeśli więcej jest serii zer''', to na drodze analogicznego rozumowania dostajemy

<center>
<equation id="eq:129"><math>\displaystyle \binom{n_1-1}{(k-1)/2-1} \binom{n_2-1}{(k-1)/2}. </math></equation>
</center>

Prawdopodobieństwo dla przypadku nieparzystej liczby serii będzie sumą tych dwóch wielkości, podzieloną, jak w przypadku parzystego <math>k</math>, przez liczbę wszystkich możliwości:

<center>
<equation id="eq:130">
<math>\displaystyle\begin{matrix}
P&\!\!\!\!=&\!\!\!\!\frac{
\binom{n_1-1}{(k-1)/2} \binom{n_2-1}{(k-1)/2-1} +
\binom{n_1-1}{(k-1)/2-1} \binom{n_2-1}{(k-1)/2}
}
{{ \binom{N}{n_1}}} \\
&&\textrm{dla }\ k\ \textrm{ nieparzystych.}
\end{matrix}</math></equation>
</center>

===Pozostaje jeszcze rozważyć sytuację===
w której liczba serii jest nieparzysta, jak w punkcie 2., ale mniej liczne
elementy rozłożone są wyłącznie w serie jednoelementowe, na przykład
001010010100, czyli liczba serii wynosi <math>2n+1</math>, gdzie
<math>n</math> jest liczbą mniej licznych elementów (w tym
przykładzie jedynek). Wtedy znika jeden ze składników sumy z licznika
powyższego równania, gdyż zachodzić może wyłącznie
przypadek 2.1 lub 2.2.

Ostatecznie dostajemy następujący wzór na
prawdopodobieństwo wystąpienia <math>k</math> serii w próbie, w której
drogą niezależnych losowań wylosowano <math>n_1</math> zer i
<math>n_2</math> jedynek:

<center>
<equation id="eq:131">
<math>\displaystyle
P(k\mid n_1, n_2)=\begin{cases}
\frac{ 2\binom{n_1-1}{k/2-1} \binom{n_2-1}{k/2-1}}
{ \binom{N}{n_1}}
\quad \textrm{dla }\ k\ \textrm{ parzystych}
\\
\frac{
\binom{n_1-1}{(k-1)/2} \binom{n_2-1}{(k-1)/2-1} +
\binom{n_1-1}{(k-1)/2-1} \binom{n_2-1}{(k-1)/2}
}
{{ \binom{N}{n_1}}}
\\
\quad\qquad\qquad\qquad\qquad\qquad \textrm{dla }\ k\ \textrm{ nieparzystych}
\\
\frac{
\binom{n_\textrm{max}-1}{(k-1)/2}
}
{{ \binom{N}{(k-1)/2}}}
\ \quad\qquad\qquad\textrm{dla }\ k\ \textrm{ nieparzystych i }
n_\textrm{min}=\frac{k-1}{2},
\end{cases}
</math></equation>
</center>

gdzie <math>n_\textrm{min}=\min(n_1, n_2)</math> i
<math>n_\textrm{max}=\max(n_1, n_2)</math>.

Wzór ten określa rozkład statystyki, będącej liczbą serii w próbie złożonej
z dowolnych dwóch rodzajów elementów (oznaczanych powyżej jako '''0''' i '''1'''). Dzięki niemu możemy wreszcie skonstruować kompletny test hipotezy
mówiącej, że dany ciąg jest wynikiem niezależnych losowań. Przypomnijmy dane
z [[WnioskowanieStatystyczne/Testy_nieprametryczne|przykładu o nieuczciwym ankieterze]]:

<center>
'''1101101000101001011101101111010110010101001010100011101'''
</center>

W ciągu tym występuje 25 zer i 30 jedynek, układających się w 37
serii. Na podstawie wzoru <xr id="eq:131">(%i)</xr> możemy obliczyć
rozkład prawdopodobieństwa wylosowania ciągu 25 zer i 30 jedynek, w
którym będzie <math>k</math> serii. Możliwe wartości <math>k</math>
będą w tym przypadku zawierać się między 2 (jedna seria zer i jedna
jedynek) a 51 (ponieważ mniej jest zer, największa liczba serii
odpowiada przypadkowi, w którym wszystkie zera układają się w serie
jednoelementowe). Rozkład prawdopodobieństwa dla tego przypadku
przedstawia rysunek <xr id="fig:132"> %i</xr>.

[[Plik:serie.png|center|thumb|600px|<figure id="fig:132"></figure>Rozkład prawdopodobieństw <math>P(k)</math> liczby serii <math>k</math> w niezależnym losowaniu 30 zer i 25 jedynek.]]

Zastosowania testów opartych na tej statystyce nie ograniczają się do
analizy ciągów zer i jedynek (lub innych dwóch elementów). Poniżej
przedstawiamy jeszcze dwa testy korzystające ze statystyki <xr
id="eq:131">(%i)</xr>.

==Testowanie, czy próba jest wynikiem niezależnych losowań==

Podobny problem — pytanie, czy elementy próby są wynikiem
niezależnych losowań — występuje np. przy testowaniu generatorów
liczb losowych ([[WnioskowanieStatystyczne/Z_komputerem#cite_note-0|będących kluczowym
elementem metod opisywanych w pierwszej części książki]]). Jednak w
tej sytuacji mamy do czynienia z ciągiem dowolnych liczb, a nie dwóch
symboli.

Pomysł jest prosty: ciąg wyników wyrażających się dowolnymi liczbami
możemy zamienić na ciąg zer i jedynek, wybierając próg <math>M</math>
i przypisując wynikom większym od <math>M</math> jedynkę, a mniejszym
— zero. Jeśli chcemy mieć tyle samo zer i jedynek, jako
<math>M</math> możemy wziąć [[WnioskowanieStatystyczne/Momenty#Mediana|medianę]] próby. Do
takiej serii możemy już z powodzeniem stosować opisany w poprzednim
rozdziale test oparty na statystyce <xr id="eq:131">(%i)</xr> —
oczywiście zachowując kolejność elementów w próbie.

==Test zgodności rozkładów w dwóch populacjach==

Mamy dwie próby. Hipoteza zerowa mówi, że zostały wylosowane z tego
samego rozkładu. Ciąg zer i jedynek tworzymy w następujący sposób:

Elementy obu prób ustawiamy w jeden ciąg w kolejności od najmniejszej
do największej<ref>Jeśli wartości losowane są z rozkładów ciągłych, to
wystąpienie jednakowych wartości jest teoretycznie niemożliwe. W
praktyce wartości zapisujemy ze skończoną dokładnością; zwykle
przyjmuje się, że jednakowe wartości można pominąć.</ref>. Elementom
pierwszej próby przypisujemy jedynki, a drugiej — zera.

Jeśli obie próby losowano z tej samej populacji, to liczba serii w tak określonym
ciągu podlega statystyce <xr
id="eq:131">(%i)</xr>, czyli ponownie możemy
stosować test Walda-Wolfowitza.

---------------
<references>

WnioskowanieStatystyczne/Test serii

2026-03-29T14:12:23Z

Durka: /* Test serii Walda-Wolfowitza */

[[Wnioskowanie_Statystyczne_-_wykład]]

=Test serii Walda-Wolfowitza=

Serią nazywamy ciąg jednakowych elementów. W poniższym przykładzie
mamy sześć serii (po trzy serie zer i jedynek):
<center>
<math>\underline{1}\overline{00}\underline{1}\overline{00}\underline{111}
\overline{0}</math>.
</center>
Nie jest to oczywiście jedyna kombinacja kolejności pięciu zer i pięciu jedynek,
dająca w wyniku sześć serii. Ponieważ każda pojedyncza kombinacja jest jednakowo
prawdopodobna (jeśli jest wynikiem niezależnych losowań), to prawdopodobieństwo
uzyskania danej liczby serii będzie tym większe, im więcej różnych kombinacji
będzie dawać w wyniku tę liczbę serii. Sformułujmy więc problem ogólnie:

<blockquote>
Mamy <math>N=n_1+n_2</math> elementów, w tym <math>n_1</math> zer i <math>n_2</math> jedynek.
Na ile sposobów możemy je rozłożyć, aby uzyskać <math>k</math> serii?
</blockquote>

{| role="presentation" class="wikitable mw-collapsible mw-collapsed"
| kod 
|-
| <pre>

import matplotlib.pyplot as plt
import numpy

n1=25 # zera
n2=30 # jedynki
n=n1+n2
ile_losowan=1000

wynik=numpy.zeros(ile_losowan, dtype=numpy.int32)

for i in range(0, ile_losowan):
losowanie=numpy.zeros(n, dtype=numpy.int32)
while numpy.sum(losowanie) < n2:
losowanie[numpy.random.randint(0,n)]=1
#print(numpy.array_str(losowanie,max_line_width=numpy.inf).replace(" ",""), "\n")
zmiany=1
for j in range(1, n):
if(losowanie[j] != losowanie[j-1]):
zmiany += 1
wynik[i]=zmiany

plt.hist(wynik, bins=range(0,n))
plt.xlabel("$k$")
plt.ylabel("$P(k)$")
plt.title(f"$n_1$ = {n1}, $n_2$ = {n2}, {ile_losowan} losowań")
plt.show()
</pre>
|}

{| role="presentation" class="wikitable mw-collapsible mw-collapsed"
| animacja dla 1000 
|-
|[[Plik:Testserii1000.png|center|thumb|600px|<figure id="fig:132"></figure>Histogram liczby serii <math>k</math> w <math>10^3</math> niezależnych losowaniach 30 zer i 25 jedynek.]]
|}

[[Plik:Testserii.png|center|thumb|600px|<figure id="fig:132"></figure>Histogram liczby serii <math>k</math> w <math>10^5</math> niezależnych losowaniach 30 zer i 25 jedynek.]]
[[Plik:Testserii_10.9.png|center|thumb|600px|<figure id="fig:132"></figure>Histogram liczby serii <math>k</math> w <math>10^9</math> niezależnych losowaniach 30 zer i 25 jedynek.]]
[[Plik:Testserii_10.9.log.png|center|thumb|600px|<figure id="fig:132"></figure>Histogram liczby serii <math>k</math> w <math>10^9</math> niezależnych losowaniach 30 zer i 25 jedynek (skala logarytmiczna).]]



==Wyprowadzenie analityczne==

Wróćmy do prostszego przykładu, zawierającego pięć jedynek i pięć zer.
Podział na serie możemy interpretować jak przypisanie liczbom od jeden do dziesięciu
(pozycje w ciągu) zera lub jedynki:
<center>
{| class="wikitable"
|-
|'''1'''
|'''0'''
|'''0'''
|'''1'''
|'''0'''
|'''0'''
|'''1'''
|'''1'''
|'''1'''
|'''0'''
|-
|1
|2
|3
|4
|5
|6
|7
|8
|9
|10
|}
</center>

Inaczej mówiąc, konkretny ciąg <math>N</math> zer i jedynek wyznaczony
jest przez wylosowanie spośród liczb od jednego do <math>N</math> tych
liczb, którym mają być przypisane jedynki (pozostałym będą przypisane
zera — lub odwrotnie). Czyli wszystkich możliwych ciągów
<math>n_1</math> zer i <math>n_2</math> jedynek będzie tyle, na ile
sposobów można wylosować <math>n_1</math> elementów spośród
<math>N</math>. Policzmy: pozycję (czyli numer, wypisany w dolnym
rzędzie powyższej tabeli) pierwszego elementu losujemy spośród
<math>N</math> możliwości, drugiego — spośród <math>N-1</math>
pozostałych możliwości (jedna pozycja jest już zajęta), i tak dalej,
aż pozycję ostatniego z <math>n_1</math> elementów losujemy spośród
<math>N-n_1</math> pozostałych możliwości. Liczba możliwych wyników
będzie iloczynem tych wszystkich liczb, czyli wyniesie
<math>N\cdot(N-1)\cdot(N-2)\cdot\ \dots\ \cdot (N-n_1) =
N!/(N-n_1)!</math> Skoro wszystkie jedynki są jednakowe i nie
rozróżniamy wyników różniących się ich kolejnością, to wynik ten
musimy podzielić przez liczbę różnych ustawień kolejności elementów
(liczbę permutacji) zbioru <math>n_1</math>-elementowego. Wyniesie ona
<math>n_1\cdot(n_1-1)\cdot\ \dots\ \cdot 1</math>, czyli
<math>n_1!</math> Ostatecznie jako liczbę różnych ustawień
<math>n_1</math> zer i <math>N-n_1</math> jedynek dostajemy:
<center>
<math>
\frac{N!}{(N-n_1)!\ n_1!} = \binom{N}{n_1}.
</math>
</center>
Jest to znany z [[WnioskowanieStatystyczne/Rozklady-przyklady#Rozkład dwumianowy|rozdziału o rozkładzie dwumianowym]] symbol Newtona <math>\binom{N}{n_1}</math>. Jego własności
symetrii zgadzają się z sytuacją, w ktorej "wybierać" możemy albo <math>n_1</math> zer
albo <math>n_2</math> jedynek:

<center><math>
\binom{N}{n_1}=\binom{n_1+n_2}{n_1}=\frac{(n_1+n_2)!}{n_1! n_2!}=\binom{n_1+n_2}{n_2}=\binom{N}{n_2}.
</math></center>

Pozostaje policzyć, ile z tych możliwości (przy ustalonych liczbach
<math>n_1</math> jedynek i <math>n_2</math> zer) wygeneruje ciąg
wyników, w którym będzie dokładnie <math>k</math> serii?

<center>
<math>\underline{1}\overline{00}\underline{1}\overline{00}\underline{111}
\overline{0}</math>.
</center>

#'''Jeśli liczba serii <math>k</math> jest parzysta''', to będziemy mieć tyle samo serii jedynek i zer (po <math>k/2</math>). Aby rozmieścić <math>n_1</math> jedynek w <math>k/2</math> seriach musimy wyznaczyć <math>k/2-1</math> punktów podziału na serie; w powyższym przykładzie będą to (kropki) '''1.1.111''' — było 6 serii, więc mamy 2 punkty podziału. Inaczej losujemy spośród <math>n_1-1</math> możliwych punktów podziału <math>k/2-1</math> podziałów, jak wynika z liczby serii <math>k</math>. Daje to <math>\binom{n_1-1}{k/2-1}</math> możliwości. W miejsca podziału (oznaczone kropkami) wstawiamy serie zer; analogicznie możemy to zrobić na <math>\binom{n_2-1}{k/2-1}</math> możliwości (w przykładzie: '''00.00.0'''). Liczbę tę należy pomnożyć przez dwa ze względu na możliwość zamiany miejscami zer i jedynek. Prawdopodobieństwo danej liczby serii dostaniemy — zgodnie z klasyczną definicją prawdopodobieństwa — dzieląc liczbę wszystkich tych kombinacji <math>n_1</math> jedynek i <math>n_2</math> zer, które generują dokładnie <math>k</math> serii, przez liczbę wszystkich możliwych kombinacji: <math> P=\frac{ 2\binom{n_1-1}{k/2-1} \binom{n_2-1}{k/2-1}} { \binom{N}{n_1}} \qquad\textrm{dla }\ k\ \textrm{parzystych.} </math>
#'''Jeśli liczba serii <math>k</math> jest nieparzysta,''' to którychś serii — zer lub jedynek — będzie dokładnie o jeden więcej. <equation id="eq:127"></equation>

<center>
<math>\underline{1}\overline{00}\underline{1}\overline{000}\underline{111}
</math>.
</center>

##'''jeśli więcej jest serii jedynek''', mamy <math>(k-1)/2</math> serii zer i <math>(k-1)/2+1</math> serii jedynek. <math>n_1</math> jedynek dzielimy na <math>(k-1)/2+1</math> serii, czyli wyznaczamy <math>(k-1)/2</math> punktów podziału spośród <math>n_1-1</math> możliwych — daje to <math>\binom{n_1-1}{(k-1)/2}</math> możliwości. Z kolei <math>n_2</math> zer dzielimy na <math>(k-1)/2</math> serii, co daje <math>\binom{n_2-1}{(k-1)/2-1}</math> możliwości. Iloczyn tych dwóch wielkości określa liczbę możliwości dających <math>k</math> serii, jeśli więcej jest serii jedynek: <equation id="eq:128"><math> \binom{n_1-1}{(k-1)/2} \binom{n_2-1}{(k-1)/2-1} </math></equation>
##'''jeśli więcej jest serii zer''', to na drodze analogicznego rozumowania dostajemy <equation id="eq:129"><math> \binom{n_1-1}{(k-1)/2-1} \binom{n_2-1}{(k-1)/2}. </math></equation>

Prawdopodobieństwo dla przypadku nieparzystej liczby serii będzie sumą tych dwóch wielkości, podzieloną, jak w przypadku parzystego <math>k</math>, przez liczbę wszystkich możliwości:
<equation id="eq:130">
<math>\begin{matrix}
P&\!\!\!\!=&\!\!\!\!\frac{
\binom{n_1-1}{(k-1)/2} \binom{n_2-1}{(k-1)/2-1} +
\binom{n_1-1}{(k-1)/2-1} \binom{n_2-1}{(k-1)/2}
}
{{ \binom{N}{n_1}}} \\
&&\textrm{dla }\ k\ \textrm{ nieparzystych.}
\end{matrix}</math></equation>

'''Pozostaje jeszcze rozważyć sytuację''', w której liczba serii jest
nieparzysta, jak w punkcie 2., ale mniej liczne
elementy rozłożone są wyłącznie w serie jednoelementowe, na przykład
001010010100, czyli liczba serii wynosi <math>2n+1</math>, gdzie
<math>n</math> jest liczbą mniej licznych elementów (w tym
przykładzie jedynek). Wtedy znika jeden ze składników sumy z licznika
powyższego równania, gdyż zachodzić może wyłącznie
przypadek 2.1 lub 2.2.

Ostatecznie dostajemy następujący wzór na
prawdopodobieństwo wystąpienia <math>k</math> serii w próbie, w której
drogą niezależnych losowań wylosowano <math>n_1</math> zer i
<math>n_2</math> jedynek:
<equation id="eq:131">
<math>
P(k\mid n_1, n_2)=\begin{cases}
\frac{ 2\binom{n_1-1}{k/2-1} \binom{n_2-1}{k/2-1}}
{ \binom{N}{n_1}}
\quad \textrm{dla }\ k\ \textrm{ parzystych}
\\
\frac{
\binom{n_1-1}{(k-1)/2} \binom{n_2-1}{(k-1)/2-1} +
\binom{n_1-1}{(k-1)/2-1} \binom{n_2-1}{(k-1)/2}
}
{{ \binom{N}{n_1}}}
\\
\quad\qquad\qquad\qquad\qquad\qquad \textrm{dla }\ k\ \textrm{ nieparzystych}
\\
\frac{
\binom{n_\textrm{max}-1}{(k-1)/2}
}
{{ \binom{N}{(k-1)/2}}}
\ \quad\qquad\qquad\textrm{dla }\ k\ \textrm{ nieparzystych i }
n_\textrm{min}=\frac{k-1}{2},
\end{cases}
</math></equation>
gdzie <math>n_\textrm{min}=\min(n_1, n_2)</math> i
<math>n_\textrm{max}=\max(n_1, n_2)</math>.

Wzór ten określa rozkład statystyki, będącej liczbą serii w próbie złożonej
z dowolnych dwóch rodzajów elementów (oznaczanych powyżej jako '''0''' i '''1'''). Dzięki niemu możemy wreszcie skonstruować kompletny test hipotezy
mówiącej, że dany ciąg jest wynikiem niezależnych losowań. Przypomnijmy dane
z [[WnioskowanieStatystyczne/Testy_nieprametryczne|przykładu o nieuczciwym ankieterze]]:

<center>
'''1101101000101001011101101111010110010101001010100011101'''
</center>

W ciągu tym występuje 25 zer i 30 jedynek, układających się w 37
serii. Na podstawie wzoru <xr id="eq:131">(%i)</xr> możemy obliczyć
rozkład prawdopodobieństwa wylosowania ciągu 25 zer i 30 jedynek, w
którym będzie <math>k</math> serii. Możliwe wartości <math>k</math>
będą w tym przypadku zawierać się między 2 (jedna seria zer i jedna
jedynek) a 51 (ponieważ mniej jest zer, największa liczba serii
odpowiada przypadkowi, w którym wszystkie zera układają się w serie
jednoelementowe). Rozkład prawdopodobieństwa dla tego przypadku
przedstawia rysunek <xr id="fig:132"> %i</xr>.

[[Plik:serie.png|center|thumb|600px|<figure id="fig:132"></figure>Rozkład prawdopodobieństw <math>P(k)</math> liczby serii <math>k</math> w niezależnym losowaniu 30 zer i 25 jedynek.]]

Zastosowania testów opartych na tej statystyce nie ograniczają się do
analizy ciągów zer i jedynek (lub innych dwóch elementów). Poniżej
przedstawiamy jeszcze dwa testy korzystające ze statystyki <xr
id="eq:131">(%i)</xr>.

==Testowanie, czy próba jest wynikiem niezależnych losowań==

Podobny problem — pytanie, czy elementy próby są wynikiem
niezależnych losowań — występuje np. przy testowaniu generatorów
liczb losowych ([[WnioskowanieStatystyczne/Z_komputerem#cite_note-0|będących kluczowym
elementem metod opisywanych w pierwszej części książki]]). Jednak w
tej sytuacji mamy do czynienia z ciągiem dowolnych liczb, a nie dwóch
symboli.

Pomysł jest prosty: ciąg wyników wyrażających się dowolnymi liczbami
możemy zamienić na ciąg zer i jedynek, wybierając próg <math>M</math>
i przypisując wynikom większym od <math>M</math> jedynkę, a mniejszym
— zero. Jeśli chcemy mieć tyle samo zer i jedynek, jako
<math>M</math> możemy wziąć [[WnioskowanieStatystyczne/Momenty#Mediana|medianę]] próby. Do
takiej serii możemy już z powodzeniem stosować opisany w poprzednim
rozdziale test oparty na statystyce <xr id="eq:131">(%i)</xr> —
oczywiście zachowując kolejność elementów w próbie.

==Test zgodności rozkładów w dwóch populacjach==

Mamy dwie próby. Hipoteza zerowa mówi, że zostały wylosowane z tego
samego rozkładu. Ciąg zer i jedynek tworzymy w następujący sposób:

Elementy obu prób ustawiamy w jeden ciąg w kolejności od najmniejszej
do największej<ref>Jeśli wartości losowane są z rozkładów ciągłych, to
wystąpienie jednakowych wartości jest teoretycznie niemożliwe. W
praktyce wartości zapisujemy ze skończoną dokładnością; zwykle
przyjmuje się, że jednakowe wartości można pominąć.</ref>. Elementom
pierwszej próby przypisujemy jedynki, a drugiej — zera.

Jeśli obie próby losowano z tej samej populacji, to liczba serii w tak określonym
ciągu podlega statystyce <xr
id="eq:131">(%i)</xr>, czyli ponownie możemy
stosować test Walda-Wolfowitza.

---------------
<references>

WnioskowanieStatystyczne/Test serii

2026-03-29T10:29:34Z

Durka: /* Test serii Walda-Wolfowitza */

[[Wnioskowanie_Statystyczne_-_wykład]]

=Test serii Walda-Wolfowitza=

Serią nazywamy ciąg jednakowych elementów. W poniższym przykładzie
mamy sześć serii (po trzy serie zer i jedynek):
<center>
<math>\underline{1}\overline{00}\underline{1}\overline{00}\underline{111}
\overline{0}</math>.
</center>
Nie jest to oczywiście jedyna kombinacja kolejności pięciu zer i pięciu jedynek,
dająca w wyniku sześć serii. Ponieważ każda pojedyncza kombinacja jest jednakowo
prawdopodobna (jeśli jest wynikiem niezależnych losowań), to prawdopodobieństwo
uzyskania danej liczby serii będzie tym większe, im więcej różnych kombinacji
będzie dawać w wyniku tę liczbę serii. Sformułujmy więc problem ogólnie:

<blockquote>
Mamy <math>N=n_1+n_2</math> elementów, w tym <math>n_1</math> zer i <math>n_2</math> jedynek.
Na ile sposobów możemy je rozłożyć, aby uzyskać <math>k</math> serii?
</blockquote>

{| role="presentation" class="wikitable mw-collapsible mw-collapsed"
| kod 
|-
| <pre>

import matplotlib.pyplot as plt
import numpy

n1=25 # zera
n2=30 # jedynki
n=n1+n2
ile_losowan=1000

wynik=numpy.zeros(ile_losowan, dtype=numpy.int32)

for i in range(0, ile_losowan):
losowanie=numpy.zeros(n, dtype=numpy.int32)
while numpy.sum(losowanie) < n2:
losowanie[numpy.random.randint(0,n)]=1
#print(numpy.array_str(losowanie,max_line_width=numpy.inf).replace(" ",""), "\n")
zmiany=1
for j in range(1, n):
if(losowanie[j] != losowanie[j-1]):
zmiany += 1
wynik[i]=zmiany

plt.hist(wynik, bins=range(0,n))
plt.xlabel("$k$")
plt.ylabel("$P(k)$")
plt.title(f"$n_1$ = {n1}, $n_2$ = {n2}, {ile_losowan} losowań")
plt.show()
</pre>
|}

{| role="presentation" class="wikitable mw-collapsible mw-collapsed"
| animacja dla 1000 
|-
|[[Plik:Testserii1000.png|center|thumb|600px|<figure id="fig:132"></figure>Histogram liczby serii <math>k</math> w <math>10^3</math> niezależnych losowaniach 30 zer i 25 jedynek.]]
|}

[[Plik:Testserii.png|center|thumb|600px|<figure id="fig:132"></figure>Histogram liczby serii <math>k</math> w <math>10^5</math> niezależnych losowaniach 30 zer i 25 jedynek.]]
[[Plik:Testserii_10.9.png|center|thumb|600px|<figure id="fig:132"></figure>Histogram liczby serii <math>k</math> w <math>10^9</math> niezależnych losowaniach 30 zer i 25 jedynek.]]
[[Plik:Testserii_10.9.log.png|center|thumb|600px|<figure id="fig:132"></figure>Histogram liczby serii <math>k</math> w <math>10^9</math> niezależnych losowaniach 30 zer i 25 jedynek (skala logarytmiczna).]]



Wróćmy do prostszego przykładu, zawierającego pięć jedynek i pięć zer.
Podział na serie możemy interpretować jak przypisanie liczbom od jeden do dziesięciu
(pozycje w ciągu) zera lub jedynki:
<center>
{| class="wikitable"
|-
|'''1'''
|'''0'''
|'''0'''
|'''1'''
|'''0'''
|'''0'''
|'''1'''
|'''1'''
|'''1'''
|'''0'''
|-
|1
|2
|3
|4
|5
|6
|7
|8
|9
|10
|}
</center>

Inaczej mówiąc, konkretny ciąg <math>N</math> zer i jedynek wyznaczony
jest przez wylosowanie spośród liczb od jednego do <math>N</math> tych
liczb, którym mają być przypisane jedynki (pozostałym będą przypisane
zera — lub odwrotnie). Czyli wszystkich możliwych ciągów
<math>n_1</math> zer i <math>n_2</math> jedynek będzie tyle, na ile
sposobów można wylosować <math>n_1</math> elementów spośród
<math>N</math>. Policzmy: pozycję (czyli numer, wypisany w dolnym
rzędzie powyższej tabeli) pierwszego elementu losujemy spośród
<math>N</math> możliwości, drugiego — spośród <math>N-1</math>
pozostałych możliwości (jedna pozycja jest już zajęta), i tak dalej,
aż pozycję ostatniego z <math>n_1</math> elementów losujemy spośród
<math>N-n_1</math> pozostałych możliwości. Liczba możliwych wyników
będzie iloczynem tych wszystkich liczb, czyli wyniesie
<math>N\cdot(N-1)\cdot(N-2)\cdot\ \dots\ \cdot (N-n_1) =
N!/(N-n_1)!</math> Skoro wszystkie jedynki są jednakowe i nie
rozróżniamy wyników różniących się ich kolejnością, to wynik ten
musimy podzielić przez liczbę różnych ustawień kolejności elementów
(liczbę permutacji) zbioru <math>n_1</math>-elementowego. Wyniesie ona
<math>n_1\cdot(n_1-1)\cdot\ \dots\ \cdot 1</math>, czyli
<math>n_1!</math> Ostatecznie jako liczbę różnych ustawień
<math>n_1</math> zer i <math>N-n_1</math> jedynek dostajemy:
<center>
<math>
\frac{N!}{(N-n_1)!\ n_1!} = \binom{N}{n_1}.
</math>
</center>
Jest to znany z [[WnioskowanieStatystyczne/Rozklady-przyklady#Rozkład dwumianowy|rozdziału o rozkładzie dwumianowym]] symbol Newtona <math>\binom{N}{n_1}</math>. Jego własności
symetrii zgadzają się z sytuacją, w ktorej "wybierać" możemy albo <math>n_1</math> zer
albo <math>n_2</math> jedynek:

<center><math>
\binom{N}{n_1}=\binom{n_1+n_2}{n_1}=\frac{(n_1+n_2)!}{n_1! n_2!}=\binom{n_1+n_2}{n_2}=\binom{N}{n_2}.
</math></center>

Pozostaje policzyć, ile z tych możliwości (przy ustalonych liczbach
<math>n_1</math> jedynek i <math>n_2</math> zer) wygeneruje ciąg
wyników, w którym będzie dokładnie <math>k</math> serii?

<center>
<math>\underline{1}\overline{00}\underline{1}\overline{00}\underline{111}
\overline{0}</math>.
</center>

#'''Jeśli liczba serii <math>k</math> jest parzysta''', to będziemy mieć tyle samo serii jedynek i zer (po <math>k/2</math>). Aby rozmieścić <math>n_1</math> jedynek w <math>k/2</math> seriach musimy wyznaczyć <math>k/2-1</math> punktów podziału na serie; w powyższym przykładzie będą to (kropki) '''1.1.111''' — było 6 serii, więc mamy 2 punkty podziału. Inaczej losujemy spośród <math>n_1-1</math> możliwych punktów podziału <math>k/2-1</math> podziałów, jak wynika z liczby serii <math>k</math>. Daje to <math>\binom{n_1-1}{k/2-1}</math> możliwości. W miejsca podziału (oznaczone kropkami) wstawiamy serie zer; analogicznie możemy to zrobić na <math>\binom{n_2-1}{k/2-1}</math> możliwości (w przykładzie: '''00.00.0'''). Liczbę tę należy pomnożyć przez dwa ze względu na możliwość zamiany miejscami zer i jedynek. Prawdopodobieństwo danej liczby serii dostaniemy — zgodnie z klasyczną definicją prawdopodobieństwa — dzieląc liczbę wszystkich tych kombinacji <math>n_1</math> jedynek i <math>n_2</math> zer, które generują dokładnie <math>k</math> serii, przez liczbę wszystkich możliwych kombinacji: <math> P=\frac{ 2\binom{n_1-1}{k/2-1} \binom{n_2-1}{k/2-1}} { \binom{N}{n_1}} \qquad\textrm{dla }\ k\ \textrm{parzystych.} </math>
#'''Jeśli liczba serii <math>k</math> jest nieparzysta,''' to którychś serii — zer lub jedynek — będzie dokładnie o jeden więcej. <equation id="eq:127"></equation>

<center>
<math>\underline{1}\overline{00}\underline{1}\overline{000}\underline{111}
</math>.
</center>

##'''jeśli więcej jest serii jedynek''', mamy <math>(k-1)/2</math> serii zer i <math>(k-1)/2+1</math> serii jedynek. <math>n_1</math> jedynek dzielimy na <math>(k-1)/2+1</math> serii, czyli wyznaczamy <math>(k-1)/2</math> punktów podziału spośród <math>n_1-1</math> możliwych — daje to <math>\binom{n_1-1}{(k-1)/2}</math> możliwości. Z kolei <math>n_2</math> zer dzielimy na <math>(k-1)/2</math> serii, co daje <math>\binom{n_2-1}{(k-1)/2-1}</math> możliwości. Iloczyn tych dwóch wielkości określa liczbę możliwości dających <math>k</math> serii, jeśli więcej jest serii jedynek: <equation id="eq:128"><math> \binom{n_1-1}{(k-1)/2} \binom{n_2-1}{(k-1)/2-1} </math></equation>
##'''jeśli więcej jest serii zer''', to na drodze analogicznego rozumowania dostajemy <equation id="eq:129"><math> \binom{n_1-1}{(k-1)/2-1} \binom{n_2-1}{(k-1)/2}. </math></equation>

Prawdopodobieństwo dla przypadku nieparzystej liczby serii będzie sumą tych dwóch wielkości, podzieloną, jak w przypadku parzystego <math>k</math>, przez liczbę wszystkich możliwości:
<equation id="eq:130">
<math>\begin{matrix}
P&\!\!\!\!=&\!\!\!\!\frac{
\binom{n_1-1}{(k-1)/2} \binom{n_2-1}{(k-1)/2-1} +
\binom{n_1-1}{(k-1)/2-1} \binom{n_2-1}{(k-1)/2}
}
{{ \binom{N}{n_1}}} \\
&&\textrm{dla }\ k\ \textrm{ nieparzystych.}
\end{matrix}</math></equation>

'''Pozostaje jeszcze rozważyć sytuację''', w której liczba serii jest
nieparzysta, jak w punkcie 2., ale mniej liczne
elementy rozłożone są wyłącznie w serie jednoelementowe, na przykład
001010010100, czyli liczba serii wynosi <math>2n+1</math>, gdzie
<math>n</math> jest liczbą mniej licznych elementów (w tym
przykładzie jedynek). Wtedy znika jeden ze składników sumy z licznika
powyższego równania, gdyż zachodzić może wyłącznie
przypadek 2.1 lub 2.2.

Ostatecznie dostajemy następujący wzór na
prawdopodobieństwo wystąpienia <math>k</math> serii w próbie, w której
drogą niezależnych losowań wylosowano <math>n_1</math> zer i
<math>n_2</math> jedynek:
<equation id="eq:131">
<math>
P(k\mid n_1, n_2)=\begin{cases}
\frac{ 2\binom{n_1-1}{k/2-1} \binom{n_2-1}{k/2-1}}
{ \binom{N}{n_1}}
\quad \textrm{dla }\ k\ \textrm{ parzystych}
\\
\frac{
\binom{n_1-1}{(k-1)/2} \binom{n_2-1}{(k-1)/2-1} +
\binom{n_1-1}{(k-1)/2-1} \binom{n_2-1}{(k-1)/2}
}
{{ \binom{N}{n_1}}}
\\
\quad\qquad\qquad\qquad\qquad\qquad \textrm{dla }\ k\ \textrm{ nieparzystych}
\\
\frac{
\binom{n_\textrm{max}-1}{(k-1)/2}
}
{{ \binom{N}{(k-1)/2}}}
\ \quad\qquad\qquad\textrm{dla }\ k\ \textrm{ nieparzystych i }
n_\textrm{min}=\frac{k-1}{2},
\end{cases}
</math></equation>
gdzie <math>n_\textrm{min}=\min(n_1, n_2)</math> i
<math>n_\textrm{max}=\max(n_1, n_2)</math>.

Wzór ten określa rozkład statystyki, będącej liczbą serii w próbie złożonej
z dowolnych dwóch rodzajów elementów (oznaczanych powyżej jako '''0''' i '''1'''). Dzięki niemu możemy wreszcie skonstruować kompletny test hipotezy
mówiącej, że dany ciąg jest wynikiem niezależnych losowań. Przypomnijmy dane
z [[WnioskowanieStatystyczne/Testy_nieprametryczne|przykładu o nieuczciwym ankieterze]]:

<center>
'''1101101000101001011101101111010110010101001010100011101'''
</center>

W ciągu tym występuje 25 zer i 30 jedynek, układających się w 37
serii. Na podstawie wzoru <xr id="eq:131">(%i)</xr> możemy obliczyć
rozkład prawdopodobieństwa wylosowania ciągu 25 zer i 30 jedynek, w
którym będzie <math>k</math> serii. Możliwe wartości <math>k</math>
będą w tym przypadku zawierać się między 2 (jedna seria zer i jedna
jedynek) a 51 (ponieważ mniej jest zer, największa liczba serii
odpowiada przypadkowi, w którym wszystkie zera układają się w serie
jednoelementowe). Rozkład prawdopodobieństwa dla tego przypadku
przedstawia rysunek <xr id="fig:132"> %i</xr>.

[[Plik:serie.png|center|thumb|600px|<figure id="fig:132"></figure>Rozkład prawdopodobieństw <math>P(k)</math> liczby serii <math>k</math> w niezależnym losowaniu 30 zer i 25 jedynek.]]

Zastosowania testów opartych na tej statystyce nie ograniczają się do
analizy ciągów zer i jedynek (lub innych dwóch elementów). Poniżej
przedstawiamy jeszcze dwa testy korzystające ze statystyki <xr
id="eq:131">(%i)</xr>.

==Testowanie, czy próba jest wynikiem niezależnych losowań==

Podobny problem — pytanie, czy elementy próby są wynikiem
niezależnych losowań — występuje np. przy testowaniu generatorów
liczb losowych ([[WnioskowanieStatystyczne/Z_komputerem#cite_note-0|będących kluczowym
elementem metod opisywanych w pierwszej części książki]]). Jednak w
tej sytuacji mamy do czynienia z ciągiem dowolnych liczb, a nie dwóch
symboli.

Pomysł jest prosty: ciąg wyników wyrażających się dowolnymi liczbami
możemy zamienić na ciąg zer i jedynek, wybierając próg <math>M</math>
i przypisując wynikom większym od <math>M</math> jedynkę, a mniejszym
— zero. Jeśli chcemy mieć tyle samo zer i jedynek, jako
<math>M</math> możemy wziąć [[WnioskowanieStatystyczne/Momenty#Mediana|medianę]] próby. Do
takiej serii możemy już z powodzeniem stosować opisany w poprzednim
rozdziale test oparty na statystyce <xr id="eq:131">(%i)</xr> —
oczywiście zachowując kolejność elementów w próbie.

==Test zgodności rozkładów w dwóch populacjach==

Mamy dwie próby. Hipoteza zerowa mówi, że zostały wylosowane z tego
samego rozkładu. Ciąg zer i jedynek tworzymy w następujący sposób:

Elementy obu prób ustawiamy w jeden ciąg w kolejności od najmniejszej
do największej<ref>Jeśli wartości losowane są z rozkładów ciągłych, to
wystąpienie jednakowych wartości jest teoretycznie niemożliwe. W
praktyce wartości zapisujemy ze skończoną dokładnością; zwykle
przyjmuje się, że jednakowe wartości można pominąć.</ref>. Elementom
pierwszej próby przypisujemy jedynki, a drugiej — zera.

Jeśli obie próby losowano z tej samej populacji, to liczba serii w tak określonym
ciągu podlega statystyce <xr
id="eq:131">(%i)</xr>, czyli ponownie możemy
stosować test Walda-Wolfowitza.

---------------
<references>

WnioskowanieStatystyczne/Test serii

2026-03-29T10:16:30Z

Durka: /* Test serii Walda-Wolfowitza */

[[Wnioskowanie_Statystyczne_-_wykład]]

=Test serii Walda-Wolfowitza=

Serią nazywamy ciąg jednakowych elementów. W poniższym przykładzie
mamy sześć serii (po trzy serie zer i jedynek):
<center>
<math>\underline{1}\overline{00}\underline{1}\overline{00}\underline{111}
\overline{0}</math>.
</center>
Nie jest to oczywiście jedyna kombinacja kolejności pięciu zer i pięciu jedynek,
dająca w wyniku sześć serii. Ponieważ każda pojedyncza kombinacja jest jednakowo
prawdopodobna (jeśli jest wynikiem niezależnych losowań), to prawdopodobieństwo
uzyskania danej liczby serii będzie tym większe, im więcej różnych kombinacji
będzie dawać w wyniku tę liczbę serii. Sformułujmy więc problem ogólnie:

<blockquote>
Mamy <math>N=n_1+n_2</math> elementów, w tym <math>n_1</math> zer i <math>n_2</math> jedynek.
Na ile sposobów możemy je rozłożyć, aby uzyskać <math>k</math> serii?
</blockquote>

{| role="presentation" class="wikitable mw-collapsible mw-collapsed"
| kod 
|-
| <pre>

import matplotlib.pyplot as plt
import numpy

n1=25 # zera
n2=30 # jedynki
n=n1+n2
ile_losowan=1000

wynik=numpy.zeros(ile_losowan, dtype=numpy.int32)

for i in range(0, ile_losowan):
losowanie=numpy.zeros(n, dtype=numpy.int32)
while numpy.sum(losowanie) < n2:
losowanie[numpy.random.randint(0,n)]=1
#print(numpy.array_str(losowanie,max_line_width=numpy.inf).replace(" ",""), "\n")
zmiany=1
for j in range(1, n):
if(losowanie[j] != losowanie[j-1]):
zmiany += 1
wynik[i]=zmiany

plt.hist(wynik, bins=range(0,n))
plt.xlabel("$k$")
plt.ylabel("$P(k)$")
#plt.title("$n_1 = 30, n_2 = 25$")
plt.title(f"$n_1$ = {n1}, $n_2$ = {n2}, {ile_losowan} losowań")
plt.show()
</pre>
|}

{| role="presentation" class="wikitable mw-collapsible mw-collapsed"
| animacja dla 1000 
|-
|[[Plik:Testserii1000.png|center|thumb|600px|<figure id="fig:132"></figure>Histogram liczby serii <math>k</math> w <math>10^3</math> niezależnych losowaniach 30 zer i 25 jedynek.]]
|}

[[Plik:Testserii.png|center|thumb|600px|<figure id="fig:132"></figure>Histogram liczby serii <math>k</math> w <math>10^5</math> niezależnych losowaniach 30 zer i 25 jedynek.]]
[[Plik:Testserii_10.9.png|center|thumb|600px|<figure id="fig:132"></figure>Histogram liczby serii <math>k</math> w <math>10^9</math> niezależnych losowaniach 30 zer i 25 jedynek.]]
[[Plik:Testserii_10.9.log.png|center|thumb|600px|<figure id="fig:132"></figure>Histogram liczby serii <math>k</math> w <math>10^9</math> niezależnych losowaniach 30 zer i 25 jedynek (skala logarytmiczna).]]



Wróćmy do prostszego przykładu, zawierającego pięć jedynek i pięć zer.
Podział na serie możemy interpretować jak przypisanie liczbom od jeden do dziesięciu
(pozycje w ciągu) zera lub jedynki:
<center>
{| class="wikitable"
|-
|'''1'''
|'''0'''
|'''0'''
|'''1'''
|'''0'''
|'''0'''
|'''1'''
|'''1'''
|'''1'''
|'''0'''
|-
|1
|2
|3
|4
|5
|6
|7
|8
|9
|10
|}
</center>

Inaczej mówiąc, konkretny ciąg <math>N</math> zer i jedynek wyznaczony
jest przez wylosowanie spośród liczb od jednego do <math>N</math> tych
liczb, którym mają być przypisane jedynki (pozostałym będą przypisane
zera — lub odwrotnie). Czyli wszystkich możliwych ciągów
<math>n_1</math> zer i <math>n_2</math> jedynek będzie tyle, na ile
sposobów można wylosować <math>n_1</math> elementów spośród
<math>N</math>. Policzmy: pozycję (czyli numer, wypisany w dolnym
rzędzie powyższej tabeli) pierwszego elementu losujemy spośród
<math>N</math> możliwości, drugiego — spośród <math>N-1</math>
pozostałych możliwości (jedna pozycja jest już zajęta), i tak dalej,
aż pozycję ostatniego z <math>n_1</math> elementów losujemy spośród
<math>N-n_1</math> pozostałych możliwości. Liczba możliwych wyników
będzie iloczynem tych wszystkich liczb, czyli wyniesie
<math>N\cdot(N-1)\cdot(N-2)\cdot\ \dots\ \cdot (N-n_1) =
N!/(N-n_1)!</math> Skoro wszystkie jedynki są jednakowe i nie
rozróżniamy wyników różniących się ich kolejnością, to wynik ten
musimy podzielić przez liczbę różnych ustawień kolejności elementów
(liczbę permutacji) zbioru <math>n_1</math>-elementowego. Wyniesie ona
<math>n_1\cdot(n_1-1)\cdot\ \dots\ \cdot 1</math>, czyli
<math>n_1!</math> Ostatecznie jako liczbę różnych ustawień
<math>n_1</math> zer i <math>N-n_1</math> jedynek dostajemy:
<center>
<math>
\frac{N!}{(N-n_1)!\ n_1!} = \binom{N}{n_1}.
</math>
</center>
Jest to znany z [[WnioskowanieStatystyczne/Rozklady-przyklady#Rozkład dwumianowy|rozdziału o rozkładzie dwumianowym]] symbol Newtona <math>\binom{N}{n_1}</math>. Jego własności
symetrii zgadzają się z sytuacją, w ktorej "wybierać" możemy albo <math>n_1</math> zer
albo <math>n_2</math> jedynek:

<center><math>
\binom{N}{n_1}=\binom{n_1+n_2}{n_1}=\frac{(n_1+n_2)!}{n_1! n_2!}=\binom{n_1+n_2}{n_2}=\binom{N}{n_2}.
</math></center>

Pozostaje policzyć, ile z tych możliwości (przy ustalonych liczbach
<math>n_1</math> jedynek i <math>n_2</math> zer) wygeneruje ciąg
wyników, w którym będzie dokładnie <math>k</math> serii?

<center>
<math>\underline{1}\overline{00}\underline{1}\overline{00}\underline{111}
\overline{0}</math>.
</center>

#'''Jeśli liczba serii <math>k</math> jest parzysta''', to będziemy mieć tyle samo serii jedynek i zer (po <math>k/2</math>). Aby rozmieścić <math>n_1</math> jedynek w <math>k/2</math> seriach musimy wyznaczyć <math>k/2-1</math> punktów podziału na serie; w powyższym przykładzie będą to (kropki) '''1.1.111''' — było 6 serii, więc mamy 2 punkty podziału. Inaczej losujemy spośród <math>n_1-1</math> możliwych punktów podziału <math>k/2-1</math> podziałów, jak wynika z liczby serii <math>k</math>. Daje to <math>\binom{n_1-1}{k/2-1}</math> możliwości. W miejsca podziału (oznaczone kropkami) wstawiamy serie zer; analogicznie możemy to zrobić na <math>\binom{n_2-1}{k/2-1}</math> możliwości (w przykładzie: '''00.00.0'''). Liczbę tę należy pomnożyć przez dwa ze względu na możliwość zamiany miejscami zer i jedynek. Prawdopodobieństwo danej liczby serii dostaniemy — zgodnie z klasyczną definicją prawdopodobieństwa — dzieląc liczbę wszystkich tych kombinacji <math>n_1</math> jedynek i <math>n_2</math> zer, które generują dokładnie <math>k</math> serii, przez liczbę wszystkich możliwych kombinacji: <math> P=\frac{ 2\binom{n_1-1}{k/2-1} \binom{n_2-1}{k/2-1}} { \binom{N}{n_1}} \qquad\textrm{dla }\ k\ \textrm{parzystych.} </math>
#'''Jeśli liczba serii <math>k</math> jest nieparzysta,''' to którychś serii — zer lub jedynek — będzie dokładnie o jeden więcej. <equation id="eq:127"></equation>

<center>
<math>\underline{1}\overline{00}\underline{1}\overline{000}\underline{111}
</math>.
</center>

##'''jeśli więcej jest serii jedynek''', mamy <math>(k-1)/2</math> serii zer i <math>(k-1)/2+1</math> serii jedynek. <math>n_1</math> jedynek dzielimy na <math>(k-1)/2+1</math> serii, czyli wyznaczamy <math>(k-1)/2</math> punktów podziału spośród <math>n_1-1</math> możliwych — daje to <math>\binom{n_1-1}{(k-1)/2}</math> możliwości. Z kolei <math>n_2</math> zer dzielimy na <math>(k-1)/2</math> serii, co daje <math>\binom{n_2-1}{(k-1)/2-1}</math> możliwości. Iloczyn tych dwóch wielkości określa liczbę możliwości dających <math>k</math> serii, jeśli więcej jest serii jedynek: <equation id="eq:128"><math> \binom{n_1-1}{(k-1)/2} \binom{n_2-1}{(k-1)/2-1} </math></equation>
##'''jeśli więcej jest serii zer''', to na drodze analogicznego rozumowania dostajemy <equation id="eq:129"><math> \binom{n_1-1}{(k-1)/2-1} \binom{n_2-1}{(k-1)/2}. </math></equation>

Prawdopodobieństwo dla przypadku nieparzystej liczby serii będzie sumą tych dwóch wielkości, podzieloną, jak w przypadku parzystego <math>k</math>, przez liczbę wszystkich możliwości:
<equation id="eq:130">
<math>\begin{matrix}
P&\!\!\!\!=&\!\!\!\!\frac{
\binom{n_1-1}{(k-1)/2} \binom{n_2-1}{(k-1)/2-1} +
\binom{n_1-1}{(k-1)/2-1} \binom{n_2-1}{(k-1)/2}
}
{{ \binom{N}{n_1}}} \\
&&\textrm{dla }\ k\ \textrm{ nieparzystych.}
\end{matrix}</math></equation>

'''Pozostaje jeszcze rozważyć sytuację''', w której liczba serii jest
nieparzysta, jak w punkcie 2., ale mniej liczne
elementy rozłożone są wyłącznie w serie jednoelementowe, na przykład
001010010100, czyli liczba serii wynosi <math>2n+1</math>, gdzie
<math>n</math> jest liczbą mniej licznych elementów (w tym
przykładzie jedynek). Wtedy znika jeden ze składników sumy z licznika
powyższego równania, gdyż zachodzić może wyłącznie
przypadek 2.1 lub 2.2.

Ostatecznie dostajemy następujący wzór na
prawdopodobieństwo wystąpienia <math>k</math> serii w próbie, w której
drogą niezależnych losowań wylosowano <math>n_1</math> zer i
<math>n_2</math> jedynek:
<equation id="eq:131">
<math>
P(k\mid n_1, n_2)=\begin{cases}
\frac{ 2\binom{n_1-1}{k/2-1} \binom{n_2-1}{k/2-1}}
{ \binom{N}{n_1}}
\quad \textrm{dla }\ k\ \textrm{ parzystych}
\\
\frac{
\binom{n_1-1}{(k-1)/2} \binom{n_2-1}{(k-1)/2-1} +
\binom{n_1-1}{(k-1)/2-1} \binom{n_2-1}{(k-1)/2}
}
{{ \binom{N}{n_1}}}
\\
\quad\qquad\qquad\qquad\qquad\qquad \textrm{dla }\ k\ \textrm{ nieparzystych}
\\
\frac{
\binom{n_\textrm{max}-1}{(k-1)/2}
}
{{ \binom{N}{(k-1)/2}}}
\ \quad\qquad\qquad\textrm{dla }\ k\ \textrm{ nieparzystych i }
n_\textrm{min}=\frac{k-1}{2},
\end{cases}
</math></equation>
gdzie <math>n_\textrm{min}=\min(n_1, n_2)</math> i
<math>n_\textrm{max}=\max(n_1, n_2)</math>.

Wzór ten określa rozkład statystyki, będącej liczbą serii w próbie złożonej
z dowolnych dwóch rodzajów elementów (oznaczanych powyżej jako '''0''' i '''1'''). Dzięki niemu możemy wreszcie skonstruować kompletny test hipotezy
mówiącej, że dany ciąg jest wynikiem niezależnych losowań. Przypomnijmy dane
z [[WnioskowanieStatystyczne/Testy_nieprametryczne|przykładu o nieuczciwym ankieterze]]:

<center>
'''1101101000101001011101101111010110010101001010100011101'''
</center>

W ciągu tym występuje 25 zer i 30 jedynek, układających się w 37
serii. Na podstawie wzoru <xr id="eq:131">(%i)</xr> możemy obliczyć
rozkład prawdopodobieństwa wylosowania ciągu 25 zer i 30 jedynek, w
którym będzie <math>k</math> serii. Możliwe wartości <math>k</math>
będą w tym przypadku zawierać się między 2 (jedna seria zer i jedna
jedynek) a 51 (ponieważ mniej jest zer, największa liczba serii
odpowiada przypadkowi, w którym wszystkie zera układają się w serie
jednoelementowe). Rozkład prawdopodobieństwa dla tego przypadku
przedstawia rysunek <xr id="fig:132"> %i</xr>.

[[Plik:serie.png|center|thumb|600px|<figure id="fig:132"></figure>Rozkład prawdopodobieństw <math>P(k)</math> liczby serii <math>k</math> w niezależnym losowaniu 30 zer i 25 jedynek.]]

Zastosowania testów opartych na tej statystyce nie ograniczają się do
analizy ciągów zer i jedynek (lub innych dwóch elementów). Poniżej
przedstawiamy jeszcze dwa testy korzystające ze statystyki <xr
id="eq:131">(%i)</xr>.

==Testowanie, czy próba jest wynikiem niezależnych losowań==

Podobny problem — pytanie, czy elementy próby są wynikiem
niezależnych losowań — występuje np. przy testowaniu generatorów
liczb losowych ([[WnioskowanieStatystyczne/Z_komputerem#cite_note-0|będących kluczowym
elementem metod opisywanych w pierwszej części książki]]). Jednak w
tej sytuacji mamy do czynienia z ciągiem dowolnych liczb, a nie dwóch
symboli.

Pomysł jest prosty: ciąg wyników wyrażających się dowolnymi liczbami
możemy zamienić na ciąg zer i jedynek, wybierając próg <math>M</math>
i przypisując wynikom większym od <math>M</math> jedynkę, a mniejszym
— zero. Jeśli chcemy mieć tyle samo zer i jedynek, jako
<math>M</math> możemy wziąć [[WnioskowanieStatystyczne/Momenty#Mediana|medianę]] próby. Do
takiej serii możemy już z powodzeniem stosować opisany w poprzednim
rozdziale test oparty na statystyce <xr id="eq:131">(%i)</xr> —
oczywiście zachowując kolejność elementów w próbie.

==Test zgodności rozkładów w dwóch populacjach==

Mamy dwie próby. Hipoteza zerowa mówi, że zostały wylosowane z tego
samego rozkładu. Ciąg zer i jedynek tworzymy w następujący sposób:

Elementy obu prób ustawiamy w jeden ciąg w kolejności od najmniejszej
do największej<ref>Jeśli wartości losowane są z rozkładów ciągłych, to
wystąpienie jednakowych wartości jest teoretycznie niemożliwe. W
praktyce wartości zapisujemy ze skończoną dokładnością; zwykle
przyjmuje się, że jednakowe wartości można pominąć.</ref>. Elementom
pierwszej próby przypisujemy jedynki, a drugiej — zera.

Jeśli obie próby losowano z tej samej populacji, to liczba serii w tak określonym
ciągu podlega statystyce <xr
id="eq:131">(%i)</xr>, czyli ponownie możemy
stosować test Walda-Wolfowitza.

---------------
<references>

Plik:Testserii1000.png

2026-03-29T10:11:04Z

Durka: animacja 7 wyników dla testu serii przy 1000 losowań

== Opis ==
animacja 7 wyników dla testu serii przy 1000 losowań

WnioskowanieStatystyczne/Test serii

2026-03-29T10:09:47Z

Durka: /* Test serii Walda-Wolfowitza */

[[Wnioskowanie_Statystyczne_-_wykład]]

=Test serii Walda-Wolfowitza=

Serią nazywamy ciąg jednakowych elementów. W poniższym przykładzie
mamy sześć serii (po trzy serie zer i jedynek):
<center>
<math>\underline{1}\overline{00}\underline{1}\overline{00}\underline{111}
\overline{0}</math>.
</center>
Nie jest to oczywiście jedyna kombinacja kolejności pięciu zer i pięciu jedynek,
dająca w wyniku sześć serii. Ponieważ każda pojedyncza kombinacja jest jednakowo
prawdopodobna (jeśli jest wynikiem niezależnych losowań), to prawdopodobieństwo
uzyskania danej liczby serii będzie tym większe, im więcej różnych kombinacji
będzie dawać w wyniku tę liczbę serii. Sformułujmy więc problem ogólnie:

<blockquote>
Mamy <math>N=n_1+n_2</math> elementów, w tym <math>n_1</math> zer i <math>n_2</math> jedynek.
Na ile sposobów możemy je rozłożyć, aby uzyskać <math>k</math> serii?
</blockquote>

{| role="presentation" class="wikitable mw-collapsible mw-collapsed"
| kod 
|-
| <pre>

import matplotlib.pyplot as plt
import numpy

n1=25 # zera
n2=30 # jedynki
n=n1+n2
ile_losowan=1000

wynik=numpy.zeros(ile_losowan, dtype=numpy.int32)

for i in range(0, ile_losowan):
losowanie=numpy.zeros(n, dtype=numpy.int32)
while numpy.sum(losowanie) < n2:
losowanie[numpy.random.randint(0,n)]=1
#print(numpy.array_str(losowanie,max_line_width=numpy.inf).replace(" ",""), "\n")
zmiany=1
for j in range(1, n):
if(losowanie[j] != losowanie[j-1]):
zmiany += 1
wynik[i]=zmiany

plt.hist(wynik, bins=range(0,n))
plt.xlabel("$k$")
plt.ylabel("$P(k)$")
#plt.title("$n_1 = 30, n_2 = 25$")
plt.title(f"$n_1$ = {n1}, $n_2$ = {n2}, {ile_losowan} losowań")
plt.show()
</pre>
|}

[[Plik:Testserii1000.png|center|thumb|600px|<figure id="fig:132"></figure>Histogram liczby serii <math>k</math> w <math>10^3</math> niezależnych losowaniach 30 zer i 25 jedynek.]]

[[Plik:Testserii.png|center|thumb|600px|<figure id="fig:132"></figure>Histogram liczby serii <math>k</math> w <math>10^5</math> niezależnych losowaniach 30 zer i 25 jedynek.]]
[[Plik:Testserii_10.9.png|center|thumb|600px|<figure id="fig:132"></figure>Histogram liczby serii <math>k</math> w <math>10^9</math> niezależnych losowaniach 30 zer i 25 jedynek.]]
[[Plik:Testserii_10.9.log.png|center|thumb|600px|<figure id="fig:132"></figure>Histogram liczby serii <math>k</math> w <math>10^9</math> niezależnych losowaniach 30 zer i 25 jedynek (skala logarytmiczna).]]



Wróćmy do prostszego przykładu, zawierającego pięć jedynek i pięć zer.
Podział na serie możemy interpretować jak przypisanie liczbom od jeden do dziesięciu
(pozycje w ciągu) zera lub jedynki:
<center>
{| class="wikitable"
|-
|'''1'''
|'''0'''
|'''0'''
|'''1'''
|'''0'''
|'''0'''
|'''1'''
|'''1'''
|'''1'''
|'''0'''
|-
|1
|2
|3
|4
|5
|6
|7
|8
|9
|10
|}
</center>

Inaczej mówiąc, konkretny ciąg <math>N</math> zer i jedynek wyznaczony
jest przez wylosowanie spośród liczb od jednego do <math>N</math> tych
liczb, którym mają być przypisane jedynki (pozostałym będą przypisane
zera — lub odwrotnie). Czyli wszystkich możliwych ciągów
<math>n_1</math> zer i <math>n_2</math> jedynek będzie tyle, na ile
sposobów można wylosować <math>n_1</math> elementów spośród
<math>N</math>. Policzmy: pozycję (czyli numer, wypisany w dolnym
rzędzie powyższej tabeli) pierwszego elementu losujemy spośród
<math>N</math> możliwości, drugiego — spośród <math>N-1</math>
pozostałych możliwości (jedna pozycja jest już zajęta), i tak dalej,
aż pozycję ostatniego z <math>n_1</math> elementów losujemy spośród
<math>N-n_1</math> pozostałych możliwości. Liczba możliwych wyników
będzie iloczynem tych wszystkich liczb, czyli wyniesie
<math>N\cdot(N-1)\cdot(N-2)\cdot\ \dots\ \cdot (N-n_1) =
N!/(N-n_1)!</math> Skoro wszystkie jedynki są jednakowe i nie
rozróżniamy wyników różniących się ich kolejnością, to wynik ten
musimy podzielić przez liczbę różnych ustawień kolejności elementów
(liczbę permutacji) zbioru <math>n_1</math>-elementowego. Wyniesie ona
<math>n_1\cdot(n_1-1)\cdot\ \dots\ \cdot 1</math>, czyli
<math>n_1!</math> Ostatecznie jako liczbę różnych ustawień
<math>n_1</math> zer i <math>N-n_1</math> jedynek dostajemy:
<center>
<math>
\frac{N!}{(N-n_1)!\ n_1!} = \binom{N}{n_1}.
</math>
</center>
Jest to znany z [[WnioskowanieStatystyczne/Rozklady-przyklady#Rozkład dwumianowy|rozdziału o rozkładzie dwumianowym]] symbol Newtona <math>\binom{N}{n_1}</math>. Jego własności
symetrii zgadzają się z sytuacją, w ktorej "wybierać" możemy albo <math>n_1</math> zer
albo <math>n_2</math> jedynek:

<center><math>
\binom{N}{n_1}=\binom{n_1+n_2}{n_1}=\frac{(n_1+n_2)!}{n_1! n_2!}=\binom{n_1+n_2}{n_2}=\binom{N}{n_2}.
</math></center>

Pozostaje policzyć, ile z tych możliwości (przy ustalonych liczbach
<math>n_1</math> jedynek i <math>n_2</math> zer) wygeneruje ciąg
wyników, w którym będzie dokładnie <math>k</math> serii?

<center>
<math>\underline{1}\overline{00}\underline{1}\overline{00}\underline{111}
\overline{0}</math>.
</center>

#'''Jeśli liczba serii <math>k</math> jest parzysta''', to będziemy mieć tyle samo serii jedynek i zer (po <math>k/2</math>). Aby rozmieścić <math>n_1</math> jedynek w <math>k/2</math> seriach musimy wyznaczyć <math>k/2-1</math> punktów podziału na serie; w powyższym przykładzie będą to (kropki) '''1.1.111''' — było 6 serii, więc mamy 2 punkty podziału. Inaczej losujemy spośród <math>n_1-1</math> możliwych punktów podziału <math>k/2-1</math> podziałów, jak wynika z liczby serii <math>k</math>. Daje to <math>\binom{n_1-1}{k/2-1}</math> możliwości. W miejsca podziału (oznaczone kropkami) wstawiamy serie zer; analogicznie możemy to zrobić na <math>\binom{n_2-1}{k/2-1}</math> możliwości (w przykładzie: '''00.00.0'''). Liczbę tę należy pomnożyć przez dwa ze względu na możliwość zamiany miejscami zer i jedynek. Prawdopodobieństwo danej liczby serii dostaniemy — zgodnie z klasyczną definicją prawdopodobieństwa — dzieląc liczbę wszystkich tych kombinacji <math>n_1</math> jedynek i <math>n_2</math> zer, które generują dokładnie <math>k</math> serii, przez liczbę wszystkich możliwych kombinacji: <math> P=\frac{ 2\binom{n_1-1}{k/2-1} \binom{n_2-1}{k/2-1}} { \binom{N}{n_1}} \qquad\textrm{dla }\ k\ \textrm{parzystych.} </math>
#'''Jeśli liczba serii <math>k</math> jest nieparzysta,''' to którychś serii — zer lub jedynek — będzie dokładnie o jeden więcej. <equation id="eq:127"></equation>

<center>
<math>\underline{1}\overline{00}\underline{1}\overline{000}\underline{111}
</math>.
</center>

##'''jeśli więcej jest serii jedynek''', mamy <math>(k-1)/2</math> serii zer i <math>(k-1)/2+1</math> serii jedynek. <math>n_1</math> jedynek dzielimy na <math>(k-1)/2+1</math> serii, czyli wyznaczamy <math>(k-1)/2</math> punktów podziału spośród <math>n_1-1</math> możliwych — daje to <math>\binom{n_1-1}{(k-1)/2}</math> możliwości. Z kolei <math>n_2</math> zer dzielimy na <math>(k-1)/2</math> serii, co daje <math>\binom{n_2-1}{(k-1)/2-1}</math> możliwości. Iloczyn tych dwóch wielkości określa liczbę możliwości dających <math>k</math> serii, jeśli więcej jest serii jedynek: <equation id="eq:128"><math> \binom{n_1-1}{(k-1)/2} \binom{n_2-1}{(k-1)/2-1} </math></equation>
##'''jeśli więcej jest serii zer''', to na drodze analogicznego rozumowania dostajemy <equation id="eq:129"><math> \binom{n_1-1}{(k-1)/2-1} \binom{n_2-1}{(k-1)/2}. </math></equation>

Prawdopodobieństwo dla przypadku nieparzystej liczby serii będzie sumą tych dwóch wielkości, podzieloną, jak w przypadku parzystego <math>k</math>, przez liczbę wszystkich możliwości:
<equation id="eq:130">
<math>\begin{matrix}
P&\!\!\!\!=&\!\!\!\!\frac{
\binom{n_1-1}{(k-1)/2} \binom{n_2-1}{(k-1)/2-1} +
\binom{n_1-1}{(k-1)/2-1} \binom{n_2-1}{(k-1)/2}
}
{{ \binom{N}{n_1}}} \\
&&\textrm{dla }\ k\ \textrm{ nieparzystych.}
\end{matrix}</math></equation>

'''Pozostaje jeszcze rozważyć sytuację''', w której liczba serii jest
nieparzysta, jak w punkcie 2., ale mniej liczne
elementy rozłożone są wyłącznie w serie jednoelementowe, na przykład
001010010100, czyli liczba serii wynosi <math>2n+1</math>, gdzie
<math>n</math> jest liczbą mniej licznych elementów (w tym
przykładzie jedynek). Wtedy znika jeden ze składników sumy z licznika
powyższego równania, gdyż zachodzić może wyłącznie
przypadek 2.1 lub 2.2.

Ostatecznie dostajemy następujący wzór na
prawdopodobieństwo wystąpienia <math>k</math> serii w próbie, w której
drogą niezależnych losowań wylosowano <math>n_1</math> zer i
<math>n_2</math> jedynek:
<equation id="eq:131">
<math>
P(k\mid n_1, n_2)=\begin{cases}
\frac{ 2\binom{n_1-1}{k/2-1} \binom{n_2-1}{k/2-1}}
{ \binom{N}{n_1}}
\quad \textrm{dla }\ k\ \textrm{ parzystych}
\\
\frac{
\binom{n_1-1}{(k-1)/2} \binom{n_2-1}{(k-1)/2-1} +
\binom{n_1-1}{(k-1)/2-1} \binom{n_2-1}{(k-1)/2}
}
{{ \binom{N}{n_1}}}
\\
\quad\qquad\qquad\qquad\qquad\qquad \textrm{dla }\ k\ \textrm{ nieparzystych}
\\
\frac{
\binom{n_\textrm{max}-1}{(k-1)/2}
}
{{ \binom{N}{(k-1)/2}}}
\ \quad\qquad\qquad\textrm{dla }\ k\ \textrm{ nieparzystych i }
n_\textrm{min}=\frac{k-1}{2},
\end{cases}
</math></equation>
gdzie <math>n_\textrm{min}=\min(n_1, n_2)</math> i
<math>n_\textrm{max}=\max(n_1, n_2)</math>.

Wzór ten określa rozkład statystyki, będącej liczbą serii w próbie złożonej
z dowolnych dwóch rodzajów elementów (oznaczanych powyżej jako '''0''' i '''1'''). Dzięki niemu możemy wreszcie skonstruować kompletny test hipotezy
mówiącej, że dany ciąg jest wynikiem niezależnych losowań. Przypomnijmy dane
z [[WnioskowanieStatystyczne/Testy_nieprametryczne|przykładu o nieuczciwym ankieterze]]:

<center>
'''1101101000101001011101101111010110010101001010100011101'''
</center>

W ciągu tym występuje 25 zer i 30 jedynek, układających się w 37
serii. Na podstawie wzoru <xr id="eq:131">(%i)</xr> możemy obliczyć
rozkład prawdopodobieństwa wylosowania ciągu 25 zer i 30 jedynek, w
którym będzie <math>k</math> serii. Możliwe wartości <math>k</math>
będą w tym przypadku zawierać się między 2 (jedna seria zer i jedna
jedynek) a 51 (ponieważ mniej jest zer, największa liczba serii
odpowiada przypadkowi, w którym wszystkie zera układają się w serie
jednoelementowe). Rozkład prawdopodobieństwa dla tego przypadku
przedstawia rysunek <xr id="fig:132"> %i</xr>.

[[Plik:serie.png|center|thumb|600px|<figure id="fig:132"></figure>Rozkład prawdopodobieństw <math>P(k)</math> liczby serii <math>k</math> w niezależnym losowaniu 30 zer i 25 jedynek.]]

Zastosowania testów opartych na tej statystyce nie ograniczają się do
analizy ciągów zer i jedynek (lub innych dwóch elementów). Poniżej
przedstawiamy jeszcze dwa testy korzystające ze statystyki <xr
id="eq:131">(%i)</xr>.

==Testowanie, czy próba jest wynikiem niezależnych losowań==

Podobny problem — pytanie, czy elementy próby są wynikiem
niezależnych losowań — występuje np. przy testowaniu generatorów
liczb losowych ([[WnioskowanieStatystyczne/Z_komputerem#cite_note-0|będących kluczowym
elementem metod opisywanych w pierwszej części książki]]). Jednak w
tej sytuacji mamy do czynienia z ciągiem dowolnych liczb, a nie dwóch
symboli.

Pomysł jest prosty: ciąg wyników wyrażających się dowolnymi liczbami
możemy zamienić na ciąg zer i jedynek, wybierając próg <math>M</math>
i przypisując wynikom większym od <math>M</math> jedynkę, a mniejszym
— zero. Jeśli chcemy mieć tyle samo zer i jedynek, jako
<math>M</math> możemy wziąć [[WnioskowanieStatystyczne/Momenty#Mediana|medianę]] próby. Do
takiej serii możemy już z powodzeniem stosować opisany w poprzednim
rozdziale test oparty na statystyce <xr id="eq:131">(%i)</xr> —
oczywiście zachowując kolejność elementów w próbie.

==Test zgodności rozkładów w dwóch populacjach==

Mamy dwie próby. Hipoteza zerowa mówi, że zostały wylosowane z tego
samego rozkładu. Ciąg zer i jedynek tworzymy w następujący sposób:

Elementy obu prób ustawiamy w jeden ciąg w kolejności od najmniejszej
do największej<ref>Jeśli wartości losowane są z rozkładów ciągłych, to
wystąpienie jednakowych wartości jest teoretycznie niemożliwe. W
praktyce wartości zapisujemy ze skończoną dokładnością; zwykle
przyjmuje się, że jednakowe wartości można pominąć.</ref>. Elementom
pierwszej próby przypisujemy jedynki, a drugiej — zera.

Jeśli obie próby losowano z tej samej populacji, to liczba serii w tak określonym
ciągu podlega statystyce <xr
id="eq:131">(%i)</xr>, czyli ponownie możemy
stosować test Walda-Wolfowitza.

---------------
<references>

WnioskowanieStatystyczne/Test serii

2026-03-29T10:08:04Z

Durka: /* Test serii Walda-Wolfowitza */

[[Wnioskowanie_Statystyczne_-_wykład]]

=Test serii Walda-Wolfowitza=

Serią nazywamy ciąg jednakowych elementów. W poniższym przykładzie
mamy sześć serii (po trzy serie zer i jedynek):
<center>
<math>\underline{1}\overline{00}\underline{1}\overline{00}\underline{111}
\overline{0}</math>.
</center>
Nie jest to oczywiście jedyna kombinacja kolejności pięciu zer i pięciu jedynek,
dająca w wyniku sześć serii. Ponieważ każda pojedyncza kombinacja jest jednakowo
prawdopodobna (jeśli jest wynikiem niezależnych losowań), to prawdopodobieństwo
uzyskania danej liczby serii będzie tym większe, im więcej różnych kombinacji
będzie dawać w wyniku tę liczbę serii. Sformułujmy więc problem ogólnie:

<blockquote>
Mamy <math>N=n_1+n_2</math> elementów, w tym <math>n_1</math> zer i <math>n_2</math> jedynek.
Na ile sposobów możemy je rozłożyć, aby uzyskać <math>k</math> serii?
</blockquote>

{| role="presentation" class="wikitable mw-collapsible mw-collapsed"
| kod 
|-
| <pre>

import matplotlib.pyplot as plt
import numpy

n1=25 # zera
n2=30 # jedynki
n=n1+n2
ile_losowan=1000

wynik=numpy.zeros(ile_losowan, dtype=numpy.int32)

for i in range(0, ile_losowan):
losowanie=numpy.zeros(n, dtype=numpy.int32)
while numpy.sum(losowanie) < n2:
losowanie[numpy.random.randint(0,n)]=1
#print(numpy.array_str(losowanie,max_line_width=numpy.inf).replace(" ",""), "\n")
zmiany=1
for j in range(1, n):
if(losowanie[j] != losowanie[j-1]):
zmiany += 1
wynik[i]=zmiany

plt.hist(wynik, bins=range(0,n))
plt.xlabel("$k$")
plt.ylabel("$P(k)$")
#plt.title("$n_1 = 30, n_2 = 25$")
plt.title(f"$n_1$ = {n1}, $n_2$ = {n2}, {ile_losowan} losowań")
plt.show()
</pre>
|}

[[Plik:Testserii.png|center|thumb|600px|<figure id="fig:132"></figure>Histogram liczby serii <math>k</math> w <math>10^5</math> niezależnych losowaniach 30 zer i 25 jedynek.]]
[[Plik:Testserii_10.9.png|center|thumb|600px|<figure id="fig:132"></figure>Histogram liczby serii <math>k</math> w <math>10^9</math> niezależnych losowaniach 30 zer i 25 jedynek.]]
[[Plik:Testserii_10.9.log.png|center|thumb|600px|<figure id="fig:132"></figure>Histogram liczby serii <math>k</math> w <math>10^9</math> niezależnych losowaniach 30 zer i 25 jedynek (skala logarytmiczna).]]



Wróćmy do prostszego przykładu, zawierającego pięć jedynek i pięć zer.
Podział na serie możemy interpretować jak przypisanie liczbom od jeden do dziesięciu
(pozycje w ciągu) zera lub jedynki:
<center>
{| class="wikitable"
|-
|'''1'''
|'''0'''
|'''0'''
|'''1'''
|'''0'''
|'''0'''
|'''1'''
|'''1'''
|'''1'''
|'''0'''
|-
|1
|2
|3
|4
|5
|6
|7
|8
|9
|10
|}
</center>

Inaczej mówiąc, konkretny ciąg <math>N</math> zer i jedynek wyznaczony
jest przez wylosowanie spośród liczb od jednego do <math>N</math> tych
liczb, którym mają być przypisane jedynki (pozostałym będą przypisane
zera — lub odwrotnie). Czyli wszystkich możliwych ciągów
<math>n_1</math> zer i <math>n_2</math> jedynek będzie tyle, na ile
sposobów można wylosować <math>n_1</math> elementów spośród
<math>N</math>. Policzmy: pozycję (czyli numer, wypisany w dolnym
rzędzie powyższej tabeli) pierwszego elementu losujemy spośród
<math>N</math> możliwości, drugiego — spośród <math>N-1</math>
pozostałych możliwości (jedna pozycja jest już zajęta), i tak dalej,
aż pozycję ostatniego z <math>n_1</math> elementów losujemy spośród
<math>N-n_1</math> pozostałych możliwości. Liczba możliwych wyników
będzie iloczynem tych wszystkich liczb, czyli wyniesie
<math>N\cdot(N-1)\cdot(N-2)\cdot\ \dots\ \cdot (N-n_1) =
N!/(N-n_1)!</math> Skoro wszystkie jedynki są jednakowe i nie
rozróżniamy wyników różniących się ich kolejnością, to wynik ten
musimy podzielić przez liczbę różnych ustawień kolejności elementów
(liczbę permutacji) zbioru <math>n_1</math>-elementowego. Wyniesie ona
<math>n_1\cdot(n_1-1)\cdot\ \dots\ \cdot 1</math>, czyli
<math>n_1!</math> Ostatecznie jako liczbę różnych ustawień
<math>n_1</math> zer i <math>N-n_1</math> jedynek dostajemy:
<center>
<math>
\frac{N!}{(N-n_1)!\ n_1!} = \binom{N}{n_1}.
</math>
</center>
Jest to znany z [[WnioskowanieStatystyczne/Rozklady-przyklady#Rozkład dwumianowy|rozdziału o rozkładzie dwumianowym]] symbol Newtona <math>\binom{N}{n_1}</math>. Jego własności
symetrii zgadzają się z sytuacją, w ktorej "wybierać" możemy albo <math>n_1</math> zer
albo <math>n_2</math> jedynek:

<center><math>
\binom{N}{n_1}=\binom{n_1+n_2}{n_1}=\frac{(n_1+n_2)!}{n_1! n_2!}=\binom{n_1+n_2}{n_2}=\binom{N}{n_2}.
</math></center>

Pozostaje policzyć, ile z tych możliwości (przy ustalonych liczbach
<math>n_1</math> jedynek i <math>n_2</math> zer) wygeneruje ciąg
wyników, w którym będzie dokładnie <math>k</math> serii?

<center>
<math>\underline{1}\overline{00}\underline{1}\overline{00}\underline{111}
\overline{0}</math>.
</center>

#'''Jeśli liczba serii <math>k</math> jest parzysta''', to będziemy mieć tyle samo serii jedynek i zer (po <math>k/2</math>). Aby rozmieścić <math>n_1</math> jedynek w <math>k/2</math> seriach musimy wyznaczyć <math>k/2-1</math> punktów podziału na serie; w powyższym przykładzie będą to (kropki) '''1.1.111''' — było 6 serii, więc mamy 2 punkty podziału. Inaczej losujemy spośród <math>n_1-1</math> możliwych punktów podziału <math>k/2-1</math> podziałów, jak wynika z liczby serii <math>k</math>. Daje to <math>\binom{n_1-1}{k/2-1}</math> możliwości. W miejsca podziału (oznaczone kropkami) wstawiamy serie zer; analogicznie możemy to zrobić na <math>\binom{n_2-1}{k/2-1}</math> możliwości (w przykładzie: '''00.00.0'''). Liczbę tę należy pomnożyć przez dwa ze względu na możliwość zamiany miejscami zer i jedynek. Prawdopodobieństwo danej liczby serii dostaniemy — zgodnie z klasyczną definicją prawdopodobieństwa — dzieląc liczbę wszystkich tych kombinacji <math>n_1</math> jedynek i <math>n_2</math> zer, które generują dokładnie <math>k</math> serii, przez liczbę wszystkich możliwych kombinacji: <math> P=\frac{ 2\binom{n_1-1}{k/2-1} \binom{n_2-1}{k/2-1}} { \binom{N}{n_1}} \qquad\textrm{dla }\ k\ \textrm{parzystych.} </math>
#'''Jeśli liczba serii <math>k</math> jest nieparzysta,''' to którychś serii — zer lub jedynek — będzie dokładnie o jeden więcej. <equation id="eq:127"></equation>

<center>
<math>\underline{1}\overline{00}\underline{1}\overline{000}\underline{111}
</math>.
</center>

##'''jeśli więcej jest serii jedynek''', mamy <math>(k-1)/2</math> serii zer i <math>(k-1)/2+1</math> serii jedynek. <math>n_1</math> jedynek dzielimy na <math>(k-1)/2+1</math> serii, czyli wyznaczamy <math>(k-1)/2</math> punktów podziału spośród <math>n_1-1</math> możliwych — daje to <math>\binom{n_1-1}{(k-1)/2}</math> możliwości. Z kolei <math>n_2</math> zer dzielimy na <math>(k-1)/2</math> serii, co daje <math>\binom{n_2-1}{(k-1)/2-1}</math> możliwości. Iloczyn tych dwóch wielkości określa liczbę możliwości dających <math>k</math> serii, jeśli więcej jest serii jedynek: <equation id="eq:128"><math> \binom{n_1-1}{(k-1)/2} \binom{n_2-1}{(k-1)/2-1} </math></equation>
##'''jeśli więcej jest serii zer''', to na drodze analogicznego rozumowania dostajemy <equation id="eq:129"><math> \binom{n_1-1}{(k-1)/2-1} \binom{n_2-1}{(k-1)/2}. </math></equation>

Prawdopodobieństwo dla przypadku nieparzystej liczby serii będzie sumą tych dwóch wielkości, podzieloną, jak w przypadku parzystego <math>k</math>, przez liczbę wszystkich możliwości:
<equation id="eq:130">
<math>\begin{matrix}
P&\!\!\!\!=&\!\!\!\!\frac{
\binom{n_1-1}{(k-1)/2} \binom{n_2-1}{(k-1)/2-1} +
\binom{n_1-1}{(k-1)/2-1} \binom{n_2-1}{(k-1)/2}
}
{{ \binom{N}{n_1}}} \\
&&\textrm{dla }\ k\ \textrm{ nieparzystych.}
\end{matrix}</math></equation>

'''Pozostaje jeszcze rozważyć sytuację''', w której liczba serii jest
nieparzysta, jak w punkcie 2., ale mniej liczne
elementy rozłożone są wyłącznie w serie jednoelementowe, na przykład
001010010100, czyli liczba serii wynosi <math>2n+1</math>, gdzie
<math>n</math> jest liczbą mniej licznych elementów (w tym
przykładzie jedynek). Wtedy znika jeden ze składników sumy z licznika
powyższego równania, gdyż zachodzić może wyłącznie
przypadek 2.1 lub 2.2.

Ostatecznie dostajemy następujący wzór na
prawdopodobieństwo wystąpienia <math>k</math> serii w próbie, w której
drogą niezależnych losowań wylosowano <math>n_1</math> zer i
<math>n_2</math> jedynek:
<equation id="eq:131">
<math>
P(k\mid n_1, n_2)=\begin{cases}
\frac{ 2\binom{n_1-1}{k/2-1} \binom{n_2-1}{k/2-1}}
{ \binom{N}{n_1}}
\quad \textrm{dla }\ k\ \textrm{ parzystych}
\\
\frac{
\binom{n_1-1}{(k-1)/2} \binom{n_2-1}{(k-1)/2-1} +
\binom{n_1-1}{(k-1)/2-1} \binom{n_2-1}{(k-1)/2}
}
{{ \binom{N}{n_1}}}
\\
\quad\qquad\qquad\qquad\qquad\qquad \textrm{dla }\ k\ \textrm{ nieparzystych}
\\
\frac{
\binom{n_\textrm{max}-1}{(k-1)/2}
}
{{ \binom{N}{(k-1)/2}}}
\ \quad\qquad\qquad\textrm{dla }\ k\ \textrm{ nieparzystych i }
n_\textrm{min}=\frac{k-1}{2},
\end{cases}
</math></equation>
gdzie <math>n_\textrm{min}=\min(n_1, n_2)</math> i
<math>n_\textrm{max}=\max(n_1, n_2)</math>.

Wzór ten określa rozkład statystyki, będącej liczbą serii w próbie złożonej
z dowolnych dwóch rodzajów elementów (oznaczanych powyżej jako '''0''' i '''1'''). Dzięki niemu możemy wreszcie skonstruować kompletny test hipotezy
mówiącej, że dany ciąg jest wynikiem niezależnych losowań. Przypomnijmy dane
z [[WnioskowanieStatystyczne/Testy_nieprametryczne|przykładu o nieuczciwym ankieterze]]:

<center>
'''1101101000101001011101101111010110010101001010100011101'''
</center>

W ciągu tym występuje 25 zer i 30 jedynek, układających się w 37
serii. Na podstawie wzoru <xr id="eq:131">(%i)</xr> możemy obliczyć
rozkład prawdopodobieństwa wylosowania ciągu 25 zer i 30 jedynek, w
którym będzie <math>k</math> serii. Możliwe wartości <math>k</math>
będą w tym przypadku zawierać się między 2 (jedna seria zer i jedna
jedynek) a 51 (ponieważ mniej jest zer, największa liczba serii
odpowiada przypadkowi, w którym wszystkie zera układają się w serie
jednoelementowe). Rozkład prawdopodobieństwa dla tego przypadku
przedstawia rysunek <xr id="fig:132"> %i</xr>.

[[Plik:serie.png|center|thumb|600px|<figure id="fig:132"></figure>Rozkład prawdopodobieństw <math>P(k)</math> liczby serii <math>k</math> w niezależnym losowaniu 30 zer i 25 jedynek.]]

Zastosowania testów opartych na tej statystyce nie ograniczają się do
analizy ciągów zer i jedynek (lub innych dwóch elementów). Poniżej
przedstawiamy jeszcze dwa testy korzystające ze statystyki <xr
id="eq:131">(%i)</xr>.

==Testowanie, czy próba jest wynikiem niezależnych losowań==

Podobny problem — pytanie, czy elementy próby są wynikiem
niezależnych losowań — występuje np. przy testowaniu generatorów
liczb losowych ([[WnioskowanieStatystyczne/Z_komputerem#cite_note-0|będących kluczowym
elementem metod opisywanych w pierwszej części książki]]). Jednak w
tej sytuacji mamy do czynienia z ciągiem dowolnych liczb, a nie dwóch
symboli.

Pomysł jest prosty: ciąg wyników wyrażających się dowolnymi liczbami
możemy zamienić na ciąg zer i jedynek, wybierając próg <math>M</math>
i przypisując wynikom większym od <math>M</math> jedynkę, a mniejszym
— zero. Jeśli chcemy mieć tyle samo zer i jedynek, jako
<math>M</math> możemy wziąć [[WnioskowanieStatystyczne/Momenty#Mediana|medianę]] próby. Do
takiej serii możemy już z powodzeniem stosować opisany w poprzednim
rozdziale test oparty na statystyce <xr id="eq:131">(%i)</xr> —
oczywiście zachowując kolejność elementów w próbie.

==Test zgodności rozkładów w dwóch populacjach==

Mamy dwie próby. Hipoteza zerowa mówi, że zostały wylosowane z tego
samego rozkładu. Ciąg zer i jedynek tworzymy w następujący sposób:

Elementy obu prób ustawiamy w jeden ciąg w kolejności od najmniejszej
do największej<ref>Jeśli wartości losowane są z rozkładów ciągłych, to
wystąpienie jednakowych wartości jest teoretycznie niemożliwe. W
praktyce wartości zapisujemy ze skończoną dokładnością; zwykle
przyjmuje się, że jednakowe wartości można pominąć.</ref>. Elementom
pierwszej próby przypisujemy jedynki, a drugiej — zera.

Jeśli obie próby losowano z tej samej populacji, to liczba serii w tak określonym
ciągu podlega statystyce <xr
id="eq:131">(%i)</xr>, czyli ponownie możemy
stosować test Walda-Wolfowitza.

---------------
<references>

WnioskowanieStatystyczne/Testy nieprametryczne

2026-03-29T08:50:38Z

Durka: /* Testy nieparametryczne */

[[Wnioskowanie_Statystyczne_-_wykład]]

==Testy nieparametryczne==

We [[WnioskowanieStatystyczne/wstep|wstępie]] mówiliśmy, że jedną z podstawowych wad
klasycznych testów statystycznych jest niemal wszechobecne założenie o
pochodzeniu danych z populacji o rozkładzie gaussowskim.

Faktycznie, w wyprowadzeniu statystyki najczęściej stosowanego [[WnioskowanieStatystyczne/Test_t|testu <math>t</math>]] korzystamy ''explicite'' z tego założenia — jeśli nie jest ono spełnione, test da wyniki nieprawdziwe.

Podobnie [[WnioskowanieStatystyczne/Test_chi2|rozkład <math>\chi^2</math>]] wprowadzamy
jako sumę kwadratów zmiennych pochodzących z rozkładu
normalnego. Jednak jeśli przyjrzeć się dokładniej założeniom
[[WnioskowanieStatystyczne/Test_chi2#Test_.CF.872_Pearsona|testu <math>\chi^2</math> Pearsona]]
okaże się, że jedynym warunkiem jest, by ilości zliczeń w
poszczególnych komórkach tabeli (bądź binach histogramu) nie były
nadmiernie małe. Wynika to ze specyficznej postaci danych wejściowych
— statystyka <math>\chi^2</math> Pearsona nie jest oparta
bezpośrednio na danych, lecz na zliczeniach przypadków. W każdym razie
jest to przykład testu, którego poprawność nie zależy od założenia o
normalności rozkładów danych.

W takich dziedzinach jak medycyna, psychologia czy
socjologia mamy zwykle do czynienia z danymi, o których trudno
powiedzieć ''a priori'' z jakiego rozkładu pochodzą, a wysoki koszt
lub trudności z dokładnym powtórzeniem eksperymentów powodują, że
samych danych bywa za mało do sprawdzenia hipotezy o normalności
rozkładu (na przykład [[WnioskowanieStatystyczne/Test_chi2|testem <math>\chi^2</math>]]).
<ref> Istnieją również testy statystyczne,
które weryfikują hipotezę o normalności rozkładu nawet dla bardzo
małych próbek, jednak niezależnie od reguł należy zawsze pamiętać o
zdrowym rozsądku. Wszak o kształcie rozkładu populacji, z której
losujemy próbę, mówi histogram, a histogram kilku czy nawet kilkunastu
przypadków nie niesie dość informacji, aby odpowiedzialnie móc coś
powiedzieć o kształcie rozkładu. Dlatego wyniki testów normalności dla
bardzo małych próbek należy traktować ostrożnie.</ref>

To zapotrzebowanie doprowadziło do powstania w ramach statystyki
klasycznej ''testów nieparametrycznych'', które do poprawnego
działania nie wymagają spełnienia hipotezy o normalności rozkładu
danych. Osiągane jest to zwykle kosztem
[[WnioskowanieStatystyczne/Weryfikacja hipotez#Poziom_istotno.C5.9Bci_i_moc_testu|mniejszej mocy testów]], jednak w obliczu groźby popełnienia grubego błędu metodycznego, jakim jest zastosowanie testu parametrycznego do danych
nie spełniających jego założeń, jest to zwykle cena warta zapłacenia.

Pierwszym przykładem z tej grupy jest opisany już
[[WnioskowanieStatystyczne/Test_chi2#Test_.CF.872_Pearsona|test <math>\chi^2</math> Pearsona]].
Poniżej wprowadzimy jeszcze dwa testy nieparametryczne;
pierwszy z nich "wymyślimy" i opracujemy od początku do końca —
od analizy problemu, przez pomysł na rozwiązanie, aż do kompletnych
wzorów na rozkład prawdopobieństwa wybranej statystyki.

===Przykład — nieuczciwy ankieter ===

Zadaniem ankietera w badaniach przedwyborczych (np. przed referendum)
jest pytanie losowo wybranych obywateli, czy mają zamiar głosować "za"
czy "przeciw". Czy na podstawie wyników ankiet, będących wyłącznie
ciągiem jedynek ("za") i zer ("przeciw"), na przykład:
<center>
1101101000101001011101101111010110010101001010100011101
</center>
można sprawdzić, czy ankietowane osoby wybierano w prawidłowy sposób?
Czy można też wykryć nieuczciwego ankietera, który zamiast pracowicie
przeprowadzać ankiety "wymyślił" ich wyniki?

Aby wyniki "odpytania" stosunkowo niewielkiej grupy wyborców mogły
odzwierciedlać wyniki przyszłych wyborów, grupa musi być wybrana
dostatecznie "przypadkowo". Na przykład, nie ma sensu przeprowadzenie
ankiet wyłącznie wśród studentów i wnioskowanie na ich podstawie o
wynikach wyborów ogólnonarodowych. Tylko jeśli ankietowana grupa jest
przypadkowo wybranym podzbiorem populacji wszystkich wyborców, średnia
opinii tej grupy będzie dobrym estymatorem średniej opinii wszystkich
wyborców (populacji).

W statystyce używamy pojęcia ''próby prostej'', będącej wynikiem
niezależnych losowań z tej samej populacji (lub z tego samego
rozkładu). Na podstawie samych wyników trudno wykryć, czy próbę
losowano np. tylko spośród mieszkańców miast, zamiast spośród
wszystkich uprawnionych do głosowania. Natomiast dość skutecznie
możemy testować niezależność kolejnych losowań; intuicja podpowiada,
że nie wszystkie z poniższych ciągów są "jednakowo prawdopodobne"<ref>formalnie wszystkie trzy ciągi są jednakowo prawdopodobne</ref>:

00101101001110101001

11111111110000000000

10101010101010101010

choć wszystkie trzy ciągi zawierają te same liczby jedynek i zer — oczywiście, jeśli mówimy o wynikach
niezależnych losowań.<ref>Jeśli pierwszych dziesięć opinii zbierzemy
wśród młodych bezrobotnych a drugie dziesięć wśród emerytów (dwie
długie serie jednakowych opinii), to wynik drugi będzie bardziej
prawdopodobny, ale taki wybór ankietowanych nie jest zgodny z ideą
próby prostej.</ref> W drugim wyniku mamy zera i jedynki zgrupowane w
dwie długie serie — to właśnie wydaje się mało prawdopodobne, w
porównaniu z większą ilością serii w pierwszym ciągu. Aby dokładnie
oszacować poziom istotności dla hipotezy, że dana próba jest prosta,
pozostaje wyliczyć rozkład prawdopodobieństwa uzyskania różnych liczb
serii w ciągach zer i jedynek będących wynikiem niezależnych losowań z
tej samej populacji. Ten właśnie pomysł leży u podstaw testu serii.

--------------
<references>

WnioskowanieStatystyczne/Testy nieprametryczne

2026-03-29T08:45:49Z

Durka: /* Przykład — nieuczciwy ankieter */

[[Wnioskowanie_Statystyczne_-_wykład]]

==Testy nieparametryczne==

We [[WnioskowanieStatystyczne/wstep|wstępie]] mówiliśmy, że jedną z podstawowych wad
klasycznych testów statystycznych jest niemal wszechobecne założenie o
pochodzeniu danych z populacji o rozkładzie gaussowskim.

Faktycznie, w wyprowadzeniu statystyki najczęściej stosowanego [[WnioskowanieStatystyczne/Test_t|testu <math>t</math>]] korzystamy ''explicite'' z tego założenia — jeśli nie jest ono spełnione, test da wyniki nieprawdziwe.

Podobnie [[WnioskowanieStatystyczne/Test_chi2|rozkład <math>\chi^2</math>]] wprowadzamy
jako sumę kwadratów zmiennych pochodzących z rozkładu
normalnego. Jednak jeśli przyjrzeć się dokładniej założeniom
[[WnioskowanieStatystyczne/Test_chi2#Test_.CF.872_Pearsona|testu <math>\chi^2</math> Pearsona]]
okaże się, że jedynym warunkiem jest, by ilości zliczeń w
poszczególnych komórkach tabeli (bądź binach histogramu) nie były
nadmiernie małe. Wynika to ze specyficznej postaci danych wejściowych
— statystyka <math>\chi^2</math> Pearsona nie jest oparta
bezpośrednio na danych, lecz na zliczeniach przypadków. W każdym razie
jest to przykład testu, którego poprawność nie zależy od założenia o
normalności rozkładów danych.

W takich dziedzinach jak medycyna, psychologia czy
socjologia mamy zwykle do czynienia z danymi, o których trudno
powiedzieć ''a priori'' z jakiego rozkładu pochodzą, a wysoki koszt
lub trudności z dokładnym powtórzeniem eksperymentów powodują, że
samych danych bywa za mało do sprawdzenia hipotezy o normalności
rozkładu (na przykład [[WnioskowanieStatystyczne/Test_chi2|testem <math>\chi^2</math>]]).
<ref> Istnieją również testy statystyczne,
które weryfikują hipotezę o normalności rozkładu nawet dla bardzo
małych próbek, jednak niezależnie od reguł należy zawsze pamiętać o
zdrowym rozsądku. Wszak o kształcie rozkładu populacji, z której
losujemy próbę, mówi histogram, a histogram kilku czy nawet kilkunastu
przypadków nie niesie dość informacji, aby odpowiedzialnie móc coś
powiedzieć o kształcie rozkładu. Dlatego wyniki testów normalności dla
bardzo małych próbek należy traktować ostrożnie.</ref>

To zapotrzebowanie doprowadziło do powstania w ramach statystyki
klasycznej ''testów nieparametrycznych'', które do poprawnego
działania nie wymagają spełnienia hipotezy o normalności rozkładu
danych. Osiągane jest to zwykle kosztem
[[WnioskowanieStatystyczne/Weryfikacja hipotez#Poziom_istotno.C5.9Bci_i_moc_testu|mniejszej mocy testów]], jednak w obliczu groźby popełnienia grubego błędu metodycznego, jakim jest zastosowanie testu parametrycznego do danych
nie spełniających jego założeń, jest to zwykle cena warta zapłacenia.

Pierwszym przykładem z tej grupy jest opisany już
[[WnioskowanieStatystyczne/Test_chi2#Test_.CF.872_Pearsona|test <math>\chi^2</math> Pearsona]].
Poniżej wprowadzimy jeszcze dwa testy nieparametryczne;
pierwszy z nich "wymyślimy" i opracujemy od początku do końca —
od analizy problemu, przez pomysł na rozwiązanie, aż do kompletnych
wzorów na rozkład prawdopobieństwa wybranej statystyki.

===Przykład — nieuczciwy ankieter ===

Zadaniem ankietera w badaniach przedwyborczych (np. przed referendum)
jest pytanie losowo wybranych obywateli, czy mają zamiar głosować "za"
czy "przeciw". Czy na podstawie wyników ankiet, będących wyłącznie
ciągiem jedynek ("za") i zer ("przeciw"), na przykład:
<center>
1101101000101001011101101111010110010101001010100011101
</center>
można sprawdzić, czy ankietowane osoby wybierano w prawidłowy sposób?
Czy można też wykryć nieuczciwego ankietera, który zamiast pracowicie
przeprowadzać ankiety "wymyślił" ich wyniki?

Aby wyniki "odpytania" stosunkowo niewielkiej grupy wyborców mogły
odzwierciedlać wyniki przyszłych wyborów, grupa musi być wybrana
dostatecznie "przypadkowo". Na przykład, nie ma sensu przeprowadzenie
ankiet wyłącznie wśród studentów i wnioskowanie na ich podstawie o
wynikach wyborów ogólnonarodowych. Tylko jeśli ankietowana grupa jest
przypadkowo wybranym podzbiorem populacji wszystkich wyborców, średnia
opinii tej grupy będzie dobrym estymatorem średniej opinii wszystkich
wyborców (populacji).

W statystyce używamy pojęcia ''próby prostej'', będącej wynikiem
niezależnych losowań z tej samej populacji (lub z tego samego
rozkładu). Na podstawie samych wyników trudno wykryć, czy próbę
losowano np. tylko spośród mieszkańców miast, zamiast spośród
wszystkich uprawnionych do głosowania. Natomiast dość skutecznie
możemy testować niezależność kolejnych losowań; intuicja podpowiada,
że nie wszystkie z poniższych ciągów są "jednakowo prawdopodobne"<ref>formalnie oba ciągi są jednakowo prawdopodobne</ref>:

00101101001110101001

11111111110000000000

10101010101010101010

choć wszystkie trzy ciągi zawierają te same liczby jedynek i zer — oczywiście, jeśli mówimy o wynikach
niezależnych losowań.<ref>Jeśli pierwszych dziesięć opinii zbierzemy
wśród młodych bezrobotnych a drugie dziesięć wśród emerytów (dwie
długie serie jednakowych opinii), to wynik drugi będzie bardziej
prawdopodobny, ale taki wybór ankietowanych nie jest zgodny z ideą
próby prostej.</ref> W drugim wyniku mamy zera i jedynki zgrupowane w
dwie długie serie — to właśnie wydaje się mało prawdopodobne, w
porównaniu z większą ilością serii w pierwszym ciągu. Aby dokładnie
oszacować poziom istotności dla hipotezy, że dana próba jest prosta,
pozostaje wyliczyć rozkład prawdopodobieństwa uzyskania różnych liczb
serii w ciągach zer i jedynek będących wynikiem niezależnych losowań z
tej samej populacji. Ten właśnie pomysł leży u podstaw testu serii.

--------------
<references>

WnioskowanieStatystyczne/Testy nieprametryczne

2026-03-29T08:33:44Z

Durka: /* Testy nieparametryczne */

[[Wnioskowanie_Statystyczne_-_wykład]]

==Testy nieparametryczne==

We [[WnioskowanieStatystyczne/wstep|wstępie]] mówiliśmy, że jedną z podstawowych wad
klasycznych testów statystycznych jest niemal wszechobecne założenie o
pochodzeniu danych z populacji o rozkładzie gaussowskim.

Faktycznie, w wyprowadzeniu statystyki najczęściej stosowanego [[WnioskowanieStatystyczne/Test_t|testu <math>t</math>]] korzystamy ''explicite'' z tego założenia — jeśli nie jest ono spełnione, test da wyniki nieprawdziwe.

Podobnie [[WnioskowanieStatystyczne/Test_chi2|rozkład <math>\chi^2</math>]] wprowadzamy
jako sumę kwadratów zmiennych pochodzących z rozkładu
normalnego. Jednak jeśli przyjrzeć się dokładniej założeniom
[[WnioskowanieStatystyczne/Test_chi2#Test_.CF.872_Pearsona|testu <math>\chi^2</math> Pearsona]]
okaże się, że jedynym warunkiem jest, by ilości zliczeń w
poszczególnych komórkach tabeli (bądź binach histogramu) nie były
nadmiernie małe. Wynika to ze specyficznej postaci danych wejściowych
— statystyka <math>\chi^2</math> Pearsona nie jest oparta
bezpośrednio na danych, lecz na zliczeniach przypadków. W każdym razie
jest to przykład testu, którego poprawność nie zależy od założenia o
normalności rozkładów danych.

W takich dziedzinach jak medycyna, psychologia czy
socjologia mamy zwykle do czynienia z danymi, o których trudno
powiedzieć ''a priori'' z jakiego rozkładu pochodzą, a wysoki koszt
lub trudności z dokładnym powtórzeniem eksperymentów powodują, że
samych danych bywa za mało do sprawdzenia hipotezy o normalności
rozkładu (na przykład [[WnioskowanieStatystyczne/Test_chi2|testem <math>\chi^2</math>]]).
<ref> Istnieją również testy statystyczne,
które weryfikują hipotezę o normalności rozkładu nawet dla bardzo
małych próbek, jednak niezależnie od reguł należy zawsze pamiętać o
zdrowym rozsądku. Wszak o kształcie rozkładu populacji, z której
losujemy próbę, mówi histogram, a histogram kilku czy nawet kilkunastu
przypadków nie niesie dość informacji, aby odpowiedzialnie móc coś
powiedzieć o kształcie rozkładu. Dlatego wyniki testów normalności dla
bardzo małych próbek należy traktować ostrożnie.</ref>

To zapotrzebowanie doprowadziło do powstania w ramach statystyki
klasycznej ''testów nieparametrycznych'', które do poprawnego
działania nie wymagają spełnienia hipotezy o normalności rozkładu
danych. Osiągane jest to zwykle kosztem
[[WnioskowanieStatystyczne/Weryfikacja hipotez#Poziom_istotno.C5.9Bci_i_moc_testu|mniejszej mocy testów]], jednak w obliczu groźby popełnienia grubego błędu metodycznego, jakim jest zastosowanie testu parametrycznego do danych
nie spełniających jego założeń, jest to zwykle cena warta zapłacenia.

Pierwszym przykładem z tej grupy jest opisany już
[[WnioskowanieStatystyczne/Test_chi2#Test_.CF.872_Pearsona|test <math>\chi^2</math> Pearsona]].
Poniżej wprowadzimy jeszcze dwa testy nieparametryczne;
pierwszy z nich "wymyślimy" i opracujemy od początku do końca —
od analizy problemu, przez pomysł na rozwiązanie, aż do kompletnych
wzorów na rozkład prawdopobieństwa wybranej statystyki.

===Przykład — nieuczciwy ankieter ===

Zadaniem ankietera w badaniach przedwyborczych (np. przed referendum)
jest pytanie losowo wybranych obywateli, czy mają zamiar głosować "za"
czy "przeciw". Czy na podstawie wyników ankiet, będących wyłącznie
ciągiem jedynek ("za") i zer ("przeciw"), na przykład:
<center>
1101101000101001011101101111010110010101001010100011101
</center>
można sprawdzić, czy ankietowane osoby wybierano w prawidłowy sposób?
Czy można też wykryć nieuczciwego ankietera, który zamiast pracowicie
przeprowadzać ankiety "wymyślił" ich wyniki?

Aby wyniki "odpytania" stosunkowo niewielkiej grupy wyborców mogły
odzwierciedlać wyniki przyszłych wyborów, grupa musi być wybrana
dostatecznie "przypadkowo". Na przykład, nie ma sensu przeprowadzenie
ankiet wyłącznie wśród studentów i wnioskowanie na ich podstawie o
wynikach wyborów ogólnonarodowych. Tylko jeśli ankietowana grupa jest
przypadkowo wybranym podzbiorem populacji wszystkich wyborców, średnia
opinii tej grupy będzie dobrym estymatorem średniej opinii wszystkich
wyborców (populacji).

W statystyce używamy pojęcia ''próby prostej'', będącej wynikiem
niezależnych losowań z tej samej populacji (lub z tego samego
rozkładu). Na podstawie samych wyników trudno wykryć, czy próbę
losowano np. tylko spośród mieszkańców miast, zamiast spośród
wszystkich uprawnionych do głosowania. Natomiast dość skutecznie
możemy testować niezależność kolejnych losowań; intuicja podpowiada,
że bardziej prawdopodobny<ref>formalnie oba ciągi są jednakowo prawdopodobne</ref> jest ciąg
00101101001110101001 niż 11111111110000000000, choć oba zawierają te
same liczby jedynek i zer — oczywiście, jeśli mówimy o wynikach
niezależnych losowań.<ref>Jeśli pierwszych dziesięć opinii zbierzemy
wśród młodych bezrobotnych a drugie dziesięć wśród emerytów (dwie
długie serie jednakowych opinii), to wynik drugi będzie bardziej
prawdopodobny, ale taki wybór ankietowanych nie jest zgodny z ideą
próby prostej.</ref> W drugim wyniku mamy zera i jedynki zgrupowane w
dwie długie serie — to właśnie wydaje się mało prawdopodobne, w
porównaniu z większą ilością serii w pierwszym ciągu. Aby dokładnie
oszacować poziom istotności dla hipotezy, że dana próba jest prosta,
pozostaje wyliczyć rozkład prawdopodobieństwa uzyskania różnych liczb
serii w ciągach zer i jedynek będących wynikiem niezależnych losowań z
tej samej populacji. Ten właśnie pomysł leży u podstaw testu serii.

--------------
<references>

WnioskowanieStatystyczne/Statystyki i estymatory

2026-03-25T15:49:15Z

Durka: /* Estymator wariancji */

[[Wnioskowanie_Statystyczne_-_wykład]]

==Statystyki i estymatory==
Funkcję <math>S(x_{1},x_{2},...x_{n})</math> określoną na elementach próby <math>\{x_i\}</math>
zwiemy '''statystyką'''. Obliczane w praktyce statystyki służą
weryfikacji hipotez statystycznych (zwiemy je wtedy '''statystykami testowymi''' — tym zajmiemy się w następnym rozdziale) lub estymacji (szacowaniu) parametrów rozkładu prawdopodobieństwa w populacji
zmiennej <math>x</math>, z której pobierana jest próba. W tym drugim przypadku zwiemy je
'''estymatorami'''. Na przykład wartość średnia próby

<math>\displaystyle
\overline{x}=\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}x_{i} \qquad
</math>
może być estymatorem wartości oczekiwanej populacji <math>\mu=E(x)</math>.

Estymator zwiemy '''nieobciążonym''', jeśli dla każdej
wielkości próby <math>n</math> jego wartość oczekiwana jest równa
wartości estymowanego parametru (oznaczmy go np. <math>\beta</math>):

<math>\displaystyle
\forall n \ E(S(x_{1}...x_{n}))=\beta.
</math>

Estymator zwiemy '''zgodnym''', jeśli przy wielkości próby dążącej do
nieskończoności jego wariancja dąży do zera:

<math>\displaystyle
\underset{n\rightarrow \infty }{\lim }\sigma (S(x_{1}...x_{n}))=0.
</math>

==Estymator wartości oczekiwanej==

Dla rozkładów ciągłych wartość oczekiwana <math>\displaystyle
\mu=E(x)=\overset{n}{\underset{i=1}{\sum }}x_{i}P(X=x_{i})
</math>

Dla rozkładów dyskretnych wartość oczekiwana <math>\displaystyle
\mu=E(x)=\underset{-\infty }{\overset{\infty }{\int }}x p(x)dx
</math>

Estymator wartości oczekiwanej postaci
<equation id="eq:91">
<math>\displaystyle
\overline{x}=\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}x_{i}
</math>
</equation>

jest nieobciążony i zgodny.

'''Dowód:'''

<math>\displaystyle
E(\overline{x})=E\left(\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}x_{i}\right)=
\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}E(x_{i})
=\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}\mu
=\frac{1}{n}n\mu =\mu
</math>

<math>\displaystyle
\sigma ^{2}\left( \overline{x}\right) =
E \left( \left( \overline{x}-E(\overline{x})\right)^{2}\right) =
E\left(\left(\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}x_{i}-
\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}\mu \right)^{2}\right) =
</math>

<math>\displaystyle
=\frac{1}{n^{2}}E\left(\left(\underset{i=1}{\overset{n}{\sum }}(x_{i}-\mu )\right)^{2}\right)
</math>

Jeśli elementy próby są niezależne, to
<math>\displaystyle
E\left((x_{i}-\mu)(x_{j}-\mu )\right) =\delta _{ij}\sigma ^{2}(x_{i}),
</math>

gdzie <math>\delta_{ij}</math> oznacza deltę Kroneckera
(<math>\delta_{ij}=1\ \textrm{ dla }\ i=j,
\delta_{ij}=0\ \textrm{ dla }\ i\neq j</math>), czyli:

<math>\sigma ^{2}\left( \overline{x}\right)
=\frac{1}{n^{2}}E\left(\underset{i=1}{\overset{n}{\sum }}(x_{i}-\mu )^{2}\right)
=\frac{1}{n^{2}}\left(\underset{i=1}{\overset{n}{\sum }}E(x_{i}-\mu )^{2}\right)
= \frac{1}{n^{2}}\underset{i=1}{\overset{n}{
\sum }}\sigma ^{2}(x_i)
</math>

Ponadto, jeśli elementy próby pochodzą z tego samego rozkładu, to
<math>\sigma ^{2}(x_{i})=\sigma^{2}(x)</math>, czyli

<equation id="eq:91">
<math>\displaystyle
{ \sigma ^{2}(\overline{x})=\frac{1}{n^{2}}\underset{i=1}{\overset{n}{
\sum }}\sigma ^{2}(x)=\frac{1}{n}\sigma ^{2}(x)\ }.
</math>
</equation>

{| role="presentation" class="wikitable mw-collapsible mw-collapsed"
| Prawo wielkich liczb (opcjonalnie)  
|-
| Do zgodności estymatora wartości oczekiwanej odnosi się również prawo wielkich liczb. Mówi ono, że
<blockquote>
wartość średnia <math>\overline{x}=\frac{1}{n}\sum\limits_{i=1}^{n} x_i</math>, obliczona z odpowiednio dużej próby (o liczności co najmniej <math>n_0</math>), pobieranej z populacji o skończonej wariancji, może być
dowolnie bliska wartości oczekiwanej <math>\mu</math>.
</blockquote>

Co to znaczy "odpowiednio duża próba" i "dowolnie bliska"?

Jeśli chcemy, żeby wartość średnia nie odbiegała od <math>\mu</math> o więcej niż <math>\varepsilon</math> z prawdopodobieństwem ,,prawie jeden", czyli <math>1-\eta</math>, to dla wybranych (dowolnie małych, dodatnich) <math>\varepsilon </math> i <math>\eta</math> istnieje takie
<math>n_{0}</math>, że dla każdego <math>n>n_{0}</math>:

<equation id="eq:92">
<math>\displaystyle \exists {\varepsilon, \eta} \forall{n>n_0}
P\left( \left| \frac{1}{n}\sum\limits_{i=1}^{n} x_i -\mu \right| <\varepsilon
\right) > 1-\eta.
</math>
</equation>

Jest to tzw. słabe prawo wielkich liczb; mocne prawo wielkich liczb mówi, że

<math>\displaystyle
\underset{n\rightarrow \infty }{\lim} \frac{1}{n}\sum\limits_{i=1}^{n} x_i = \mu .
</math>
Dokładniejsze formulacje i dowody można znaleźć np. w książce "Wnioskowanie statystyczne" L. Gajek i M. Kałuszka, WNT 2000.
|}

==Estymator wariancji==
Spróbujmy skonstruować estymator wariancji z próby jako  
<math>\displaystyle s_o^{2}=\frac{1}{n} \underset{i=1}{\overset{n}{\sum }}(x_{i}-\overline{x})^{2}.</math>

Aby wyliczyć jego wartość oczekiwaną, wyprowadźmy jeszcze kilka prostych zależności. Na początek wykażemy, że wariancja zmiennej losowej jest równa różnicy wartości oczekiwanej kwadratu tej zmiennej i kwadratu jej wartości oczekiwanej:

<math>\displaystyle
\sigma^{2}(x_i)=E((x_i-\mu)^{2})=E(x_i^{2}-2x_i\mu+\mu ^{2})=E(x_i^{2})-2\mu E(x_i)+\mu^{2}=\\
\quad\;\;\;\;\;\: = E(x_i^{2})-\mu^{2}=E(x_i^{2})-\left\{ E(x_i)\right\} ^{2}
</math>

Czyli <equation id="eq:64">
<center><math>\displaystyle
\sigma ^{2}(x_i) = E(x_i^{2})-\left\{ E(x_i)\right\} ^{2} = E(x_i^{2}) - \mu^2
</math></center>
</equation>

Wynika stąd w szczególności, że
<center><math>\displaystyle
E(x_i^{2}) = \sigma_{x_i}^2 + \mu^2
</math></center>

Analogicznie dla wariancji wartości średniej
<center><math>\displaystyle
E(\overline{x}^2) = \sigma_\overline{x}^2 + \mu^2
</math></center>

Czyli <math>\sigma_\overline{x}^2 = E(\overline{x}^2) - \mu^2</math>.
Ponieważ <math> \sigma^{2}_\overline{x}=\frac{1}{n}\sigma^{2}_{x_i} </math>
dostajemy

<center><math>\displaystyle
\frac{1}{n}\sigma^{2}_{x_i} = E(\overline{x}^2) - \mu^2
</math></center>

<center><math>\displaystyle
E(\overline{x}^2) = \frac{1}{n}\sigma^{2}_{x_i} + \mu^2
</math></center>

Policzmy teraz wartość oczekiwaną proponowanego estymatora wariancji  
<math>\displaystyle s_o^{2}=\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}(x_{i}-\overline{x})^{2}</math>

<math>\displaystyle
E\left( s_o^{2}\right) =
\frac{1}{n} E\left(\sum\limits_{i=1}^{n}(x_{i}-\overline{x})^{2}\right)
</math>

<math>\displaystyle =
\frac{1}{n} E\left(\sum\limits_{i=1}^{n}x_{i}^2 + \sum\limits_{i=1}^{n}\overline{x}^{2} - 2\sum\limits_{i=1}^{n} \overline{x} x_i \right)
</math>

<math>\displaystyle =
\frac{1}{n} \left(\sum\limits_{i=1}^{n}E(x_{i}^2) + \sum\limits_{i=1}^{n}E(\overline{x}^{2}) - 2 E \left(\overline{x} \sum\limits_{i=1}^{n} x_i \right) \right)
</math>

<math>\displaystyle =
\frac{1}{n} \left(\sum\limits_{i=1}^{n}E(x_{i}^2) + n E(\overline{x}^{2}) - 2 n E (\overline{x}^2 ) \right)
</math>

<math>\displaystyle =
\frac{1}{n} \left(n E\left(x_{i}^2\right) - n E\left(\overline{x}^{2}\right) \right)
</math>

podstawiając wyprowadzone wcześniej wzory na <math>E(x_{i}^2)</math> i <math>E(\overline{x}^{2})</math> dostajemy

<math>\displaystyle
E\left( s_o^{2}\right) = \frac{1}{n} \left( n \left(\sigma^2_{x_i} + \mu^2\right) -n \left( \frac{1}{n}\sigma^2_{x_i} + \mu^2 \right) \right)
=\frac{n-1}{n}\sigma^{2}_{x_i}
</math>

czyli nie jest dla każdej wielkości próby <math>n</math> wartość oczekiwana tego estymatora wyniesie <math>\sigma^2(x)</math>. Tak więc <math>s_o^2</math> jest estymatorem obciążonym.
W tej sytuacji, jako nieobciążony estymator wariancji możemy zaproponować
<equation id="eq:93">
<center><math>\displaystyle
{ s^{2}=\frac{1}{n-1}\underset{i=1}{\overset{n}{\sum }}(x_{i}-
\overline{x})^{2} }
</math></center>
</equation>

===Estymator wariancji wartości średniej===
Podstawiając tę zależność do wyprowadzonego powyżej wzoru na wariancję wartości średniej w miejsce <math>\sigma^2</math>, dostajemy wzór na estymator wariancji wartości średniej próby

<equation id="eq:94">
<center><math>\displaystyle
s^2_{\overline{x}} = \frac{1}{n(n-1)}\sum_{i=1}^n(x_{i}-\overline{x})^{2}.
</math>
</equation></center>

Pierwiastek tej wielkości

<equation id="eq:94a">
<center><math>\displaystyle
s_{\overline{x}} = \sqrt{
\frac{1}{n(n-1)}\sum_{i=1}^n(x_{i}-\overline{x})^{2}}
</math>
</equation></center>

jest estymatorem '''odchylenia standardowego wartości średniej'''.

WnioskowanieStatystyczne/Statystyki i estymatory

2026-03-25T15:45:41Z

Durka: /* Estymator wariancji */

[[Wnioskowanie_Statystyczne_-_wykład]]

==Statystyki i estymatory==
Funkcję <math>S(x_{1},x_{2},...x_{n})</math> określoną na elementach próby <math>\{x_i\}</math>
zwiemy '''statystyką'''. Obliczane w praktyce statystyki służą
weryfikacji hipotez statystycznych (zwiemy je wtedy '''statystykami testowymi''' — tym zajmiemy się w następnym rozdziale) lub estymacji (szacowaniu) parametrów rozkładu prawdopodobieństwa w populacji
zmiennej <math>x</math>, z której pobierana jest próba. W tym drugim przypadku zwiemy je
'''estymatorami'''. Na przykład wartość średnia próby

<math>\displaystyle
\overline{x}=\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}x_{i} \qquad
</math>
może być estymatorem wartości oczekiwanej populacji <math>\mu=E(x)</math>.

Estymator zwiemy '''nieobciążonym''', jeśli dla każdej
wielkości próby <math>n</math> jego wartość oczekiwana jest równa
wartości estymowanego parametru (oznaczmy go np. <math>\beta</math>):

<math>\displaystyle
\forall n \ E(S(x_{1}...x_{n}))=\beta.
</math>

Estymator zwiemy '''zgodnym''', jeśli przy wielkości próby dążącej do
nieskończoności jego wariancja dąży do zera:

<math>\displaystyle
\underset{n\rightarrow \infty }{\lim }\sigma (S(x_{1}...x_{n}))=0.
</math>

==Estymator wartości oczekiwanej==

Dla rozkładów ciągłych wartość oczekiwana <math>\displaystyle
\mu=E(x)=\overset{n}{\underset{i=1}{\sum }}x_{i}P(X=x_{i})
</math>

Dla rozkładów dyskretnych wartość oczekiwana <math>\displaystyle
\mu=E(x)=\underset{-\infty }{\overset{\infty }{\int }}x p(x)dx
</math>

Estymator wartości oczekiwanej postaci
<equation id="eq:91">
<math>\displaystyle
\overline{x}=\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}x_{i}
</math>
</equation>

jest nieobciążony i zgodny.

'''Dowód:'''

<math>\displaystyle
E(\overline{x})=E\left(\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}x_{i}\right)=
\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}E(x_{i})
=\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}\mu
=\frac{1}{n}n\mu =\mu
</math>

<math>\displaystyle
\sigma ^{2}\left( \overline{x}\right) =
E \left( \left( \overline{x}-E(\overline{x})\right)^{2}\right) =
E\left(\left(\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}x_{i}-
\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}\mu \right)^{2}\right) =
</math>

<math>\displaystyle
=\frac{1}{n^{2}}E\left(\left(\underset{i=1}{\overset{n}{\sum }}(x_{i}-\mu )\right)^{2}\right)
</math>

Jeśli elementy próby są niezależne, to
<math>\displaystyle
E\left((x_{i}-\mu)(x_{j}-\mu )\right) =\delta _{ij}\sigma ^{2}(x_{i}),
</math>

gdzie <math>\delta_{ij}</math> oznacza deltę Kroneckera
(<math>\delta_{ij}=1\ \textrm{ dla }\ i=j,
\delta_{ij}=0\ \textrm{ dla }\ i\neq j</math>), czyli:

<math>\sigma ^{2}\left( \overline{x}\right)
=\frac{1}{n^{2}}E\left(\underset{i=1}{\overset{n}{\sum }}(x_{i}-\mu )^{2}\right)
=\frac{1}{n^{2}}\left(\underset{i=1}{\overset{n}{\sum }}E(x_{i}-\mu )^{2}\right)
= \frac{1}{n^{2}}\underset{i=1}{\overset{n}{
\sum }}\sigma ^{2}(x_i)
</math>

Ponadto, jeśli elementy próby pochodzą z tego samego rozkładu, to
<math>\sigma ^{2}(x_{i})=\sigma^{2}(x)</math>, czyli

<equation id="eq:91">
<math>\displaystyle
{ \sigma ^{2}(\overline{x})=\frac{1}{n^{2}}\underset{i=1}{\overset{n}{
\sum }}\sigma ^{2}(x)=\frac{1}{n}\sigma ^{2}(x)\ }.
</math>
</equation>

{| role="presentation" class="wikitable mw-collapsible mw-collapsed"
| Prawo wielkich liczb (opcjonalnie)  
|-
| Do zgodności estymatora wartości oczekiwanej odnosi się również prawo wielkich liczb. Mówi ono, że
<blockquote>
wartość średnia <math>\overline{x}=\frac{1}{n}\sum\limits_{i=1}^{n} x_i</math>, obliczona z odpowiednio dużej próby (o liczności co najmniej <math>n_0</math>), pobieranej z populacji o skończonej wariancji, może być
dowolnie bliska wartości oczekiwanej <math>\mu</math>.
</blockquote>

Co to znaczy "odpowiednio duża próba" i "dowolnie bliska"?

Jeśli chcemy, żeby wartość średnia nie odbiegała od <math>\mu</math> o więcej niż <math>\varepsilon</math> z prawdopodobieństwem ,,prawie jeden", czyli <math>1-\eta</math>, to dla wybranych (dowolnie małych, dodatnich) <math>\varepsilon </math> i <math>\eta</math> istnieje takie
<math>n_{0}</math>, że dla każdego <math>n>n_{0}</math>:

<equation id="eq:92">
<math>\displaystyle \exists {\varepsilon, \eta} \forall{n>n_0}
P\left( \left| \frac{1}{n}\sum\limits_{i=1}^{n} x_i -\mu \right| <\varepsilon
\right) > 1-\eta.
</math>
</equation>

Jest to tzw. słabe prawo wielkich liczb; mocne prawo wielkich liczb mówi, że

<math>\displaystyle
\underset{n\rightarrow \infty }{\lim} \frac{1}{n}\sum\limits_{i=1}^{n} x_i = \mu .
</math>
Dokładniejsze formulacje i dowody można znaleźć np. w książce "Wnioskowanie statystyczne" L. Gajek i M. Kałuszka, WNT 2000.
|}

==Estymator wariancji==
Spróbujmy skonstruować estymator wariancji z próby jako  
<math>\displaystyle s_o^{2}=\frac{1}{n} \underset{i=1}{\overset{n}{\sum }}(x_{i}-\overline{x})^{2}.</math>

Aby wyliczyć jego wartość oczekiwaną, wyprowadźmy jeszcze kilka prostych zależności. Na początek wykażemy, że wariancja zmiennej losowej jest równa różnicy wartości oczekiwanej kwadratu tej zmiennej i kwadratu jej wartości oczekiwanej:

<math>\displaystyle
\sigma^{2}(x_i)=E((x_i-\mu)^{2})=E(x_i^{2}-2x_i\mu+\mu ^{2})=E(x_i^{2})-2\mu E(x_i)+\mu^{2}=\\
\quad\;\;\;\;\;\: = E(x_i^{2})-\mu^{2}=E(x_i^{2})-\left\{ E(x_i)\right\} ^{2}
</math>

Czyli <equation id="eq:64">
<center><math>\displaystyle
\sigma ^{2}(x_i) = E(x_i^{2})-\left\{ E(x_i)\right\} ^{2} = E(x_i^{2}) - \mu^2
</math></center>
</equation>

Wynika stąd w szczególności, że
<center><math>\displaystyle
E(x_i^{2}) = \sigma_{x_i}^2 + \mu^2
</math></center>

Analogicznie dla wariancji wartości średniej
<center><math>\displaystyle
E(\overline{x}^2) = \sigma_\overline{x}^2 + \mu^2
</math></center>

Czyli <math>\sigma_\overline{x}^2 = E(\overline{x}^2) - \mu^2</math>.
Ponieważ <math> \sigma^{2}_\overline{x}=\frac{1}{n}\sigma^{2}_{x_i} </math>
dostajemy

<center><math>\displaystyle
\frac{1}{n}\sigma^{2}_{x_i} = E(\overline{x}^2) - \mu^2
</math></center>

<center><math>\displaystyle
E(\overline{x}^2) = \frac{1}{n}\sigma^{2}_{x_i} + \mu^2
</math></center>

Policzmy teraz wartość oczekiwaną proponowanego estymatora wariancji  
<math>\displaystyle s_o^{2}=\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}(x_{i}-\overline{x})^{2}</math>

<math>\displaystyle
E\left( s_o^{2}\right) =
\frac{1}{n} E\left(\sum\limits_{i=1}^{n}(x_{i}-\overline{x})^{2}\right)
</math>

<math>\displaystyle =
\frac{1}{n} E\left(\sum\limits_{i=1}^{n}x_{i}^2 + \sum\limits_{i=1}^{n}\overline{x}^{2} - 2\sum\limits_{i=1}^{n} \overline{x} x_i \right)
</math>

<math>\displaystyle =
\frac{1}{n} \left(\sum\limits_{i=1}^{n}E(x_{i}^2) + \sum\limits_{i=1}^{n}E(\overline{x}^{2}) - 2 E \left(\overline{x} \sum\limits_{i=1}^{n} x_i \right) \right)
</math>

<math>\displaystyle =
\frac{1}{n} \left(\sum\limits_{i=1}^{n}E(x_{i}^2) + n E(\overline{x}^{2}) - 2 n E (\overline{x}^2 ) \right)
</math>

<math>\displaystyle =
\frac{1}{n} \left(n E\left(x_{i}^2\right) - n E\left(\overline{x}^{2}\right) \right)
</math>

podstawiając wyprowadzone wcześniej wzory na <math>E(x_{i}^2)</math> i <math>E(\overline{x}^{2})</math> dostajemy

<math>\displaystyle
E\left( s_o^{2}\right) = \frac{1}{n} \left( n \left(\sigma^2_{x_i} - \mu^2\right) -n \left( \frac{1}{n}\sigma^2_{x_i} - \mu^2 \right) \right)
=\frac{n-1}{n}\sigma^{2}_{x_i}
</math>

czyli nie jest dla każdej wielkości próby <math>n</math> wartość oczekiwana tego estymatora wyniesie <math>\sigma^2(x)</math>. Tak więc <math>s_o^2</math> jest estymatorem obciążonym.
W tej sytuacji, jako nieobciążony estymator wariancji możemy zaproponować
<equation id="eq:93">
<center><math>\displaystyle
{ s^{2}=\frac{1}{n-1}\underset{i=1}{\overset{n}{\sum }}(x_{i}-
\overline{x})^{2} }
</math></center>
</equation>

===Estymator wariancji wartości średniej===
Podstawiając tę zależność do wyprowadzonego powyżej wzoru na wariancję wartości średniej w miejsce <math>\sigma^2</math>, dostajemy wzór na estymator wariancji wartości średniej próby

<equation id="eq:94">
<center><math>\displaystyle
s^2_{\overline{x}} = \frac{1}{n(n-1)}\sum_{i=1}^n(x_{i}-\overline{x})^{2}.
</math>
</equation></center>

Pierwiastek tej wielkości

<equation id="eq:94a">
<center><math>\displaystyle
s_{\overline{x}} = \sqrt{
\frac{1}{n(n-1)}\sum_{i=1}^n(x_{i}-\overline{x})^{2}}
</math>
</equation></center>

jest estymatorem '''odchylenia standardowego wartości średniej'''.

WnioskowanieStatystyczne/Statystyki i estymatory

2026-03-25T15:43:05Z

Durka: /* Estymator wariancji */

[[Wnioskowanie_Statystyczne_-_wykład]]

==Statystyki i estymatory==
Funkcję <math>S(x_{1},x_{2},...x_{n})</math> określoną na elementach próby <math>\{x_i\}</math>
zwiemy '''statystyką'''. Obliczane w praktyce statystyki służą
weryfikacji hipotez statystycznych (zwiemy je wtedy '''statystykami testowymi''' — tym zajmiemy się w następnym rozdziale) lub estymacji (szacowaniu) parametrów rozkładu prawdopodobieństwa w populacji
zmiennej <math>x</math>, z której pobierana jest próba. W tym drugim przypadku zwiemy je
'''estymatorami'''. Na przykład wartość średnia próby

<math>\displaystyle
\overline{x}=\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}x_{i} \qquad
</math>
może być estymatorem wartości oczekiwanej populacji <math>\mu=E(x)</math>.

Estymator zwiemy '''nieobciążonym''', jeśli dla każdej
wielkości próby <math>n</math> jego wartość oczekiwana jest równa
wartości estymowanego parametru (oznaczmy go np. <math>\beta</math>):

<math>\displaystyle
\forall n \ E(S(x_{1}...x_{n}))=\beta.
</math>

Estymator zwiemy '''zgodnym''', jeśli przy wielkości próby dążącej do
nieskończoności jego wariancja dąży do zera:

<math>\displaystyle
\underset{n\rightarrow \infty }{\lim }\sigma (S(x_{1}...x_{n}))=0.
</math>

==Estymator wartości oczekiwanej==

Dla rozkładów ciągłych wartość oczekiwana <math>\displaystyle
\mu=E(x)=\overset{n}{\underset{i=1}{\sum }}x_{i}P(X=x_{i})
</math>

Dla rozkładów dyskretnych wartość oczekiwana <math>\displaystyle
\mu=E(x)=\underset{-\infty }{\overset{\infty }{\int }}x p(x)dx
</math>

Estymator wartości oczekiwanej postaci
<equation id="eq:91">
<math>\displaystyle
\overline{x}=\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}x_{i}
</math>
</equation>

jest nieobciążony i zgodny.

'''Dowód:'''

<math>\displaystyle
E(\overline{x})=E\left(\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}x_{i}\right)=
\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}E(x_{i})
=\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}\mu
=\frac{1}{n}n\mu =\mu
</math>

<math>\displaystyle
\sigma ^{2}\left( \overline{x}\right) =
E \left( \left( \overline{x}-E(\overline{x})\right)^{2}\right) =
E\left(\left(\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}x_{i}-
\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}\mu \right)^{2}\right) =
</math>

<math>\displaystyle
=\frac{1}{n^{2}}E\left(\left(\underset{i=1}{\overset{n}{\sum }}(x_{i}-\mu )\right)^{2}\right)
</math>

Jeśli elementy próby są niezależne, to
<math>\displaystyle
E\left((x_{i}-\mu)(x_{j}-\mu )\right) =\delta _{ij}\sigma ^{2}(x_{i}),
</math>

gdzie <math>\delta_{ij}</math> oznacza deltę Kroneckera
(<math>\delta_{ij}=1\ \textrm{ dla }\ i=j,
\delta_{ij}=0\ \textrm{ dla }\ i\neq j</math>), czyli:

<math>\sigma ^{2}\left( \overline{x}\right)
=\frac{1}{n^{2}}E\left(\underset{i=1}{\overset{n}{\sum }}(x_{i}-\mu )^{2}\right)
=\frac{1}{n^{2}}\left(\underset{i=1}{\overset{n}{\sum }}E(x_{i}-\mu )^{2}\right)
= \frac{1}{n^{2}}\underset{i=1}{\overset{n}{
\sum }}\sigma ^{2}(x_i)
</math>

Ponadto, jeśli elementy próby pochodzą z tego samego rozkładu, to
<math>\sigma ^{2}(x_{i})=\sigma^{2}(x)</math>, czyli

<equation id="eq:91">
<math>\displaystyle
{ \sigma ^{2}(\overline{x})=\frac{1}{n^{2}}\underset{i=1}{\overset{n}{
\sum }}\sigma ^{2}(x)=\frac{1}{n}\sigma ^{2}(x)\ }.
</math>
</equation>

{| role="presentation" class="wikitable mw-collapsible mw-collapsed"
| Prawo wielkich liczb (opcjonalnie)  
|-
| Do zgodności estymatora wartości oczekiwanej odnosi się również prawo wielkich liczb. Mówi ono, że
<blockquote>
wartość średnia <math>\overline{x}=\frac{1}{n}\sum\limits_{i=1}^{n} x_i</math>, obliczona z odpowiednio dużej próby (o liczności co najmniej <math>n_0</math>), pobieranej z populacji o skończonej wariancji, może być
dowolnie bliska wartości oczekiwanej <math>\mu</math>.
</blockquote>

Co to znaczy "odpowiednio duża próba" i "dowolnie bliska"?

Jeśli chcemy, żeby wartość średnia nie odbiegała od <math>\mu</math> o więcej niż <math>\varepsilon</math> z prawdopodobieństwem ,,prawie jeden", czyli <math>1-\eta</math>, to dla wybranych (dowolnie małych, dodatnich) <math>\varepsilon </math> i <math>\eta</math> istnieje takie
<math>n_{0}</math>, że dla każdego <math>n>n_{0}</math>:

<equation id="eq:92">
<math>\displaystyle \exists {\varepsilon, \eta} \forall{n>n_0}
P\left( \left| \frac{1}{n}\sum\limits_{i=1}^{n} x_i -\mu \right| <\varepsilon
\right) > 1-\eta.
</math>
</equation>

Jest to tzw. słabe prawo wielkich liczb; mocne prawo wielkich liczb mówi, że

<math>\displaystyle
\underset{n\rightarrow \infty }{\lim} \frac{1}{n}\sum\limits_{i=1}^{n} x_i = \mu .
</math>
Dokładniejsze formulacje i dowody można znaleźć np. w książce "Wnioskowanie statystyczne" L. Gajek i M. Kałuszka, WNT 2000.
|}

==Estymator wariancji==
Spróbujmy skonstruować estymator wariancji z próby jako  
<math>\displaystyle s_o^{2}=\frac{1}{n} \underset{i=1}{\overset{n}{\sum }}(x_{i}-\overline{x})^{2}.</math>

Aby wyliczyć jego wartość oczekiwaną, wyprowadźmy jeszcze kilka prostych zależności. Na początek wykażemy, że wariancja zmiennej losowej jest równa różnicy wartości oczekiwanej kwadratu tej zmiennej i kwadratu jej wartości oczekiwanej:

<math>\displaystyle
\sigma^{2}(x_i)=E((x_i-\mu)^{2})=E(x_i^{2}-2x_i\mu+\mu ^{2})=E(x_i^{2})-2\mu E(x_i)+\mu^{2}=\\
\quad\;\;\;\;\;\: = E(x_i^{2})-\mu^{2}=E(x_i^{2})-\left\{ E(x_i)\right\} ^{2}
</math>

Czyli <equation id="eq:64">
<center><math>\displaystyle
\sigma ^{2}(x_i) = E(x_i^{2})-\left\{ E(x_i)\right\} ^{2} = E(x_i^{2}) - \mu^2
</math></center>
</equation>

Wynika stąd w szczególności, że
<center><math>\displaystyle
E(x_i^{2}) = \sigma_{x_i}^2 + \mu^2
</math></center>

Analogicznie dla wariancji wartości średniej
<center><math>\displaystyle
E(\overline{x}^2) = \sigma_\overline{x}^2 + \mu^2
</math></center>

Czyli <math>\sigma_\overline{x}^2 = E(\overline{x}^2) - \mu^2</math>.
Ponieważ <math> \sigma^{2}_\overline{x}=\frac{1}{n}\sigma^{2}_{x_i} </math>
dostajemy

<center><math>\displaystyle
\frac{1}{n}\sigma^{2}_{x_i} = E(\overline{x}^2) - \mu^2
</math></center>

czyli

<center><math>\displaystyle
E(\overline{x}^2) = \frac{1}{n}\sigma^{2}_{x_i} + \mu^2
</math></center>

Policzmy teraz wartość oczekiwaną proponowanego estymatora wariancji  
<math>\displaystyle s_o^{2}=\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}(x_{i}-\overline{x})^{2}</math>

<math>\displaystyle
E\left( s_o^{2}\right) =
\frac{1}{n} E\left(\sum\limits_{i=1}^{n}(x_{i}-\overline{x})^{2}\right)
</math>

<math>\displaystyle =
\frac{1}{n} E\left(\sum\limits_{i=1}^{n}x_{i}^2 + \sum\limits_{i=1}^{n}\overline{x}^{2} - 2\sum\limits_{i=1}^{n} \overline{x} x_i \right)
</math>

<math>\displaystyle =
\frac{1}{n} \left(\sum\limits_{i=1}^{n}E(x_{i}^2) + \sum\limits_{i=1}^{n}E(\overline{x}^{2}) - 2 E \left(\overline{x} \sum\limits_{i=1}^{n} x_i \right) \right)
</math>

<math>\displaystyle =
\frac{1}{n} \left(\sum\limits_{i=1}^{n}E(x_{i}^2) + n E(\overline{x}^{2}) - 2 n E (\overline{x}^2 ) \right)
</math>

<math>\displaystyle =
\frac{1}{n} \left(n E\left(x_{i}^2\right) - n E\left(\overline{x}^{2}\right) \right)
</math>

podstawiając wyprowadzone wcześniej wzory na <math>E(x_{i}^2)</math> i <math>E(\overline{x}^{2})</math> dostajemy

<math>\displaystyle
E\left( s_o^{2}\right) = \frac{1}{n} \left( n \left(\sigma^2_{x_i} - \mu^2\right) -n \left( \frac{1}{n}\sigma^2_{x_i} - \mu^2 \right) \right)
=\frac{n-1}{n}\sigma^{2}_{x_i}
</math>

czyli nie jest dla każdej wielkości próby <math>n</math> wartość oczekiwana tego estymatora wyniesie <math>\sigma^2(x)</math>. Tak więc <math>s_o^2</math> jest estymatorem obciążonym.
W tej sytuacji, jako nieobciążony estymator wariancji możemy zaproponować
<equation id="eq:93">
<center><math>\displaystyle
{ s^{2}=\frac{1}{n-1}\underset{i=1}{\overset{n}{\sum }}(x_{i}-
\overline{x})^{2} }
</math></center>
</equation>

===Estymator wariancji wartości średniej===
Podstawiając tę zależność do wyprowadzonego powyżej wzoru na wariancję wartości średniej w miejsce <math>\sigma^2</math>, dostajemy wzór na estymator wariancji wartości średniej próby

<equation id="eq:94">
<center><math>\displaystyle
s^2_{\overline{x}} = \frac{1}{n(n-1)}\sum_{i=1}^n(x_{i}-\overline{x})^{2}.
</math>
</equation></center>

Pierwiastek tej wielkości

<equation id="eq:94a">
<center><math>\displaystyle
s_{\overline{x}} = \sqrt{
\frac{1}{n(n-1)}\sum_{i=1}^n(x_{i}-\overline{x})^{2}}
</math>
</equation></center>

jest estymatorem '''odchylenia standardowego wartości średniej'''.

WnioskowanieStatystyczne/Statystyki i estymatory

2026-03-25T15:40:56Z

Durka: /* Estymator wariancji */

[[Wnioskowanie_Statystyczne_-_wykład]]

==Statystyki i estymatory==
Funkcję <math>S(x_{1},x_{2},...x_{n})</math> określoną na elementach próby <math>\{x_i\}</math>
zwiemy '''statystyką'''. Obliczane w praktyce statystyki służą
weryfikacji hipotez statystycznych (zwiemy je wtedy '''statystykami testowymi''' — tym zajmiemy się w następnym rozdziale) lub estymacji (szacowaniu) parametrów rozkładu prawdopodobieństwa w populacji
zmiennej <math>x</math>, z której pobierana jest próba. W tym drugim przypadku zwiemy je
'''estymatorami'''. Na przykład wartość średnia próby

<math>\displaystyle
\overline{x}=\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}x_{i} \qquad
</math>
może być estymatorem wartości oczekiwanej populacji <math>\mu=E(x)</math>.

Estymator zwiemy '''nieobciążonym''', jeśli dla każdej
wielkości próby <math>n</math> jego wartość oczekiwana jest równa
wartości estymowanego parametru (oznaczmy go np. <math>\beta</math>):

<math>\displaystyle
\forall n \ E(S(x_{1}...x_{n}))=\beta.
</math>

Estymator zwiemy '''zgodnym''', jeśli przy wielkości próby dążącej do
nieskończoności jego wariancja dąży do zera:

<math>\displaystyle
\underset{n\rightarrow \infty }{\lim }\sigma (S(x_{1}...x_{n}))=0.
</math>

==Estymator wartości oczekiwanej==

Dla rozkładów ciągłych wartość oczekiwana <math>\displaystyle
\mu=E(x)=\overset{n}{\underset{i=1}{\sum }}x_{i}P(X=x_{i})
</math>

Dla rozkładów dyskretnych wartość oczekiwana <math>\displaystyle
\mu=E(x)=\underset{-\infty }{\overset{\infty }{\int }}x p(x)dx
</math>

Estymator wartości oczekiwanej postaci
<equation id="eq:91">
<math>\displaystyle
\overline{x}=\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}x_{i}
</math>
</equation>

jest nieobciążony i zgodny.

'''Dowód:'''

<math>\displaystyle
E(\overline{x})=E\left(\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}x_{i}\right)=
\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}E(x_{i})
=\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}\mu
=\frac{1}{n}n\mu =\mu
</math>

<math>\displaystyle
\sigma ^{2}\left( \overline{x}\right) =
E \left( \left( \overline{x}-E(\overline{x})\right)^{2}\right) =
E\left(\left(\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}x_{i}-
\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}\mu \right)^{2}\right) =
</math>

<math>\displaystyle
=\frac{1}{n^{2}}E\left(\left(\underset{i=1}{\overset{n}{\sum }}(x_{i}-\mu )\right)^{2}\right)
</math>

Jeśli elementy próby są niezależne, to
<math>\displaystyle
E\left((x_{i}-\mu)(x_{j}-\mu )\right) =\delta _{ij}\sigma ^{2}(x_{i}),
</math>

gdzie <math>\delta_{ij}</math> oznacza deltę Kroneckera
(<math>\delta_{ij}=1\ \textrm{ dla }\ i=j,
\delta_{ij}=0\ \textrm{ dla }\ i\neq j</math>), czyli:

<math>\sigma ^{2}\left( \overline{x}\right)
=\frac{1}{n^{2}}E\left(\underset{i=1}{\overset{n}{\sum }}(x_{i}-\mu )^{2}\right)
=\frac{1}{n^{2}}\left(\underset{i=1}{\overset{n}{\sum }}E(x_{i}-\mu )^{2}\right)
= \frac{1}{n^{2}}\underset{i=1}{\overset{n}{
\sum }}\sigma ^{2}(x_i)
</math>

Ponadto, jeśli elementy próby pochodzą z tego samego rozkładu, to
<math>\sigma ^{2}(x_{i})=\sigma^{2}(x)</math>, czyli

<equation id="eq:91">
<math>\displaystyle
{ \sigma ^{2}(\overline{x})=\frac{1}{n^{2}}\underset{i=1}{\overset{n}{
\sum }}\sigma ^{2}(x)=\frac{1}{n}\sigma ^{2}(x)\ }.
</math>
</equation>

{| role="presentation" class="wikitable mw-collapsible mw-collapsed"
| Prawo wielkich liczb (opcjonalnie)  
|-
| Do zgodności estymatora wartości oczekiwanej odnosi się również prawo wielkich liczb. Mówi ono, że
<blockquote>
wartość średnia <math>\overline{x}=\frac{1}{n}\sum\limits_{i=1}^{n} x_i</math>, obliczona z odpowiednio dużej próby (o liczności co najmniej <math>n_0</math>), pobieranej z populacji o skończonej wariancji, może być
dowolnie bliska wartości oczekiwanej <math>\mu</math>.
</blockquote>

Co to znaczy "odpowiednio duża próba" i "dowolnie bliska"?

Jeśli chcemy, żeby wartość średnia nie odbiegała od <math>\mu</math> o więcej niż <math>\varepsilon</math> z prawdopodobieństwem ,,prawie jeden", czyli <math>1-\eta</math>, to dla wybranych (dowolnie małych, dodatnich) <math>\varepsilon </math> i <math>\eta</math> istnieje takie
<math>n_{0}</math>, że dla każdego <math>n>n_{0}</math>:

<equation id="eq:92">
<math>\displaystyle \exists {\varepsilon, \eta} \forall{n>n_0}
P\left( \left| \frac{1}{n}\sum\limits_{i=1}^{n} x_i -\mu \right| <\varepsilon
\right) > 1-\eta.
</math>
</equation>

Jest to tzw. słabe prawo wielkich liczb; mocne prawo wielkich liczb mówi, że

<math>\displaystyle
\underset{n\rightarrow \infty }{\lim} \frac{1}{n}\sum\limits_{i=1}^{n} x_i = \mu .
</math>
Dokładniejsze formulacje i dowody można znaleźć np. w książce "Wnioskowanie statystyczne" L. Gajek i M. Kałuszka, WNT 2000.
|}

==Estymator wariancji==
Spróbujmy skonstruować estymator wariancji z próby jako  
<math>\displaystyle s_o^{2}=\frac{1}{n} \underset{i=1}{\overset{n}{\sum }}(x_{i}-\overline{x})^{2}.</math>

Aby wyliczyć jego wartość oczekiwaną, wyprowadźmy jeszcze kilka prostych zależności. Na początek wykażemy, że wariancja zmiennej losowej jest równa różnicy wartości oczekiwanej kwadratu tej zmiennej i kwadratu jej wartości oczekiwanej:

<math>\displaystyle
\sigma^{2}(x_i)=E((x_i-\mu)^{2})=E(x_i^{2}-2x_i\mu+\mu ^{2})=E(x_i^{2})-2\mu E(x_i)+\mu^{2}=\\
\quad\;\;\;\;\;\: = E(x_i^{2})-\mu^{2}=E(x_i^{2})-\left\{ E(x_i)\right\} ^{2}
</math>

Czyli <equation id="eq:64">
<center><math>\displaystyle
\sigma ^{2}(x_i) = E(x_i^{2})-\left\{ E(x_i)\right\} ^{2} = E(x_i^{2}) - \mu^2
</math></center>
</equation>

Wynika stąd w szczególności, że
<center><math>\displaystyle
E(x_i^{2}) = \sigma_{x_i}^2 + \mu^2
</math></center>

Analogicznie dla wariancji wartości średniej
<center><math>\displaystyle
E(\overline{x}^2) = \sigma_\overline{x}^2 + \mu^2
</math></center>

Czyli <math>\sigma_\overline{x}^2 = E(\overline{x}^2) - \mu^2</math>.
Ponieważ <math> \sigma^{2}_\overline{x}=\frac{1}{n}\sigma^{2}_{x_i} </math>
dostajemy

<center><math>\displaystyle
\frac{1}{n}\sigma^{2}_{x_i} = E(x_i^2) - \mu^2
</math></center>

czyli

<center><math>\displaystyle
E(\overline{x}^2) = \frac{1}{n}\sigma^{2}_{x_i} + \mu^2
</math></center>

Policzmy teraz wartość oczekiwaną proponowanego estymatora wariancji  
<math>\displaystyle s_o^{2}=\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}(x_{i}-\overline{x})^{2}</math>

<math>\displaystyle
E\left( s_o^{2}\right) =
\frac{1}{n} E\left(\sum\limits_{i=1}^{n}(x_{i}-\overline{x})^{2}\right)
</math>

<math>\displaystyle =
\frac{1}{n} E\left(\sum\limits_{i=1}^{n}x_{i}^2 + \sum\limits_{i=1}^{n}\overline{x}^{2} - 2\sum\limits_{i=1}^{n} \overline{x} x_i \right)
</math>

<math>\displaystyle =
\frac{1}{n} \left(\sum\limits_{i=1}^{n}E(x_{i}^2) + \sum\limits_{i=1}^{n}E(\overline{x}^{2}) - 2 E \left(\overline{x} \sum\limits_{i=1}^{n} x_i \right) \right)
</math>

<math>\displaystyle =
\frac{1}{n} \left(\sum\limits_{i=1}^{n}E(x_{i}^2) + n E(\overline{x}^{2}) - 2 n E (\overline{x}^2 ) \right)
</math>

<math>\displaystyle =
\frac{1}{n} \left(n E\left(x_{i}^2\right) - n E\left(\overline{x}^{2}\right) \right)
</math>

podstawiając wyprowadzone wcześniej wzory na <math>E(x_{i}^2)</math> i <math>E(\overline{x}^{2})</math> dostajemy

<math>\displaystyle
E\left( s_o^{2}\right) = \frac{1}{n} \left( n \left(\sigma^2_{x_i} - \mu^2\right) -n \left( \frac{1}{n}\sigma^2_{x_i} - \mu^2 \right) \right)
=\frac{n-1}{n}\sigma^{2}_{x_i}
</math>

czyli nie jest dla każdej wielkości próby <math>n</math> wartość oczekiwana tego estymatora wyniesie <math>\sigma^2(x)</math>. Tak więc <math>s_o^2</math> jest estymatorem obciążonym.
W tej sytuacji, jako nieobciążony estymator wariancji możemy zaproponować
<equation id="eq:93">
<center><math>\displaystyle
{ s^{2}=\frac{1}{n-1}\underset{i=1}{\overset{n}{\sum }}(x_{i}-
\overline{x})^{2} }
</math></center>
</equation>

===Estymator wariancji wartości średniej===
Podstawiając tę zależność do wyprowadzonego powyżej wzoru na wariancję wartości średniej w miejsce <math>\sigma^2</math>, dostajemy wzór na estymator wariancji wartości średniej próby

<equation id="eq:94">
<center><math>\displaystyle
s^2_{\overline{x}} = \frac{1}{n(n-1)}\sum_{i=1}^n(x_{i}-\overline{x})^{2}.
</math>
</equation></center>

Pierwiastek tej wielkości

<equation id="eq:94a">
<center><math>\displaystyle
s_{\overline{x}} = \sqrt{
\frac{1}{n(n-1)}\sum_{i=1}^n(x_{i}-\overline{x})^{2}}
</math>
</equation></center>

jest estymatorem '''odchylenia standardowego wartości średniej'''.

WnioskowanieStatystyczne/Statystyki i estymatory

2026-03-25T15:39:00Z

Durka: /* Estymator wariancji */

[[Wnioskowanie_Statystyczne_-_wykład]]

==Statystyki i estymatory==
Funkcję <math>S(x_{1},x_{2},...x_{n})</math> określoną na elementach próby <math>\{x_i\}</math>
zwiemy '''statystyką'''. Obliczane w praktyce statystyki służą
weryfikacji hipotez statystycznych (zwiemy je wtedy '''statystykami testowymi''' — tym zajmiemy się w następnym rozdziale) lub estymacji (szacowaniu) parametrów rozkładu prawdopodobieństwa w populacji
zmiennej <math>x</math>, z której pobierana jest próba. W tym drugim przypadku zwiemy je
'''estymatorami'''. Na przykład wartość średnia próby

<math>\displaystyle
\overline{x}=\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}x_{i} \qquad
</math>
może być estymatorem wartości oczekiwanej populacji <math>\mu=E(x)</math>.

Estymator zwiemy '''nieobciążonym''', jeśli dla każdej
wielkości próby <math>n</math> jego wartość oczekiwana jest równa
wartości estymowanego parametru (oznaczmy go np. <math>\beta</math>):

<math>\displaystyle
\forall n \ E(S(x_{1}...x_{n}))=\beta.
</math>

Estymator zwiemy '''zgodnym''', jeśli przy wielkości próby dążącej do
nieskończoności jego wariancja dąży do zera:

<math>\displaystyle
\underset{n\rightarrow \infty }{\lim }\sigma (S(x_{1}...x_{n}))=0.
</math>

==Estymator wartości oczekiwanej==

Dla rozkładów ciągłych wartość oczekiwana <math>\displaystyle
\mu=E(x)=\overset{n}{\underset{i=1}{\sum }}x_{i}P(X=x_{i})
</math>

Dla rozkładów dyskretnych wartość oczekiwana <math>\displaystyle
\mu=E(x)=\underset{-\infty }{\overset{\infty }{\int }}x p(x)dx
</math>

Estymator wartości oczekiwanej postaci
<equation id="eq:91">
<math>\displaystyle
\overline{x}=\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}x_{i}
</math>
</equation>

jest nieobciążony i zgodny.

'''Dowód:'''

<math>\displaystyle
E(\overline{x})=E\left(\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}x_{i}\right)=
\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}E(x_{i})
=\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}\mu
=\frac{1}{n}n\mu =\mu
</math>

<math>\displaystyle
\sigma ^{2}\left( \overline{x}\right) =
E \left( \left( \overline{x}-E(\overline{x})\right)^{2}\right) =
E\left(\left(\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}x_{i}-
\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}\mu \right)^{2}\right) =
</math>

<math>\displaystyle
=\frac{1}{n^{2}}E\left(\left(\underset{i=1}{\overset{n}{\sum }}(x_{i}-\mu )\right)^{2}\right)
</math>

Jeśli elementy próby są niezależne, to
<math>\displaystyle
E\left((x_{i}-\mu)(x_{j}-\mu )\right) =\delta _{ij}\sigma ^{2}(x_{i}),
</math>

gdzie <math>\delta_{ij}</math> oznacza deltę Kroneckera
(<math>\delta_{ij}=1\ \textrm{ dla }\ i=j,
\delta_{ij}=0\ \textrm{ dla }\ i\neq j</math>), czyli:

<math>\sigma ^{2}\left( \overline{x}\right)
=\frac{1}{n^{2}}E\left(\underset{i=1}{\overset{n}{\sum }}(x_{i}-\mu )^{2}\right)
=\frac{1}{n^{2}}\left(\underset{i=1}{\overset{n}{\sum }}E(x_{i}-\mu )^{2}\right)
= \frac{1}{n^{2}}\underset{i=1}{\overset{n}{
\sum }}\sigma ^{2}(x_i)
</math>

Ponadto, jeśli elementy próby pochodzą z tego samego rozkładu, to
<math>\sigma ^{2}(x_{i})=\sigma^{2}(x)</math>, czyli

<equation id="eq:91">
<math>\displaystyle
{ \sigma ^{2}(\overline{x})=\frac{1}{n^{2}}\underset{i=1}{\overset{n}{
\sum }}\sigma ^{2}(x)=\frac{1}{n}\sigma ^{2}(x)\ }.
</math>
</equation>

{| role="presentation" class="wikitable mw-collapsible mw-collapsed"
| Prawo wielkich liczb (opcjonalnie)  
|-
| Do zgodności estymatora wartości oczekiwanej odnosi się również prawo wielkich liczb. Mówi ono, że
<blockquote>
wartość średnia <math>\overline{x}=\frac{1}{n}\sum\limits_{i=1}^{n} x_i</math>, obliczona z odpowiednio dużej próby (o liczności co najmniej <math>n_0</math>), pobieranej z populacji o skończonej wariancji, może być
dowolnie bliska wartości oczekiwanej <math>\mu</math>.
</blockquote>

Co to znaczy "odpowiednio duża próba" i "dowolnie bliska"?

Jeśli chcemy, żeby wartość średnia nie odbiegała od <math>\mu</math> o więcej niż <math>\varepsilon</math> z prawdopodobieństwem ,,prawie jeden", czyli <math>1-\eta</math>, to dla wybranych (dowolnie małych, dodatnich) <math>\varepsilon </math> i <math>\eta</math> istnieje takie
<math>n_{0}</math>, że dla każdego <math>n>n_{0}</math>:

<equation id="eq:92">
<math>\displaystyle \exists {\varepsilon, \eta} \forall{n>n_0}
P\left( \left| \frac{1}{n}\sum\limits_{i=1}^{n} x_i -\mu \right| <\varepsilon
\right) > 1-\eta.
</math>
</equation>

Jest to tzw. słabe prawo wielkich liczb; mocne prawo wielkich liczb mówi, że

<math>\displaystyle
\underset{n\rightarrow \infty }{\lim} \frac{1}{n}\sum\limits_{i=1}^{n} x_i = \mu .
</math>
Dokładniejsze formulacje i dowody można znaleźć np. w książce "Wnioskowanie statystyczne" L. Gajek i M. Kałuszka, WNT 2000.
|}

==Estymator wariancji==
Spróbujmy skonstruować estymator wariancji z próby jako  
<math>\displaystyle s_o^{2}=\frac{1}{n} \underset{i=1}{\overset{n}{\sum }}(x_{i}-\overline{x})^{2}.</math>

Aby wyliczyć jego wartość oczekiwaną, wyprowadźmy jeszcze kilka prostych zależności. Na początek wykażemy, że wariancja zmiennej losowej jest równa różnicy wartości oczekiwanej kwadratu tej zmiennej i kwadratu jej wartości oczekiwanej:

<math>\displaystyle
\sigma^{2}(x_i)=E((x_i-\mu)^{2})=E(x_i^{2}-2x_i\mu+\mu ^{2})=E(x_i^{2})-2\mu E(x_i)+\mu^{2}=\\
\quad\;\;\;\;\;\: = E(x_i^{2})-\mu^{2}=E(x_i^{2})-\left\{ E(x_i)\right\} ^{2}
</math>

Czyli <equation id="eq:64">
<center><math>\displaystyle
\sigma ^{2}(x_i) = E(x_i^{2})-\left\{ E(x_i)\right\} ^{2} = E(x_i^{2}) - \mu^2
</math></center>
</equation>

Wynika stąd w szczególności, że
<center><math>\displaystyle
E(x_i^{2}) = \sigma_{x_i}^2 + \mu^2
</math></center>

Analogicznie dla wariancji wartości średniej
<center><math>\displaystyle
E(\overline{x}^2) = \sigma_\overline{x}^2 + \mu^2
</math></center>

Czyli <math>\sigma_\overline{x}^2 = E(\overline{x}^2) - \mu^2</math>.
Ponieważ <math> \sigma ^{2}_\overline{x}=\frac{1}{n}\sigma^{2}_x_i </math>
dostajemy

<center><math>\displaystyle
\frac{1}{n}\sigma^{2}_{x_i} = E({x_I}^2) - \mu^2
</math></center>

czyli

<center><math>\displaystyle
E(\overline{x}^2) = \frac{1}{n}\sigma^{2}_{x_i} + \mu^2
</math></center>

Policzmy teraz wartość oczekiwaną proponowanego estymatora wariancji  
<math>\displaystyle s_o^{2}=\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}(x_{i}-\overline{x})^{2}</math>

<math>\displaystyle
E\left( s_o^{2}\right) =
\frac{1}{n} E\left(\sum\limits_{i=1}^{n}(x_{i}-\overline{x})^{2}\right)
</math>

<math>\displaystyle =
\frac{1}{n} E\left(\sum\limits_{i=1}^{n}x_{i}^2 + \sum\limits_{i=1}^{n}\overline{x}^{2} - 2\sum\limits_{i=1}^{n} \overline{x} x_i \right)
</math>

<math>\displaystyle =
\frac{1}{n} \left(\sum\limits_{i=1}^{n}E(x_{i}^2) + \sum\limits_{i=1}^{n}E(\overline{x}^{2}) - 2 E \left(\overline{x} \sum\limits_{i=1}^{n} x_i \right) \right)
</math>

<math>\displaystyle =
\frac{1}{n} \left(\sum\limits_{i=1}^{n}E(x_{i}^2) + n E(\overline{x}^{2}) - 2 n E (\overline{x}^2 ) \right)
</math>

<math>\displaystyle =
\frac{1}{n} \left(n E\left(x_{i}^2\right) - n E\left(\overline{x}^{2}\right) \right)
</math>

podstawiając wyprowadzone wcześniej wzory na <math>E(x_{i}^2)</math> i <math>E(\overline{x}^{2})</math> dostajemy

<math>\displaystyle
E\left( s_o^{2}\right) = \frac{1}{n} \left( n \left(\sigma^2_{x_i} - \mu^2\right) -n \left( \frac{1}{n}\sigma^2_{x_i} - \mu^2 \right) \right)
=\frac{n-1}{n}\sigma^{2}_{x_i}
</math>

czyli nie jest dla każdej wielkości próby <math>n</math> wartość oczekiwana tego estymatora wyniesie <math>\sigma^2(x)</math>. Tak więc <math>s_o^2</math> jest estymatorem obciążonym.
W tej sytuacji, jako nieobciążony estymator wariancji możemy zaproponować
<equation id="eq:93">
<center><math>\displaystyle
{ s^{2}=\frac{1}{n-1}\underset{i=1}{\overset{n}{\sum }}(x_{i}-
\overline{x})^{2} }
</math></center>
</equation>

===Estymator wariancji wartości średniej===
Podstawiając tę zależność do wyprowadzonego powyżej wzoru na wariancję wartości średniej w miejsce <math>\sigma^2</math>, dostajemy wzór na estymator wariancji wartości średniej próby

<equation id="eq:94">
<center><math>\displaystyle
s^2_{\overline{x}} = \frac{1}{n(n-1)}\sum_{i=1}^n(x_{i}-\overline{x})^{2}.
</math>
</equation></center>

Pierwiastek tej wielkości

<equation id="eq:94a">
<center><math>\displaystyle
s_{\overline{x}} = \sqrt{
\frac{1}{n(n-1)}\sum_{i=1}^n(x_{i}-\overline{x})^{2}}
</math>
</equation></center>

jest estymatorem '''odchylenia standardowego wartości średniej'''.

WnioskowanieStatystyczne/Statystyki i estymatory

2026-03-20T09:18:52Z

Durka: /* Estymator wariancji */

[[Wnioskowanie_Statystyczne_-_wykład]]

==Statystyki i estymatory==
Funkcję <math>S(x_{1},x_{2},...x_{n})</math> określoną na elementach próby <math>\{x_i\}</math>
zwiemy '''statystyką'''. Obliczane w praktyce statystyki służą
weryfikacji hipotez statystycznych (zwiemy je wtedy '''statystykami testowymi''' — tym zajmiemy się w następnym rozdziale) lub estymacji (szacowaniu) parametrów rozkładu prawdopodobieństwa w populacji
zmiennej <math>x</math>, z której pobierana jest próba. W tym drugim przypadku zwiemy je
'''estymatorami'''. Na przykład wartość średnia próby

<math>\displaystyle
\overline{x}=\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}x_{i} \qquad
</math>
może być estymatorem wartości oczekiwanej populacji <math>\mu=E(x)</math>.

Estymator zwiemy '''nieobciążonym''', jeśli dla każdej
wielkości próby <math>n</math> jego wartość oczekiwana jest równa
wartości estymowanego parametru (oznaczmy go np. <math>\beta</math>):

<math>\displaystyle
\forall n \ E(S(x_{1}...x_{n}))=\beta.
</math>

Estymator zwiemy '''zgodnym''', jeśli przy wielkości próby dążącej do
nieskończoności jego wariancja dąży do zera:

<math>\displaystyle
\underset{n\rightarrow \infty }{\lim }\sigma (S(x_{1}...x_{n}))=0.
</math>

==Estymator wartości oczekiwanej==

Dla rozkładów ciągłych wartość oczekiwana <math>\displaystyle
\mu=E(x)=\overset{n}{\underset{i=1}{\sum }}x_{i}P(X=x_{i})
</math>

Dla rozkładów dyskretnych wartość oczekiwana <math>\displaystyle
\mu=E(x)=\underset{-\infty }{\overset{\infty }{\int }}x p(x)dx
</math>

Estymator wartości oczekiwanej postaci
<equation id="eq:91">
<math>\displaystyle
\overline{x}=\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}x_{i}
</math>
</equation>

jest nieobciążony i zgodny.

'''Dowód:'''

<math>\displaystyle
E(\overline{x})=E\left(\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}x_{i}\right)=
\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}E(x_{i})
=\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}\mu
=\frac{1}{n}n\mu =\mu
</math>

<math>\displaystyle
\sigma ^{2}\left( \overline{x}\right) =
E \left( \left( \overline{x}-E(\overline{x})\right)^{2}\right) =
E\left(\left(\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}x_{i}-
\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}\mu \right)^{2}\right) =
</math>

<math>\displaystyle
=\frac{1}{n^{2}}E\left(\left(\underset{i=1}{\overset{n}{\sum }}(x_{i}-\mu )\right)^{2}\right)
</math>

Jeśli elementy próby są niezależne, to
<math>\displaystyle
E\left((x_{i}-\mu)(x_{j}-\mu )\right) =\delta _{ij}\sigma ^{2}(x_{i}),
</math>

gdzie <math>\delta_{ij}</math> oznacza deltę Kroneckera
(<math>\delta_{ij}=1\ \textrm{ dla }\ i=j,
\delta_{ij}=0\ \textrm{ dla }\ i\neq j</math>), czyli:

<math>\sigma ^{2}\left( \overline{x}\right)
=\frac{1}{n^{2}}E\left(\underset{i=1}{\overset{n}{\sum }}(x_{i}-\mu )^{2}\right)
=\frac{1}{n^{2}}\left(\underset{i=1}{\overset{n}{\sum }}E(x_{i}-\mu )^{2}\right)
= \frac{1}{n^{2}}\underset{i=1}{\overset{n}{
\sum }}\sigma ^{2}(x_i)
</math>

Ponadto, jeśli elementy próby pochodzą z tego samego rozkładu, to
<math>\sigma ^{2}(x_{i})=\sigma^{2}(x)</math>, czyli

<equation id="eq:91">
<math>\displaystyle
{ \sigma ^{2}(\overline{x})=\frac{1}{n^{2}}\underset{i=1}{\overset{n}{
\sum }}\sigma ^{2}(x)=\frac{1}{n}\sigma ^{2}(x)\ }.
</math>
</equation>

{| role="presentation" class="wikitable mw-collapsible mw-collapsed"
| Prawo wielkich liczb (opcjonalnie)  
|-
| Do zgodności estymatora wartości oczekiwanej odnosi się również prawo wielkich liczb. Mówi ono, że
<blockquote>
wartość średnia <math>\overline{x}=\frac{1}{n}\sum\limits_{i=1}^{n} x_i</math>, obliczona z odpowiednio dużej próby (o liczności co najmniej <math>n_0</math>), pobieranej z populacji o skończonej wariancji, może być
dowolnie bliska wartości oczekiwanej <math>\mu</math>.
</blockquote>

Co to znaczy "odpowiednio duża próba" i "dowolnie bliska"?

Jeśli chcemy, żeby wartość średnia nie odbiegała od <math>\mu</math> o więcej niż <math>\varepsilon</math> z prawdopodobieństwem ,,prawie jeden", czyli <math>1-\eta</math>, to dla wybranych (dowolnie małych, dodatnich) <math>\varepsilon </math> i <math>\eta</math> istnieje takie
<math>n_{0}</math>, że dla każdego <math>n>n_{0}</math>:

<equation id="eq:92">
<math>\displaystyle \exists {\varepsilon, \eta} \forall{n>n_0}
P\left( \left| \frac{1}{n}\sum\limits_{i=1}^{n} x_i -\mu \right| <\varepsilon
\right) > 1-\eta.
</math>
</equation>

Jest to tzw. słabe prawo wielkich liczb; mocne prawo wielkich liczb mówi, że

<math>\displaystyle
\underset{n\rightarrow \infty }{\lim} \frac{1}{n}\sum\limits_{i=1}^{n} x_i = \mu .
</math>
Dokładniejsze formulacje i dowody można znaleźć np. w książce "Wnioskowanie statystyczne" L. Gajek i M. Kałuszka, WNT 2000.
|}

==Estymator wariancji==
Spróbujmy skonstruować estymator wariancji z próby jako  
<math>\displaystyle s_o^{2}=\frac{1}{n} \underset{i=1}{\overset{n}{\sum }}(x_{i}-\overline{x})^{2}.</math>

Aby wyliczyć jego wartość oczekiwaną, wyprowadźmy jeszcze kilka prostych zależności. Na początek wykażemy, że wariancja zmiennej losowej jest równa różnicy wartości oczekiwanej kwadratu tej zmiennej i kwadratu jej wartości oczekiwanej:

<math>\displaystyle
\sigma^{2}(x_i)=E((x_i-\mu)^{2})=E(x_i^{2}-2x_i\mu+\mu ^{2})=E(x_i^{2})-2\mu E(x_i)+\mu^{2}=\\
\quad\;\;\;\;\;\: = E(x_i^{2})-\mu^{2}=E(x_i^{2})-\left\{ E(x_i)\right\} ^{2}
</math>

Czyli <equation id="eq:64">
<center><math>\displaystyle
\sigma ^{2}(x_i) = E(x_i^{2})-\left\{ E(x_i)\right\} ^{2} = E(x_i^{2}) - \mu^2
</math></center>
</equation>

Wynika stąd w szczególności, że
<center><math>\displaystyle
E(x_i^{2}) = \sigma_{x_i}^2 + \mu^2
</math></center>

Analogicznie dla wariancji wartości średniej
<center><math>
E(\overline{x}^2) = \sigma_\overline{x}^2 + \mu^2
</math></center>

Ponieważ
<math>\displaystyle
{ \sigma ^{2}_\overline{x}=\frac{1}{n}\sigma^{2}_x }
</math>
dostajemy

<center><math>\displaystyle
\frac{1}{n}\sigma^{2}_\overline{x} = E({x}^2) - \mu^2
</math></center>

czyli

<center><math>\displaystyle
E(\overline{x}^2) = \frac{1}{n}\sigma^{2}_{x_i} - \mu^2
</math></center>

Policzmy teraz wartość oczekiwaną proponowanego estymatora wariancji  
<math>\displaystyle s_o^{2}=\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}(x_{i}-\overline{x})^{2}</math>

<math>\displaystyle
E\left( s_o^{2}\right) =
\frac{1}{n} E\left(\sum\limits_{i=1}^{n}(x_{i}-\overline{x})^{2}\right)
</math>

<math>\displaystyle =
\frac{1}{n} E\left(\sum\limits_{i=1}^{n}x_{i}^2 + \sum\limits_{i=1}^{n}\overline{x}^{2} - 2\sum\limits_{i=1}^{n} \overline{x} x_i \right)
</math>

<math>\displaystyle =
\frac{1}{n} \left(\sum\limits_{i=1}^{n}E(x_{i}^2) + \sum\limits_{i=1}^{n}E(\overline{x}^{2}) - 2 E \left(\overline{x} \sum\limits_{i=1}^{n} x_i \right) \right)
</math>

<math>\displaystyle =
\frac{1}{n} \left(\sum\limits_{i=1}^{n}E(x_{i}^2) + n E(\overline{x}^{2}) - 2 n E (\overline{x}^2 ) \right)
</math>

<math>\displaystyle =
\frac{1}{n} \left(n E\left(x_{i}^2\right) - n E\left(\overline{x}^{2}\right) \right)
</math>

podstawiając wyprowadzone wcześniej wzory na <math>E(x_{i}^2)</math> i <math>E(\overline{x}^{2})</math> dostajemy

<math>\displaystyle
E\left( s_o^{2}\right) = \frac{1}{n} \left( n \left(\sigma^2_{x_i} - \mu^2\right) -n \left( \frac{1}{n}\sigma^2_{x_i} - \mu^2 \right) \right)
=\frac{n-1}{n}\sigma^{2}_{x_i}
</math>

czyli nie jest dla każdej wielkości próby <math>n</math> wartość oczekiwana tego estymatora wyniesie <math>\sigma^2(x)</math>. Tak więc <math>s_o^2</math> jest estymatorem obciążonym.
W tej sytuacji, jako nieobciążony estymator wariancji możemy zaproponować
<equation id="eq:93">
<center><math>\displaystyle
{ s^{2}=\frac{1}{n-1}\underset{i=1}{\overset{n}{\sum }}(x_{i}-
\overline{x})^{2} }
</math></center>
</equation>

===Estymator wariancji wartości średniej===
Podstawiając tę zależność do wyprowadzonego powyżej wzoru na wariancję wartości średniej w miejsce <math>\sigma^2</math>, dostajemy wzór na estymator wariancji wartości średniej próby

<equation id="eq:94">
<center><math>\displaystyle
s^2_{\overline{x}} = \frac{1}{n(n-1)}\sum_{i=1}^n(x_{i}-\overline{x})^{2}.
</math>
</equation></center>

Pierwiastek tej wielkości

<equation id="eq:94a">
<center><math>\displaystyle
s_{\overline{x}} = \sqrt{
\frac{1}{n(n-1)}\sum_{i=1}^n(x_{i}-\overline{x})^{2}}
</math>
</equation></center>

jest estymatorem '''odchylenia standardowego wartości średniej'''.

Wnioskowanie Statystyczne - wykład

2026-03-13T10:06:28Z

Durka: /* Wnioskowanie statystyczne (wykład) */

[[Category:Przedmioty specjalizacyjne]]

=Wnioskowanie statystyczne (wykład)=
'''UWAGA: wymagane zaliczenie Technologii Informacyjnych i Komunikacyjnych z ćwiczeniami z programowania w Pythonie w wymiarze 45 godzin ćwiczeń'''
#
## [[WnioskowanieStatystyczne/Rozklady|Rozkłady gęstości prawdopodobieństwa]]
## [[WnioskowanieStatystyczne/Momenty|Wariancja, mediana...]]
## [[WnioskowanieStatystyczne/Rozklady-przyklady|Przykładowe rozkłady]] — ''przed 2. ćwiczeniami''
#
## [[WnioskowanieStatystyczne/CLT|Centralne Twierdzenie Graniczne]] — ''przed 3. ćwiczeniami''
#
## [[WnioskowanieStatystyczne/wstep|Wstęp]]
## [[WnioskowanieStatystyczne/Klasyczna_teoria|Teoria klasyczna]]
## [[WnioskowanieStatystyczne/Statystyki_i_estymatory|Statystyki i estymatory]]
#
## [[WnioskowanieStatystyczne/Weryfikacja_hipotez|Weryfikacja hipotez statystycznych]]
## [[WnioskowanieStatystyczne/Test_t|Test ''t'' Studenta]]
#
## [[WnioskowanieStatystyczne/Test_chi2|Test <math>\chi^2</math>]]
#
## [[WnioskowanieStatystyczne/Z_komputerem|Monte Carlo]]
#
## [[WnioskowanieStatystyczne/Testy_nieprametryczne|Testy nieparametryczne]]
## [[WnioskowanieStatystyczne/Test_serii|Test serii]]
## [[WnioskowanieStatystyczne/Test_Wilcoxona|Test Wilcoxona-Manna-Whitneya]]
#
## [[WnioskowanieStatystyczne/Testy_permutacyjne|Testy permutacyjne]]
## [[WnioskowanieStatystyczne/Bootstrap|Bootstrap]]
#
## [[WnioskowanieStatystyczne/MLF|Metoda największej wiarygodności]]
## [[WnioskowanieStatystyczne/Regresja_liniowa|Regresja liniowa]]
#
## [[WnioskowanieStatystyczne/Interpretacja współczynnika korelacji|Interpretacja współczynnika korelacji]]
## [[WnioskowanieStatystyczne/Analiza_wariancji|Analiza wariancji]]
#
## [[WnioskowanieStatystyczne/ROC|TP, FP, ROC]]
#
## [[WnioskowanieStatystyczne/Bonferroni|Problem porównań wielokrotnych — miejskie legendy i przepowiednie]]
#
## [[WnioskowanieStatystyczne/Prawdopodobienstwo|Prawdopodobieństwo]]
## [[WnioskowanieStatystyczne/Twierdzenie_Bayesa|Twierdzenie Bayesa]]
## [[WnioskowanieStatystyczne/Effect_size|Wielkość efektu]]
#
## [[WnioskowanieStatystyczne/Elementy_statystyki_wielowymiarowej|PCA, MANOVA, analiza skupień]]
## [[Sztuczne sieci neuronowe (ANN )|LDA, LR, ANN]]
## [[Algorytmy Genetyczne|Algorytmy Genetyczne]]


----

{{color|green|'''Całość podręcznika jest udostępniona na licencji [http://creativecommons.org/licenses/by-sa/3.0/pl Creative Commons Uznanie autorstwa-Na tych samych zasadach 3.0 Polska].'''}} [[Grafika:CC-88x31.png]]
Na podstawie książki [https://www.fuw.edu.pl/~durka/ksiazki/statystyka/index.html Wstęp do współczesnej statystyki]. Autor: [http://durka.name Piotr Durka].

----

*[https://drive.google.com/drive/folders/1d9KI-_RZUJSmZEnGk8cgIXp825XFVf93 slajdy z wykładów]
* [https://drive.google.com/drive/folders/17gUnDAzVKY1CRQ4ExTqsjwYgXTJ-eWnq zapisy wideo zajęć zdalnych w 2021]
* książka [https://www.deeplearningbook.org "Deep Learning"] Ian Goodfellow, Yoshua Bengio and Aaron Courville

=Egzamin i zaliczenie=
Do egzaminu podchodzą osoby, które zaliczą [[Wnioskowanie_Statystyczne_-_ćwiczenia | ćwiczenia]] — w braku zaliczonych ćwiczeń wynik egzaminu z wykładu nie "przenosi się" na przyszły rok. Egzamin składał się będzie z:
# testu jednokrotnego wyboru (<math>N</math> pytań, każde z czterema odpowiedziami do wyboru, 1 punkt za odpowiedź poprawną, zero punktów za odpowiedź błędną lub jej brak, z korektą dla <math>p</math> poprawnych odpowiedzi
<math>
p_{\% kor} = \frac{p - N/4}{N - N/4}
</math>
i
#kilku pytań otwartych (po 2—4 punkty).

Próg zaliczenia (dst) wynosi 50% (po korekcie na odpowiedzi przypadkowe w części testowej). Progi dla pozostałych ocen będą ustalone a posteriori na podstawie statystyk.

Ocena końcowa z przedmiotu = średnia ocen z ćwiczeń i z wykładu, pod warunkiem zaliczenia ćwiczeń '''i''' wykładu (koniunkcja warunków).

==Organizacja egzaminu==

'''Egzamin rozpocznie się 27 czerwca 2025 o godzinie 10 w sali 1.01 (Pasteura 5).'''

* nie wychodzimy z sali w trakcie egzaminu — bardzo proszę o przygotowanie się pod tym kątem :)
* nie ściągamy. To niemodne i passé, a przeprowadzenie egzaminu w przyjaznej atmosferze leży w Waszym interesie

* dla zachowania przyjaznej atmosfery i oddalenia pokus nieetycznych zachowań, torby/teczki/ubrania nie pozostawione w szatni zostawiamy na podłodze na froncie sali. Do ławki zabieramy ze sobą tylko długopis (lub dwa) oraz dowolne ID ze zdjęciem, które okazujemy na ew. prośbę Prowadzących (elegancko jest od razu położyć ID na brzegu ławki po podpisaniu testu)
* w ławkach siadamy, zajmując dostępną przestrzeń możliwie równomiernie według wskazań Prowadzących, poczynając od pierwszych ławek
* nie jest dopuszczalny kontakt z urządzeniami komunikacyjnymi i/lub elektronicznymi. Jeśli ktoś oczekuje pilnego telefonu w czasie egzaminu, powinien ten fakt zgłosić Prowadzącym _przed_ rozpoczęciem egzaminu. W pozostałych wypadkach telefony (po wyciszeniu a najlepiej wyłączeniu) itp. urządzenia potencjalnie komunikacyjne i elektroniczne pozostawiamy w torbach lub ew. w kieszeniach i nie wyjmujemy w czasie egzaminu. Do wykonania nielicznych wyliczeń wystarczy głowa, ew. długopis
* odpowiedzi na pytania testowe będziemy wpisywać "na czysto" w tabelce przed samym oddaniem testu, strony z pytaniami testowymi można dowolnie pomazać, oznaczenia na pytaniach nie będą brane pod uwagę przy sprawdzaniu
* odpowiedzi do pytań otwartych wpisujemy maksymalnie czytelnie i "na czysto". Nieczytelne i niewyraźne wywody nie będą sprawdzane. Kartki użyte jako brudnopis przed oddaniem przekreślamy.
* oddajemy kompletne arkusze wraz z notatkami i brudnopisami, nie jest dozwolone robienie kopii "na pamiątkę".

==Tematy do przemyślenia przed egzaminem ==
Dla ustalenia uwagi, na przykład:
* Sformułuj Centralne Twierdzenie Graniczne.
* Wypisz i przedyskutuj definicje prawdopodobieństwa.
* Wypisz założenia wersji Centralnego Twierdzenia Granicznego, którą można stosunkowo prosto udowodnić (twierdzenie Lindeberga-Levy'ego). Udowodnij lub spróbuj nakreślić szkic dowodu.
* Oblicz wartość oczekiwaną rozkładu równomiernego, określonego na odcinku [0, 2], danego wzorami p(''x'') = 0,5 dla <math>0\leq x\leq 2</math> i p(''x'') = 0 dla ''x''>2 lub ''x''<0.
* Oblicz wariancję rozkładu równomiernego określonego na odcinku [0, 2], danego wzorami p(''x'') = 0,5 dla <math>0\leq x\leq 2</math> i p(''x'') = 0 dla ''x''>2 lub ''x''<0
* Co to jest <math>\chi^2</math>?
* Wypisz / wyprowadź wzory na wartość oczekiwaną i wariancję rozkładu Poissona.
* Z rozkładu dwumianowego wylicz prawdopodobieństwo, że wśród czworga dzieci będą co najmniej trzy dziewczynki — zakładając, że prawdopodobieństwa urodzenia dziecka każdej płci są równe.
* Testy parametryczne i nieparametryczne: wady, zalety, przykłady.
* Co ma wspólnego poziom istotności testu z poprawką Bonferroniego?
* Co to jest i jak obliczamy moc testu?
* Opisz w punktach (zwięźle i konkretnie) procedurę weryfikacji hipotezy o różnicy średnich dwóch grup wyników <math>\{x_{i}, i=1\dots N\}</math> i <math>\{y_{j}, j=1\dots M\}</math> metodą repróbkowania (resampling).
* Wyprowadź wzór na średnią ''N'' pomiarów <math>x_i</math> o różnych wariancjach <math>\sigma_{i}^2</math> z metody największej wiarygodności.
* Dany jest zbiór rozłącznych hipotez <math>H_{i}</math> pokrywających całą przestrzeń zdarzeń <math>\Omega</math>: <math>\sum_{i}H_{i}=\Omega</math> oraz prawdopodobieństwa wyniku eksperymentu W w świetle każdej z hipotez <math>H_{i}</math>, czyli <math>P(W\mid H_{i})</math>. Korzystając z tych oznaczeń, wypisz i wyprowadź twierdzenie Bayesa, czyli wzór na prawdopodobieństwo prawdziwości hipotezy <math>H_{j}</math> w świetle wyników eksperymentu W.
* Wyjaśnij różnicę między poziomem istotności hipotezy o różnicy średnich a rozmiarem efektu, wyliczonymi dla tych samych danych.
* Opisz w kategoriach wejścia i wyjścia algorytmy realizujące: regresję liniową, regresję logistyczną, liniową analizę dyskryminacyjną, analizę skupień, analizę wariancji i analizę składowych głównych.

WnioskowanieStatystyczne/Statystyki i estymatory

2026-03-12T15:06:58Z

Durka: /* Estymator wariancji */

[[Wnioskowanie_Statystyczne_-_wykład]]

==Statystyki i estymatory==
Funkcję <math>S(x_{1},x_{2},...x_{n})</math> określoną na elementach próby <math>\{x_i\}</math>
zwiemy '''statystyką'''. Obliczane w praktyce statystyki służą
weryfikacji hipotez statystycznych (zwiemy je wtedy '''statystykami testowymi''' — tym zajmiemy się w następnym rozdziale) lub estymacji (szacowaniu) parametrów rozkładu prawdopodobieństwa w populacji
zmiennej <math>x</math>, z której pobierana jest próba. W tym drugim przypadku zwiemy je
'''estymatorami'''. Na przykład wartość średnia próby

<math>\displaystyle
\overline{x}=\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}x_{i} \qquad
</math>
może być estymatorem wartości oczekiwanej populacji <math>\mu=E(x)</math>.

Estymator zwiemy '''nieobciążonym''', jeśli dla każdej
wielkości próby <math>n</math> jego wartość oczekiwana jest równa
wartości estymowanego parametru (oznaczmy go np. <math>\beta</math>):

<math>\displaystyle
\forall n \ E(S(x_{1}...x_{n}))=\beta.
</math>

Estymator zwiemy '''zgodnym''', jeśli przy wielkości próby dążącej do
nieskończoności jego wariancja dąży do zera:

<math>\displaystyle
\underset{n\rightarrow \infty }{\lim }\sigma (S(x_{1}...x_{n}))=0.
</math>

==Estymator wartości oczekiwanej==

Dla rozkładów ciągłych wartość oczekiwana <math>\displaystyle
\mu=E(x)=\overset{n}{\underset{i=1}{\sum }}x_{i}P(X=x_{i})
</math>

Dla rozkładów dyskretnych wartość oczekiwana <math>\displaystyle
\mu=E(x)=\underset{-\infty }{\overset{\infty }{\int }}x p(x)dx
</math>

Estymator wartości oczekiwanej postaci
<equation id="eq:91">
<math>\displaystyle
\overline{x}=\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}x_{i}
</math>
</equation>

jest nieobciążony i zgodny.

'''Dowód:'''

<math>\displaystyle
E(\overline{x})=E\left(\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}x_{i}\right)=
\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}E(x_{i})
=\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}\mu
=\frac{1}{n}n\mu =\mu
</math>

<math>\displaystyle
\sigma ^{2}\left( \overline{x}\right) =
E \left( \left( \overline{x}-E(\overline{x})\right)^{2}\right) =
E\left(\left(\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}x_{i}-
\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}\mu \right)^{2}\right) =
</math>

<math>\displaystyle
=\frac{1}{n^{2}}E\left(\left(\underset{i=1}{\overset{n}{\sum }}(x_{i}-\mu )\right)^{2}\right)
</math>

Jeśli elementy próby są niezależne, to
<math>\displaystyle
E\left((x_{i}-\mu)(x_{j}-\mu )\right) =\delta _{ij}\sigma ^{2}(x_{i}),
</math>

gdzie <math>\delta_{ij}</math> oznacza deltę Kroneckera
(<math>\delta_{ij}=1\ \textrm{ dla }\ i=j,
\delta_{ij}=0\ \textrm{ dla }\ i\neq j</math>), czyli:

<math>\sigma ^{2}\left( \overline{x}\right)
=\frac{1}{n^{2}}E\left(\underset{i=1}{\overset{n}{\sum }}(x_{i}-\mu )^{2}\right)
=\frac{1}{n^{2}}\left(\underset{i=1}{\overset{n}{\sum }}E(x_{i}-\mu )^{2}\right)
= \frac{1}{n^{2}}\underset{i=1}{\overset{n}{
\sum }}\sigma ^{2}(x_i)
</math>

Ponadto, jeśli elementy próby pochodzą z tego samego rozkładu, to
<math>\sigma ^{2}(x_{i})=\sigma^{2}(x)</math>, czyli

<equation id="eq:91">
<math>\displaystyle
{ \sigma ^{2}(\overline{x})=\frac{1}{n^{2}}\underset{i=1}{\overset{n}{
\sum }}\sigma ^{2}(x)=\frac{1}{n}\sigma ^{2}(x)\ }.
</math>
</equation>

{| role="presentation" class="wikitable mw-collapsible mw-collapsed"
| Prawo wielkich liczb (opcjonalnie)  
|-
| Do zgodności estymatora wartości oczekiwanej odnosi się również prawo wielkich liczb. Mówi ono, że
<blockquote>
wartość średnia <math>\overline{x}=\frac{1}{n}\sum\limits_{i=1}^{n} x_i</math>, obliczona z odpowiednio dużej próby (o liczności co najmniej <math>n_0</math>), pobieranej z populacji o skończonej wariancji, może być
dowolnie bliska wartości oczekiwanej <math>\mu</math>.
</blockquote>

Co to znaczy "odpowiednio duża próba" i "dowolnie bliska"?

Jeśli chcemy, żeby wartość średnia nie odbiegała od <math>\mu</math> o więcej niż <math>\varepsilon</math> z prawdopodobieństwem ,,prawie jeden", czyli <math>1-\eta</math>, to dla wybranych (dowolnie małych, dodatnich) <math>\varepsilon </math> i <math>\eta</math> istnieje takie
<math>n_{0}</math>, że dla każdego <math>n>n_{0}</math>:

<equation id="eq:92">
<math>\displaystyle \exists {\varepsilon, \eta} \forall{n>n_0}
P\left( \left| \frac{1}{n}\sum\limits_{i=1}^{n} x_i -\mu \right| <\varepsilon
\right) > 1-\eta.
</math>
</equation>

Jest to tzw. słabe prawo wielkich liczb; mocne prawo wielkich liczb mówi, że

<math>\displaystyle
\underset{n\rightarrow \infty }{\lim} \frac{1}{n}\sum\limits_{i=1}^{n} x_i = \mu .
</math>
Dokładniejsze formulacje i dowody można znaleźć np. w książce "Wnioskowanie statystyczne" L. Gajek i M. Kałuszka, WNT 2000.
|}

==Estymator wariancji==
Spróbujmy skonstruować estymator wariancji z próby jako  
<math>\displaystyle s_o^{2}=\frac{1}{n} \underset{i=1}{\overset{n}{\sum }}(x_{i}-\overline{x})^{2}.</math>

Aby wyliczyć jego wartość oczekiwaną, wyprowadźmy jeszcze kilka prostych zależności. Na początek wykażemy, że wariancja zmiennej losowej jest równa różnicy wartości oczekiwanej kwadratu tej zmiennej i kwadratu jej wartości oczekiwanej:

<math>\displaystyle
\sigma^{2}(x_i)=E((x_i-\mu)^{2})=E(x_i^{2}-2x_i\mu+\mu ^{2})=E(x_i^{2})-2\mu E(x_i)+\mu^{2}=\\
\quad\;\;\;\;\;\: = E(x_i^{2})-\mu^{2}=E(x_i^{2})-\left\{ E(x_i)\right\} ^{2}
</math>

Czyli <equation id="eq:64">
<center><math>\displaystyle
\sigma ^{2}(x_i) = E(x_i^{2})-\left\{ E(x_i)\right\} ^{2} = E(x_i^{2}) - \mu^2
</math></center>
</equation>

Wynika stąd w szczególności, że
<center><math>\displaystyle
E(x_i^{2}) = \sigma_{x_i}^2 + \mu^2
</math></center>

Analogicznie dla wariancji wartości średniej
<center><math>
E(\overline{x}^2) = \sigma_\overline{x}^2 + \mu^2
</math></center>

Ponieważ
<math>\displaystyle
{ \sigma ^{2}_\overline{x}=\frac{1}{n}\sigma^{2}_x }
</math>
dostajemy

<center><math>\displaystyle
\frac{1}{n}\sigma^{2}_\overline{x} = E(\overline{x}^2) - \mu^2
</math></center>

czyli

<center><math>\displaystyle
E(\overline{x}^2) = \frac{1}{n}\sigma^{2}_{x_i} - \mu^2
</math></center>

Policzmy teraz wartość oczekiwaną proponowanego estymatora wariancji  
<math>\displaystyle s_o^{2}=\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}(x_{i}-\overline{x})^{2}</math>

<math>\displaystyle
E\left( s_o^{2}\right) =
\frac{1}{n} E\left(\sum\limits_{i=1}^{n}(x_{i}-\overline{x})^{2}\right)
</math>

<math>\displaystyle =
\frac{1}{n} E\left(\sum\limits_{i=1}^{n}x_{i}^2 + \sum\limits_{i=1}^{n}\overline{x}^{2} - 2\sum\limits_{i=1}^{n} \overline{x} x_i \right)
</math>

<math>\displaystyle =
\frac{1}{n} \left(\sum\limits_{i=1}^{n}E(x_{i}^2) + \sum\limits_{i=1}^{n}E(\overline{x}^{2}) - 2 E \left(\overline{x} \sum\limits_{i=1}^{n} x_i \right) \right)
</math>

<math>\displaystyle =
\frac{1}{n} \left(\sum\limits_{i=1}^{n}E(x_{i}^2) + n E(\overline{x}^{2}) - 2 n E (\overline{x}^2 ) \right)
</math>

<math>\displaystyle =
\frac{1}{n} \left(n E\left(x_{i}^2\right) - n E\left(\overline{x}^{2}\right) \right)
</math>

podstawiając wyprowadzone wcześniej wzory na <math>E(x_{i}^2)</math> i <math>E(\overline{x}^{2})</math> dostajemy

<math>\displaystyle
E\left( s_o^{2}\right) = \frac{1}{n} \left( n \left(\sigma^2_{x_i} - \mu^2\right) -n \left( \frac{1}{n}\sigma^2_{x_i} - \mu^2 \right) \right)
=\frac{n-1}{n}\sigma^{2}_{x_i}
</math>

czyli nie jest dla każdej wielkości próby <math>n</math> wartość oczekiwana tego estymatora wyniesie <math>\sigma^2(x)</math>. Tak więc <math>s_o^2</math> jest estymatorem obciążonym.
W tej sytuacji, jako nieobciążony estymator wariancji możemy zaproponować
<equation id="eq:93">
<center><math>\displaystyle
{ s^{2}=\frac{1}{n-1}\underset{i=1}{\overset{n}{\sum }}(x_{i}-
\overline{x})^{2} }
</math></center>
</equation>

===Estymator wariancji wartości średniej===
Podstawiając tę zależność do wyprowadzonego powyżej wzoru na wariancję wartości średniej w miejsce <math>\sigma^2</math>, dostajemy wzór na estymator wariancji wartości średniej próby

<equation id="eq:94">
<center><math>\displaystyle
s^2_{\overline{x}} = \frac{1}{n(n-1)}\sum_{i=1}^n(x_{i}-\overline{x})^{2}.
</math>
</equation></center>

Pierwiastek tej wielkości

<equation id="eq:94a">
<center><math>\displaystyle
s_{\overline{x}} = \sqrt{
\frac{1}{n(n-1)}\sum_{i=1}^n(x_{i}-\overline{x})^{2}}
</math>
</equation></center>

jest estymatorem '''odchylenia standardowego wartości średniej'''.

WnioskowanieStatystyczne/Statystyki i estymatory

2026-03-12T15:04:49Z

Durka: /* Estymator wariancji */

[[Wnioskowanie_Statystyczne_-_wykład]]

==Statystyki i estymatory==
Funkcję <math>S(x_{1},x_{2},...x_{n})</math> określoną na elementach próby <math>\{x_i\}</math>
zwiemy '''statystyką'''. Obliczane w praktyce statystyki służą
weryfikacji hipotez statystycznych (zwiemy je wtedy '''statystykami testowymi''' — tym zajmiemy się w następnym rozdziale) lub estymacji (szacowaniu) parametrów rozkładu prawdopodobieństwa w populacji
zmiennej <math>x</math>, z której pobierana jest próba. W tym drugim przypadku zwiemy je
'''estymatorami'''. Na przykład wartość średnia próby

<math>\displaystyle
\overline{x}=\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}x_{i} \qquad
</math>
może być estymatorem wartości oczekiwanej populacji <math>\mu=E(x)</math>.

Estymator zwiemy '''nieobciążonym''', jeśli dla każdej
wielkości próby <math>n</math> jego wartość oczekiwana jest równa
wartości estymowanego parametru (oznaczmy go np. <math>\beta</math>):

<math>\displaystyle
\forall n \ E(S(x_{1}...x_{n}))=\beta.
</math>

Estymator zwiemy '''zgodnym''', jeśli przy wielkości próby dążącej do
nieskończoności jego wariancja dąży do zera:

<math>\displaystyle
\underset{n\rightarrow \infty }{\lim }\sigma (S(x_{1}...x_{n}))=0.
</math>

==Estymator wartości oczekiwanej==

Dla rozkładów ciągłych wartość oczekiwana <math>\displaystyle
\mu=E(x)=\overset{n}{\underset{i=1}{\sum }}x_{i}P(X=x_{i})
</math>

Dla rozkładów dyskretnych wartość oczekiwana <math>\displaystyle
\mu=E(x)=\underset{-\infty }{\overset{\infty }{\int }}x p(x)dx
</math>

Estymator wartości oczekiwanej postaci
<equation id="eq:91">
<math>\displaystyle
\overline{x}=\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}x_{i}
</math>
</equation>

jest nieobciążony i zgodny.

'''Dowód:'''

<math>\displaystyle
E(\overline{x})=E\left(\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}x_{i}\right)=
\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}E(x_{i})
=\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}\mu
=\frac{1}{n}n\mu =\mu
</math>

<math>\displaystyle
\sigma ^{2}\left( \overline{x}\right) =
E \left( \left( \overline{x}-E(\overline{x})\right)^{2}\right) =
E\left(\left(\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}x_{i}-
\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}\mu \right)^{2}\right) =
</math>

<math>\displaystyle
=\frac{1}{n^{2}}E\left(\left(\underset{i=1}{\overset{n}{\sum }}(x_{i}-\mu )\right)^{2}\right)
</math>

Jeśli elementy próby są niezależne, to
<math>\displaystyle
E\left((x_{i}-\mu)(x_{j}-\mu )\right) =\delta _{ij}\sigma ^{2}(x_{i}),
</math>

gdzie <math>\delta_{ij}</math> oznacza deltę Kroneckera
(<math>\delta_{ij}=1\ \textrm{ dla }\ i=j,
\delta_{ij}=0\ \textrm{ dla }\ i\neq j</math>), czyli:

<math>\sigma ^{2}\left( \overline{x}\right)
=\frac{1}{n^{2}}E\left(\underset{i=1}{\overset{n}{\sum }}(x_{i}-\mu )^{2}\right)
=\frac{1}{n^{2}}\left(\underset{i=1}{\overset{n}{\sum }}E(x_{i}-\mu )^{2}\right)
= \frac{1}{n^{2}}\underset{i=1}{\overset{n}{
\sum }}\sigma ^{2}(x_i)
</math>

Ponadto, jeśli elementy próby pochodzą z tego samego rozkładu, to
<math>\sigma ^{2}(x_{i})=\sigma^{2}(x)</math>, czyli

<equation id="eq:91">
<math>\displaystyle
{ \sigma ^{2}(\overline{x})=\frac{1}{n^{2}}\underset{i=1}{\overset{n}{
\sum }}\sigma ^{2}(x)=\frac{1}{n}\sigma ^{2}(x)\ }.
</math>
</equation>

{| role="presentation" class="wikitable mw-collapsible mw-collapsed"
| Prawo wielkich liczb (opcjonalnie)  
|-
| Do zgodności estymatora wartości oczekiwanej odnosi się również prawo wielkich liczb. Mówi ono, że
<blockquote>
wartość średnia <math>\overline{x}=\frac{1}{n}\sum\limits_{i=1}^{n} x_i</math>, obliczona z odpowiednio dużej próby (o liczności co najmniej <math>n_0</math>), pobieranej z populacji o skończonej wariancji, może być
dowolnie bliska wartości oczekiwanej <math>\mu</math>.
</blockquote>

Co to znaczy "odpowiednio duża próba" i "dowolnie bliska"?

Jeśli chcemy, żeby wartość średnia nie odbiegała od <math>\mu</math> o więcej niż <math>\varepsilon</math> z prawdopodobieństwem ,,prawie jeden", czyli <math>1-\eta</math>, to dla wybranych (dowolnie małych, dodatnich) <math>\varepsilon </math> i <math>\eta</math> istnieje takie
<math>n_{0}</math>, że dla każdego <math>n>n_{0}</math>:

<equation id="eq:92">
<math>\displaystyle \exists {\varepsilon, \eta} \forall{n>n_0}
P\left( \left| \frac{1}{n}\sum\limits_{i=1}^{n} x_i -\mu \right| <\varepsilon
\right) > 1-\eta.
</math>
</equation>

Jest to tzw. słabe prawo wielkich liczb; mocne prawo wielkich liczb mówi, że

<math>\displaystyle
\underset{n\rightarrow \infty }{\lim} \frac{1}{n}\sum\limits_{i=1}^{n} x_i = \mu .
</math>
Dokładniejsze formulacje i dowody można znaleźć np. w książce "Wnioskowanie statystyczne" L. Gajek i M. Kałuszka, WNT 2000.
|}

==Estymator wariancji==
Spróbujmy skonstruować estymator wariancji z próby jako  
<math>\displaystyle s_o^{2}=\frac{1}{n} \underset{i=1}{\overset{n}{\sum }}(x_{i}-\overline{x})^{2}.</math>

Aby wyliczyć jego wartość oczekiwaną, wyprowadźmy jeszcze kilka prostych zależności. Na początek wykażemy, że wariancja zmiennej losowej jest równa różnicy wartości oczekiwanej kwadratu tej zmiennej i kwadratu jej wartości oczekiwanej:

<math>\displaystyle
\sigma^{2}(x_i)=E((x_i-\mu)^{2})=E(x_i^{2}-2x_i\mu+\mu ^{2})=E(x_i^{2})-2\mu E(x_i)+\mu^{2}=\\
\quad\;\;\;\;\;\: = E(x_i^{2})-\mu^{2}=E(x_i^{2})-\left\{ E(x_i)\right\} ^{2}
</math>

Czyli <equation id="eq:64">
<center><math>\displaystyle
\sigma ^{2}(x_i) = E(x_i^{2})-\left\{ E(x_i)\right\} ^{2} = E(x_i^{2}) - \mu^2
</math></center>
</equation>

Wynika stąd w szczególności, że
<center><math>\displaystyle
E(x_i^{2}) = \sigma_{x_i}^2 + \mu^2
</math></center>

Analogicznie dla wariancji wartości średniej
<center><math>
E(\overline{x}^2) = \sigma_\overline{x}^2 + \mu^2
</math></center>

Ponieważ
<math>\displaystyle
{ \sigma ^{2}_\overline{x}=\frac{1}{n}\sigma^{2}_x }
</math>
dostajemy

<center><math>\displaystyle
\frac{1}{n}\sigma^{2}_\overline{x} = E(\overline{x}^2) - \mu^2
</math></center>

czyli

<center><math>\displaystyle
E(\overline{x}^2) = \frac{1}{n}\sigma^{2}_{x_i} - \mu^2
</math></center>

Policzmy teraz wartość oczekiwaną proponowanego estymatora wariancji  
<math>\displaystyle s_o^{2}=\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}(x_{i}-\overline{x})^{2}</math>

<math>\displaystyle
E\left( s_o^{2}\right) =
\frac{1}{n} E\left(\sum\limits_{i=1}^{n}(x_{i}-\overline{x})^{2}\right)
</math>

<math>\displaystyle =
\frac{1}{n} E\left(\sum\limits_{i=1}^{n}x_{i}^2 + \sum\limits_{i=1}^{n}\overline{x}^{2} - 2\sum\limits_{i=1}^{n} \overline{x} x_i \right)
</math>

<math>\displaystyle =
\frac{1}{n} \left(\sum\limits_{i=1}^{n}E(x_{i}^2) + \sum\limits_{i=1}^{n}E(\overline{x}^{2}) - 2 E \left(\overline{x} \sum\limits_{i=1}^{n} x_i \right) \right)
</math>

<math>\displaystyle =
\frac{1}{n} \left(\sum\limits_{i=1}^{n}E(x_{i}^2) + n E(\overline{x}^{2}) - 2 n E (\overline{x}^2 ) \right)
</math>

<math>\displaystyle =
\frac{1}{n} \left(n E\left(x_{i}^2\right) - n E\left(\overline{x}^{2}\right) \right)
</math>

podstawiając wyprowadzone wcześniej wzory na <math>E(x_{i}^2)</math> i <math>E(\overline{x}^{2})</math> dostajemy

<math>\displaystyle
E\left( s_o^{2}\right) = \frac{1}{n} \left( n (\sigma^2_{x_i} - \mu^2) -n ( \frac{1}{n}\sigma^2_{x_i} - \mu^2 ) \right)
=\frac{n-1}{n}\sigma^{2}_{x_i}
</math>

czyli nie jest dla każdej wielkości próby <math>n</math> wartość oczekiwana tego estymatora wyniesie <math>\sigma^2(x)</math>. Tak więc <math>s_o^2</math> jest estymatorem obciążonym.
W tej sytuacji, jako nieobciążony estymator wariancji możemy zaproponować
<equation id="eq:93">
<center><math>\displaystyle
{ s^{2}=\frac{1}{n-1}\underset{i=1}{\overset{n}{\sum }}(x_{i}-
\overline{x})^{2} }
</math></center>
</equation>

===Estymator wariancji wartości średniej===
Podstawiając tę zależność do wyprowadzonego powyżej wzoru na
wariancję wartości średniej <xr id="eq:91">(%i)</xr>
w miejsce <math>\sigma^2</math>, dostajemy wzór na estymator wariancji wartości
średniej próby

<equation id="eq:94">
<center><math>\displaystyle
s^2_{\overline{x}} = \frac{1}{n(n-1)}\sum_{i=1}^n(x_{i}-\overline{x})^{2}.
</math>
</equation></center>

Pierwiastek tej wielkości

<equation id="eq:94a">
<center><math>\displaystyle
s_{\overline{x}} = \sqrt{
\frac{1}{n(n-1)}\sum_{i=1}^n(x_{i}-\overline{x})^{2}}
</math>
</equation></center>

jest estymatorem '''odchylenia standardowego wartości średniej'''.

WnioskowanieStatystyczne/Statystyki i estymatory

2026-03-12T15:02:34Z

Durka: /* Estymator wariancji */

[[Wnioskowanie_Statystyczne_-_wykład]]

==Statystyki i estymatory==
Funkcję <math>S(x_{1},x_{2},...x_{n})</math> określoną na elementach próby <math>\{x_i\}</math>
zwiemy '''statystyką'''. Obliczane w praktyce statystyki służą
weryfikacji hipotez statystycznych (zwiemy je wtedy '''statystykami testowymi''' — tym zajmiemy się w następnym rozdziale) lub estymacji (szacowaniu) parametrów rozkładu prawdopodobieństwa w populacji
zmiennej <math>x</math>, z której pobierana jest próba. W tym drugim przypadku zwiemy je
'''estymatorami'''. Na przykład wartość średnia próby

<math>\displaystyle
\overline{x}=\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}x_{i} \qquad
</math>
może być estymatorem wartości oczekiwanej populacji <math>\mu=E(x)</math>.

Estymator zwiemy '''nieobciążonym''', jeśli dla każdej
wielkości próby <math>n</math> jego wartość oczekiwana jest równa
wartości estymowanego parametru (oznaczmy go np. <math>\beta</math>):

<math>\displaystyle
\forall n \ E(S(x_{1}...x_{n}))=\beta.
</math>

Estymator zwiemy '''zgodnym''', jeśli przy wielkości próby dążącej do
nieskończoności jego wariancja dąży do zera:

<math>\displaystyle
\underset{n\rightarrow \infty }{\lim }\sigma (S(x_{1}...x_{n}))=0.
</math>

==Estymator wartości oczekiwanej==

Dla rozkładów ciągłych wartość oczekiwana <math>\displaystyle
\mu=E(x)=\overset{n}{\underset{i=1}{\sum }}x_{i}P(X=x_{i})
</math>

Dla rozkładów dyskretnych wartość oczekiwana <math>\displaystyle
\mu=E(x)=\underset{-\infty }{\overset{\infty }{\int }}x p(x)dx
</math>

Estymator wartości oczekiwanej postaci
<equation id="eq:91">
<math>\displaystyle
\overline{x}=\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}x_{i}
</math>
</equation>

jest nieobciążony i zgodny.

'''Dowód:'''

<math>\displaystyle
E(\overline{x})=E\left(\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}x_{i}\right)=
\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}E(x_{i})
=\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}\mu
=\frac{1}{n}n\mu =\mu
</math>

<math>\displaystyle
\sigma ^{2}\left( \overline{x}\right) =
E \left( \left( \overline{x}-E(\overline{x})\right)^{2}\right) =
E\left(\left(\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}x_{i}-
\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}\mu \right)^{2}\right) =
</math>

<math>\displaystyle
=\frac{1}{n^{2}}E\left(\left(\underset{i=1}{\overset{n}{\sum }}(x_{i}-\mu )\right)^{2}\right)
</math>

Jeśli elementy próby są niezależne, to
<math>\displaystyle
E\left((x_{i}-\mu)(x_{j}-\mu )\right) =\delta _{ij}\sigma ^{2}(x_{i}),
</math>

gdzie <math>\delta_{ij}</math> oznacza deltę Kroneckera
(<math>\delta_{ij}=1\ \textrm{ dla }\ i=j,
\delta_{ij}=0\ \textrm{ dla }\ i\neq j</math>), czyli:

<math>\sigma ^{2}\left( \overline{x}\right)
=\frac{1}{n^{2}}E\left(\underset{i=1}{\overset{n}{\sum }}(x_{i}-\mu )^{2}\right)
=\frac{1}{n^{2}}\left(\underset{i=1}{\overset{n}{\sum }}E(x_{i}-\mu )^{2}\right)
= \frac{1}{n^{2}}\underset{i=1}{\overset{n}{
\sum }}\sigma ^{2}(x_i)
</math>

Ponadto, jeśli elementy próby pochodzą z tego samego rozkładu, to
<math>\sigma ^{2}(x_{i})=\sigma^{2}(x)</math>, czyli

<equation id="eq:91">
<math>\displaystyle
{ \sigma ^{2}(\overline{x})=\frac{1}{n^{2}}\underset{i=1}{\overset{n}{
\sum }}\sigma ^{2}(x)=\frac{1}{n}\sigma ^{2}(x)\ }.
</math>
</equation>

{| role="presentation" class="wikitable mw-collapsible mw-collapsed"
| Prawo wielkich liczb (opcjonalnie)  
|-
| Do zgodności estymatora wartości oczekiwanej odnosi się również prawo wielkich liczb. Mówi ono, że
<blockquote>
wartość średnia <math>\overline{x}=\frac{1}{n}\sum\limits_{i=1}^{n} x_i</math>, obliczona z odpowiednio dużej próby (o liczności co najmniej <math>n_0</math>), pobieranej z populacji o skończonej wariancji, może być
dowolnie bliska wartości oczekiwanej <math>\mu</math>.
</blockquote>

Co to znaczy "odpowiednio duża próba" i "dowolnie bliska"?

Jeśli chcemy, żeby wartość średnia nie odbiegała od <math>\mu</math> o więcej niż <math>\varepsilon</math> z prawdopodobieństwem ,,prawie jeden", czyli <math>1-\eta</math>, to dla wybranych (dowolnie małych, dodatnich) <math>\varepsilon </math> i <math>\eta</math> istnieje takie
<math>n_{0}</math>, że dla każdego <math>n>n_{0}</math>:

<equation id="eq:92">
<math>\displaystyle \exists {\varepsilon, \eta} \forall{n>n_0}
P\left( \left| \frac{1}{n}\sum\limits_{i=1}^{n} x_i -\mu \right| <\varepsilon
\right) > 1-\eta.
</math>
</equation>

Jest to tzw. słabe prawo wielkich liczb; mocne prawo wielkich liczb mówi, że

<math>\displaystyle
\underset{n\rightarrow \infty }{\lim} \frac{1}{n}\sum\limits_{i=1}^{n} x_i = \mu .
</math>
Dokładniejsze formulacje i dowody można znaleźć np. w książce "Wnioskowanie statystyczne" L. Gajek i M. Kałuszka, WNT 2000.
|}

==Estymator wariancji==
Spróbujmy skonstruować estymator wariancji z próby jako  
<math>\displaystyle s_o^{2}=\frac{1}{n} \underset{i=1}{\overset{n}{\sum }}(x_{i}-\overline{x})^{2}.</math>

Aby wyliczyć jego wartość oczekiwaną, wyprowadźmy jeszcze kilka prostych zależności. Na początek wykażemy, że wariancja zmiennej losowej jest równa różnicy wartości oczekiwanej kwadratu tej zmiennej i kwadratu jej wartości oczekiwanej:

<math>\displaystyle
\sigma^{2}(x_i)=E((x_i-\mu)^{2})=E(x_i^{2}-2x_i\mu+\mu ^{2})=E(x_i^{2})-2\mu E(x_i)+\mu^{2}=\\
\quad\;\;\;\;\;\: = E(x_i^{2})-\mu^{2}=E(x_i^{2})-\left\{ E(x_i)\right\} ^{2}
</math>

Czyli <equation id="eq:64">
<center><math>\displaystyle
\sigma ^{2}(x_i) = E(x_i^{2})-\left\{ E(x_i)\right\} ^{2} = E(x_i^{2}) - \mu^2
</math></center>
</equation>

Wynika stąd w szczególności, że
<center><math>\displaystyle
E(x_i^{2}) = \sigma_{x_i}^2 + \mu^2
</math></center>

Analogicznie dla wariancji wartości średniej
<center><math>
E(\overline{x}^2) = \sigma_\overline{x}^2 + \mu^2
</math></center>

Ponieważ
<math>\displaystyle
{ \sigma ^{2}_\overline{x}=\frac{1}{n}\sigma^{2}_x }
</math>
dostajemy

<center><math>\displaystyle
\frac{1}{n}\sigma^{2}_\overline{x} = E(\overline{x}^2) - \mu^2
</math></center>

czyli

<center><math>\displaystyle
E(\overline{x}^2) = \frac{1}{n}\sigma^{2}_{x_i} - \mu^2
</math></center>

Policzmy teraz wartość oczekiwaną proponowanego estymatora wariancji  
<math>\displaystyle s_o^{2}=\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}(x_{i}-\overline{x})^{2}</math>

<math>\displaystyle
E\left( s_o^{2}\right) =
\frac{1}{n} E\left(\sum\limits_{i=1}^{n}(x_{i}-\overline{x})^{2}\right)
</math>

<math>\displaystyle =
\frac{1}{n} E\left(\sum\limits_{i=1}^{n}x_{i}^2 + \sum\limits_{i=1}^{n}\overline{x}^{2} - 2\sum\limits_{i=1}^{n} \overline{x} x_i \right)
</math>

<math>\displaystyle =
\frac{1}{n} \left(\sum\limits_{i=1}^{n}E(x_{i}^2) + \sum\limits_{i=1}^{n}E(\overline{x}^{2}) - 2 E \left(\overline{x} \sum\limits_{i=1}^{n} x_i \right) \right)
</math>

<math>\displaystyle =
\frac{1}{n} \left(\sum\limits_{i=1}^{n}E(x_{i}^2) + n E(\overline{x}^{2}) - 2 n E (\overline{x}^2 ) \right)
</math>

<math>\displaystyle =
\frac{1}{n} \left(n E(x_{i}^2) - n E(\overline{x}^{2}) \right)
</math>

podstawiając wyprowadzone wcześniej wzory na <math>E(x_{i}^2)</math> i <math>E(\overline{x}^{2})</math> dostajemy

<math>\displaystyle
E\left( s_o^{2}\right) = \frac{1}{n} \left( n (\sigma^2_{x_i} - \mu^2) -n ( \frac{1}{n}\sigma^2_{x_i} - \mu^2 ) \right)
=\frac{n-1}{n}\sigma^{2}_{x_i}
</math>

czyli nie jest dla każdej wielkości próby <math>n</math> wartość oczekiwana tego estymatora wyniesie <math>\sigma^2(x)</math>. Tak więc <math>s_o^2</math> jest estymatorem obciążonym.
W tej sytuacji, jako nieobciążony estymator wariancji możemy zaproponować
<equation id="eq:93">
<center><math>\displaystyle
{ s^{2}=\frac{1}{n-1}\underset{i=1}{\overset{n}{\sum }}(x_{i}-
\overline{x})^{2} }
</math></center>
</equation>

===Estymator wariancji wartości średniej===
Podstawiając tę zależność do wyprowadzonego powyżej wzoru na
wariancję wartości średniej <xr id="eq:91">(%i)</xr>
w miejsce <math>\sigma^2</math>, dostajemy wzór na estymator wariancji wartości
średniej próby

<equation id="eq:94">
<center><math>\displaystyle
s^2_{\overline{x}} = \frac{1}{n(n-1)}\sum_{i=1}^n(x_{i}-\overline{x})^{2}.
</math>
</equation></center>

Pierwiastek tej wielkości

<equation id="eq:94a">
<center><math>\displaystyle
s_{\overline{x}} = \sqrt{
\frac{1}{n(n-1)}\sum_{i=1}^n(x_{i}-\overline{x})^{2}}
</math>
</equation></center>

jest estymatorem '''odchylenia standardowego wartości średniej'''.

WnioskowanieStatystyczne/Statystyki i estymatory

2026-03-12T14:59:15Z

Durka: /* Estymator wariancji */

[[Wnioskowanie_Statystyczne_-_wykład]]

==Statystyki i estymatory==
Funkcję <math>S(x_{1},x_{2},...x_{n})</math> określoną na elementach próby <math>\{x_i\}</math>
zwiemy '''statystyką'''. Obliczane w praktyce statystyki służą
weryfikacji hipotez statystycznych (zwiemy je wtedy '''statystykami testowymi''' — tym zajmiemy się w następnym rozdziale) lub estymacji (szacowaniu) parametrów rozkładu prawdopodobieństwa w populacji
zmiennej <math>x</math>, z której pobierana jest próba. W tym drugim przypadku zwiemy je
'''estymatorami'''. Na przykład wartość średnia próby

<math>\displaystyle
\overline{x}=\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}x_{i} \qquad
</math>
może być estymatorem wartości oczekiwanej populacji <math>\mu=E(x)</math>.

Estymator zwiemy '''nieobciążonym''', jeśli dla każdej
wielkości próby <math>n</math> jego wartość oczekiwana jest równa
wartości estymowanego parametru (oznaczmy go np. <math>\beta</math>):

<math>\displaystyle
\forall n \ E(S(x_{1}...x_{n}))=\beta.
</math>

Estymator zwiemy '''zgodnym''', jeśli przy wielkości próby dążącej do
nieskończoności jego wariancja dąży do zera:

<math>\displaystyle
\underset{n\rightarrow \infty }{\lim }\sigma (S(x_{1}...x_{n}))=0.
</math>

==Estymator wartości oczekiwanej==

Dla rozkładów ciągłych wartość oczekiwana <math>\displaystyle
\mu=E(x)=\overset{n}{\underset{i=1}{\sum }}x_{i}P(X=x_{i})
</math>

Dla rozkładów dyskretnych wartość oczekiwana <math>\displaystyle
\mu=E(x)=\underset{-\infty }{\overset{\infty }{\int }}x p(x)dx
</math>

Estymator wartości oczekiwanej postaci
<equation id="eq:91">
<math>\displaystyle
\overline{x}=\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}x_{i}
</math>
</equation>

jest nieobciążony i zgodny.

'''Dowód:'''

<math>\displaystyle
E(\overline{x})=E\left(\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}x_{i}\right)=
\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}E(x_{i})
=\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}\mu
=\frac{1}{n}n\mu =\mu
</math>

<math>\displaystyle
\sigma ^{2}\left( \overline{x}\right) =
E \left( \left( \overline{x}-E(\overline{x})\right)^{2}\right) =
E\left(\left(\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}x_{i}-
\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}\mu \right)^{2}\right) =
</math>

<math>\displaystyle
=\frac{1}{n^{2}}E\left(\left(\underset{i=1}{\overset{n}{\sum }}(x_{i}-\mu )\right)^{2}\right)
</math>

Jeśli elementy próby są niezależne, to
<math>\displaystyle
E\left((x_{i}-\mu)(x_{j}-\mu )\right) =\delta _{ij}\sigma ^{2}(x_{i}),
</math>

gdzie <math>\delta_{ij}</math> oznacza deltę Kroneckera
(<math>\delta_{ij}=1\ \textrm{ dla }\ i=j,
\delta_{ij}=0\ \textrm{ dla }\ i\neq j</math>), czyli:

<math>\sigma ^{2}\left( \overline{x}\right)
=\frac{1}{n^{2}}E\left(\underset{i=1}{\overset{n}{\sum }}(x_{i}-\mu )^{2}\right)
=\frac{1}{n^{2}}\left(\underset{i=1}{\overset{n}{\sum }}E(x_{i}-\mu )^{2}\right)
= \frac{1}{n^{2}}\underset{i=1}{\overset{n}{
\sum }}\sigma ^{2}(x_i)
</math>

Ponadto, jeśli elementy próby pochodzą z tego samego rozkładu, to
<math>\sigma ^{2}(x_{i})=\sigma^{2}(x)</math>, czyli

<equation id="eq:91">
<math>\displaystyle
{ \sigma ^{2}(\overline{x})=\frac{1}{n^{2}}\underset{i=1}{\overset{n}{
\sum }}\sigma ^{2}(x)=\frac{1}{n}\sigma ^{2}(x)\ }.
</math>
</equation>

{| role="presentation" class="wikitable mw-collapsible mw-collapsed"
| Prawo wielkich liczb (opcjonalnie)  
|-
| Do zgodności estymatora wartości oczekiwanej odnosi się również prawo wielkich liczb. Mówi ono, że
<blockquote>
wartość średnia <math>\overline{x}=\frac{1}{n}\sum\limits_{i=1}^{n} x_i</math>, obliczona z odpowiednio dużej próby (o liczności co najmniej <math>n_0</math>), pobieranej z populacji o skończonej wariancji, może być
dowolnie bliska wartości oczekiwanej <math>\mu</math>.
</blockquote>

Co to znaczy "odpowiednio duża próba" i "dowolnie bliska"?

Jeśli chcemy, żeby wartość średnia nie odbiegała od <math>\mu</math> o więcej niż <math>\varepsilon</math> z prawdopodobieństwem ,,prawie jeden", czyli <math>1-\eta</math>, to dla wybranych (dowolnie małych, dodatnich) <math>\varepsilon </math> i <math>\eta</math> istnieje takie
<math>n_{0}</math>, że dla każdego <math>n>n_{0}</math>:

<equation id="eq:92">
<math>\displaystyle \exists {\varepsilon, \eta} \forall{n>n_0}
P\left( \left| \frac{1}{n}\sum\limits_{i=1}^{n} x_i -\mu \right| <\varepsilon
\right) > 1-\eta.
</math>
</equation>

Jest to tzw. słabe prawo wielkich liczb; mocne prawo wielkich liczb mówi, że

<math>\displaystyle
\underset{n\rightarrow \infty }{\lim} \frac{1}{n}\sum\limits_{i=1}^{n} x_i = \mu .
</math>
Dokładniejsze formulacje i dowody można znaleźć np. w książce "Wnioskowanie statystyczne" L. Gajek i M. Kałuszka, WNT 2000.
|}

==Estymator wariancji==
Spróbujmy skonstruować estymator wariancji z próby jako  
<math>\displaystyle s_o^{2}=\frac{1}{n} \underset{i=1}{\overset{n}{\sum }}(x_{i}-\overline{x})^{2}.</math>

Aby wyliczyć jego wartość oczekiwaną, wyprowadźmy jeszcze kilka prostych zależności. Na początek wykażemy, że wariancja zmiennej losowej jest równa różnicy wartości oczekiwanej kwadratu tej zmiennej i kwadratu jej wartości oczekiwanej:

<math>\displaystyle
\sigma^{2}(x_i)=E((x_i-\mu)^{2})=E(x_i^{2}-2x_i\mu+\mu ^{2})=E(x_i^{2})-2\mu E(x_i)+\mu^{2}=\\
\quad\quad= E(x_i^{2})-\mu^{2}=E(x_i^{2})-\left\{ E(x_i)\right\} ^{2}
</math>

Czyli <equation id="eq:64">
<center><math>\displaystyle
\sigma ^{2}(x_i) = E(x_i^{2})-\left\{ E(x_i)\right\} ^{2} = E(x_i^{2}) - \mu^2
</math></center>
</equation>

Wynika stąd w szczególności, że
<center><math>\displaystyle
E(x_i^{2}) = \sigma_{x_i}^2 + \mu^2
</math></center>

Analogicznie dla wariancji wartości średniej
<center><math>
E(\overline{x}^2) = \sigma_\overline{x}^2 + \mu^2
</math></center>

Ponieważ
<math>\displaystyle
{ \sigma ^{2}_\overline{x}=\frac{1}{n}\sigma^{2}_x }
</math>
dostajemy

<center><math>\displaystyle
\frac{1}{n}\sigma^{2}_\overline{x} = E(\overline{x}^2) - \mu^2
</math></center>

czyli

<center><math>\displaystyle
E(\overline{x}^2) = \frac{1}{n}\sigma^{2}_{x_i} - \mu^2
</math></center>

Policzmy teraz wartość oczekiwaną proponowanego estymatora wariancji  
<math>\displaystyle s_o^{2}=\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}(x_{i}-\overline{x})^{2}</math>

<math>\displaystyle
E\left( s_o^{2}\right) =
\frac{1}{n} E\left(\sum\limits_{i=1}^{n}(x_{i}-\overline{x})^{2}\right)
</math>

<math>\displaystyle =
\frac{1}{n} E\left(\sum\limits_{i=1}^{n}x_{i}^2 + \sum\limits_{i=1}^{n}\overline{x}^{2} - 2\sum\limits_{i=1}^{n} \overline{x} x_i \right)
</math>

<math>\displaystyle =
\frac{1}{n} \left(\sum\limits_{i=1}^{n}E(x_{i}^2) + \sum\limits_{i=1}^{n}E(\overline{x}^{2}) - 2 E \left(\overline{x} \sum\limits_{i=1}^{n} x_i \right) \right)
</math>

<math>\displaystyle =
\frac{1}{n} \left(\sum\limits_{i=1}^{n}E(x_{i}^2) + n E(\overline{x}^{2}) - 2 n E (\overline{x}^2 ) \right)
</math>

<math>\displaystyle =
\frac{1}{n} \left(n E(x_{i}^2) - n E(\overline{x}^{2}) \right)
</math>

podstawiając wyprowadzone wcześniej wzory na <math>E(x_{i}^2)</math> i <math>E(\overline{x}^{2})</math> dostajemy

<math>\displaystyle
E\left( s_o^{2}\right) = \frac{1}{n} \left( n (\sigma^2_{x_i} - \mu^2) -n ( \frac{1}{n}\sigma^2_{x_i} - \mu^2 ) \right)
=\frac{n-1}{n}\sigma^{2}_{x_i}
</math>

czyli nie jest dla każdej wielkości próby <math>n</math> wartość oczekiwana tego estymatora wyniesie <math>\sigma^2(x)</math>. Tak więc <math>s_o^2</math> jest estymatorem obciążonym.
W tej sytuacji, jako nieobciążony estymator wariancji możemy zaproponować
<equation id="eq:93">
<center><math>\displaystyle
{ s^{2}=\frac{1}{n-1}\underset{i=1}{\overset{n}{\sum }}(x_{i}-
\overline{x})^{2} }
</math></center>
</equation>

===Estymator wariancji wartości średniej===
Podstawiając tę zależność do wyprowadzonego powyżej wzoru na
wariancję wartości średniej <xr id="eq:91">(%i)</xr>
w miejsce <math>\sigma^2</math>, dostajemy wzór na estymator wariancji wartości
średniej próby

<equation id="eq:94">
<center><math>\displaystyle
s^2_{\overline{x}} = \frac{1}{n(n-1)}\sum_{i=1}^n(x_{i}-\overline{x})^{2}.
</math>
</equation></center>

Pierwiastek tej wielkości

<equation id="eq:94a">
<center><math>\displaystyle
s_{\overline{x}} = \sqrt{
\frac{1}{n(n-1)}\sum_{i=1}^n(x_{i}-\overline{x})^{2}}
</math>
</equation></center>

jest estymatorem '''odchylenia standardowego wartości średniej'''.

WnioskowanieStatystyczne/Statystyki i estymatory

2026-03-12T14:54:28Z

Durka: /* Estymator wariancji */

[[Wnioskowanie_Statystyczne_-_wykład]]

==Statystyki i estymatory==
Funkcję <math>S(x_{1},x_{2},...x_{n})</math> określoną na elementach próby <math>\{x_i\}</math>
zwiemy '''statystyką'''. Obliczane w praktyce statystyki służą
weryfikacji hipotez statystycznych (zwiemy je wtedy '''statystykami testowymi''' — tym zajmiemy się w następnym rozdziale) lub estymacji (szacowaniu) parametrów rozkładu prawdopodobieństwa w populacji
zmiennej <math>x</math>, z której pobierana jest próba. W tym drugim przypadku zwiemy je
'''estymatorami'''. Na przykład wartość średnia próby

<math>\displaystyle
\overline{x}=\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}x_{i} \qquad
</math>
może być estymatorem wartości oczekiwanej populacji <math>\mu=E(x)</math>.

Estymator zwiemy '''nieobciążonym''', jeśli dla każdej
wielkości próby <math>n</math> jego wartość oczekiwana jest równa
wartości estymowanego parametru (oznaczmy go np. <math>\beta</math>):

<math>\displaystyle
\forall n \ E(S(x_{1}...x_{n}))=\beta.
</math>

Estymator zwiemy '''zgodnym''', jeśli przy wielkości próby dążącej do
nieskończoności jego wariancja dąży do zera:

<math>\displaystyle
\underset{n\rightarrow \infty }{\lim }\sigma (S(x_{1}...x_{n}))=0.
</math>

==Estymator wartości oczekiwanej==

Dla rozkładów ciągłych wartość oczekiwana <math>\displaystyle
\mu=E(x)=\overset{n}{\underset{i=1}{\sum }}x_{i}P(X=x_{i})
</math>

Dla rozkładów dyskretnych wartość oczekiwana <math>\displaystyle
\mu=E(x)=\underset{-\infty }{\overset{\infty }{\int }}x p(x)dx
</math>

Estymator wartości oczekiwanej postaci
<equation id="eq:91">
<math>\displaystyle
\overline{x}=\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}x_{i}
</math>
</equation>

jest nieobciążony i zgodny.

'''Dowód:'''

<math>\displaystyle
E(\overline{x})=E\left(\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}x_{i}\right)=
\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}E(x_{i})
=\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}\mu
=\frac{1}{n}n\mu =\mu
</math>

<math>\displaystyle
\sigma ^{2}\left( \overline{x}\right) =
E \left( \left( \overline{x}-E(\overline{x})\right)^{2}\right) =
E\left(\left(\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}x_{i}-
\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}\mu \right)^{2}\right) =
</math>

<math>\displaystyle
=\frac{1}{n^{2}}E\left(\left(\underset{i=1}{\overset{n}{\sum }}(x_{i}-\mu )\right)^{2}\right)
</math>

Jeśli elementy próby są niezależne, to
<math>\displaystyle
E\left((x_{i}-\mu)(x_{j}-\mu )\right) =\delta _{ij}\sigma ^{2}(x_{i}),
</math>

gdzie <math>\delta_{ij}</math> oznacza deltę Kroneckera
(<math>\delta_{ij}=1\ \textrm{ dla }\ i=j,
\delta_{ij}=0\ \textrm{ dla }\ i\neq j</math>), czyli:

<math>\sigma ^{2}\left( \overline{x}\right)
=\frac{1}{n^{2}}E\left(\underset{i=1}{\overset{n}{\sum }}(x_{i}-\mu )^{2}\right)
=\frac{1}{n^{2}}\left(\underset{i=1}{\overset{n}{\sum }}E(x_{i}-\mu )^{2}\right)
= \frac{1}{n^{2}}\underset{i=1}{\overset{n}{
\sum }}\sigma ^{2}(x_i)
</math>

Ponadto, jeśli elementy próby pochodzą z tego samego rozkładu, to
<math>\sigma ^{2}(x_{i})=\sigma^{2}(x)</math>, czyli

<equation id="eq:91">
<math>\displaystyle
{ \sigma ^{2}(\overline{x})=\frac{1}{n^{2}}\underset{i=1}{\overset{n}{
\sum }}\sigma ^{2}(x)=\frac{1}{n}\sigma ^{2}(x)\ }.
</math>
</equation>

{| role="presentation" class="wikitable mw-collapsible mw-collapsed"
| Prawo wielkich liczb (opcjonalnie)  
|-
| Do zgodności estymatora wartości oczekiwanej odnosi się również prawo wielkich liczb. Mówi ono, że
<blockquote>
wartość średnia <math>\overline{x}=\frac{1}{n}\sum\limits_{i=1}^{n} x_i</math>, obliczona z odpowiednio dużej próby (o liczności co najmniej <math>n_0</math>), pobieranej z populacji o skończonej wariancji, może być
dowolnie bliska wartości oczekiwanej <math>\mu</math>.
</blockquote>

Co to znaczy "odpowiednio duża próba" i "dowolnie bliska"?

Jeśli chcemy, żeby wartość średnia nie odbiegała od <math>\mu</math> o więcej niż <math>\varepsilon</math> z prawdopodobieństwem ,,prawie jeden", czyli <math>1-\eta</math>, to dla wybranych (dowolnie małych, dodatnich) <math>\varepsilon </math> i <math>\eta</math> istnieje takie
<math>n_{0}</math>, że dla każdego <math>n>n_{0}</math>:

<equation id="eq:92">
<math>\displaystyle \exists {\varepsilon, \eta} \forall{n>n_0}
P\left( \left| \frac{1}{n}\sum\limits_{i=1}^{n} x_i -\mu \right| <\varepsilon
\right) > 1-\eta.
</math>
</equation>

Jest to tzw. słabe prawo wielkich liczb; mocne prawo wielkich liczb mówi, że

<math>\displaystyle
\underset{n\rightarrow \infty }{\lim} \frac{1}{n}\sum\limits_{i=1}^{n} x_i = \mu .
</math>
Dokładniejsze formulacje i dowody można znaleźć np. w książce "Wnioskowanie statystyczne" L. Gajek i M. Kałuszka, WNT 2000.
|}

==Estymator wariancji==
Spróbujmy skonstruować estymator wariancji z próby jako  
<math>\displaystyle s_o^{2}=\frac{1}{n} \underset{i=1}{\overset{n}{\sum }}(x_{i}-\overline{x})^{2}.</math>

Aby wyliczyć jego wartość oczekiwaną, wyprowadźmy jeszcze kilka prostych zależności. Na początek wykażemy, że wariancja zmiennej losowej jest równa różnicy wartości oczekiwanej kwadratu tej zmiennej i kwadratu jej wartości oczekiwanej:

<math>\displaystyle
\sigma^{2}(x_i)=E((x_i-\mu
)^{2})=E(x_i^{2}-2x_i\mu+\mu ^{2})=E(x_i^{2})-2\mu E(x_i)+\mu^{2}=E(x_i^{2})-\mu^{2}=E(x_i^{2})-\left\{ E(x_i)\right\} ^{2}
</math>

Czyli <equation id="eq:64">
<center><math>\displaystyle
\sigma ^{2}(x_i) = E(x_i^{2})-\left\{ E(x_i)\right\} ^{2} = E(x_i^{2}) - \mu^2
</math></center>
</equation>

Wynika stąd w szczególności, że
<center><math>\displaystyle
E(x_i^{2}) = \sigma_{x_i}^2 + \mu^2
</math></center>

Analogicznie dla wariancji wartości średniej
<center><math>
E(\overline{x}^2) = \sigma_\overline{x}^2 + \mu^2
</math></center>

Ponieważ
<math>\displaystyle
{ \sigma ^{2}_\overline{x}=\frac{1}{n}\sigma^{2}_x }
</math>
dostajemy

<center><math>\displaystyle
\frac{1}{n}\sigma^{2}_\overline{x} = E(\overline{x}^2) - \mu^2
</math></center>

czyli

<center><math>\displaystyle
E(\overline{x}^2) = \frac{1}{n}\sigma^{2}_{x_i} - \mu^2
</math></center>

Policzmy teraz wartość oczekiwaną proponowanego estymatora wariancji  
<math>\displaystyle s_o^{2}=\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}(x_{i}-\overline{x})^{2}</math>

<math>\displaystyle
E\left( s_o^{2}\right) =
\frac{1}{n} E\left(\sum\limits_{i=1}^{n}(x_{i}-\overline{x})^{2}\right)
</math>

<math>\displaystyle =
\frac{1}{n} E\left(\sum\limits_{i=1}^{n}x_{i}^2 + \sum\limits_{i=1}^{n}\overline{x}^{2} - 2\sum\limits_{i=1}^{n} \overline{x} x_i \right)
</math>

<math>\displaystyle =
\frac{1}{n} \left(\sum\limits_{i=1}^{n}E(x_{i}^2) + \sum\limits_{i=1}^{n}E(\overline{x}^{2}) - 2 E \left(\overline{x} \sum\limits_{i=1}^{n} x_i \right) \right)
</math>

<math>\displaystyle =
\frac{1}{n} \left(\sum\limits_{i=1}^{n}E(x_{i}^2) + n E(\overline{x}^{2}) - 2 n E (\overline{x}^2 ) \right)
</math>

<math>\displaystyle =
\frac{1}{n} \left(n E(x_{i}^2) - n E(\overline{x}^{2}) \right)
</math>

podstawiając wyprowadzone wcześniej wzory na <math>E(x_{i}^2)</math> i <math>E(\overline{x}^{2})</math> dostajemy

<math>\displaystyle
E\left( s_o^{2}\right) = \frac{1}{n} \left( n (\sigma^2_{x_i} - \mu^2) -n ( \frac{1}{n}\sigma^2_{x_i} - \mu^2 ) \right)
=\frac{n-1}{n}\sigma^{2}_{x_i}
</math>

czyli nie jest dla każdej wielkości próby <math>n</math> wartość oczekiwana tego estymatora wyniesie <math>\sigma^2(x)</math>. Tak więc <math>s_o^2</math> jest estymatorem obciążonym.
W tej sytuacji, jako nieobciążony estymator wariancji możemy zaproponować
<equation id="eq:93">
<center><math>\displaystyle
{ s^{2}=\frac{1}{n-1}\underset{i=1}{\overset{n}{\sum }}(x_{i}-
\overline{x})^{2} }
</math></center>
</equation>

===Estymator wariancji wartości średniej===
Podstawiając tę zależność do wyprowadzonego powyżej wzoru na
wariancję wartości średniej <xr id="eq:91">(%i)</xr>
w miejsce <math>\sigma^2</math>, dostajemy wzór na estymator wariancji wartości
średniej próby

<equation id="eq:94">
<center><math>\displaystyle
s^2_{\overline{x}} = \frac{1}{n(n-1)}\sum_{i=1}^n(x_{i}-\overline{x})^{2}.
</math>
</equation></center>

Pierwiastek tej wielkości

<equation id="eq:94a">
<center><math>\displaystyle
s_{\overline{x}} = \sqrt{
\frac{1}{n(n-1)}\sum_{i=1}^n(x_{i}-\overline{x})^{2}}
</math>
</equation></center>

jest estymatorem '''odchylenia standardowego wartości średniej'''.

WnioskowanieStatystyczne/Statystyki i estymatory

2026-03-12T14:45:43Z

Durka: /* Estymator wartości oczekiwanej */

[[Wnioskowanie_Statystyczne_-_wykład]]

==Statystyki i estymatory==
Funkcję <math>S(x_{1},x_{2},...x_{n})</math> określoną na elementach próby <math>\{x_i\}</math>
zwiemy '''statystyką'''. Obliczane w praktyce statystyki służą
weryfikacji hipotez statystycznych (zwiemy je wtedy '''statystykami testowymi''' — tym zajmiemy się w następnym rozdziale) lub estymacji (szacowaniu) parametrów rozkładu prawdopodobieństwa w populacji
zmiennej <math>x</math>, z której pobierana jest próba. W tym drugim przypadku zwiemy je
'''estymatorami'''. Na przykład wartość średnia próby

<math>\displaystyle
\overline{x}=\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}x_{i} \qquad
</math>
może być estymatorem wartości oczekiwanej populacji <math>\mu=E(x)</math>.

Estymator zwiemy '''nieobciążonym''', jeśli dla każdej
wielkości próby <math>n</math> jego wartość oczekiwana jest równa
wartości estymowanego parametru (oznaczmy go np. <math>\beta</math>):

<math>\displaystyle
\forall n \ E(S(x_{1}...x_{n}))=\beta.
</math>

Estymator zwiemy '''zgodnym''', jeśli przy wielkości próby dążącej do
nieskończoności jego wariancja dąży do zera:

<math>\displaystyle
\underset{n\rightarrow \infty }{\lim }\sigma (S(x_{1}...x_{n}))=0.
</math>

==Estymator wartości oczekiwanej==

Dla rozkładów ciągłych wartość oczekiwana <math>\displaystyle
\mu=E(x)=\overset{n}{\underset{i=1}{\sum }}x_{i}P(X=x_{i})
</math>

Dla rozkładów dyskretnych wartość oczekiwana <math>\displaystyle
\mu=E(x)=\underset{-\infty }{\overset{\infty }{\int }}x p(x)dx
</math>

Estymator wartości oczekiwanej postaci
<equation id="eq:91">
<math>\displaystyle
\overline{x}=\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}x_{i}
</math>
</equation>

jest nieobciążony i zgodny.

'''Dowód:'''

<math>\displaystyle
E(\overline{x})=E\left(\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}x_{i}\right)=
\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}E(x_{i})
=\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}\mu
=\frac{1}{n}n\mu =\mu
</math>

<math>\displaystyle
\sigma ^{2}\left( \overline{x}\right) =
E \left( \left( \overline{x}-E(\overline{x})\right)^{2}\right) =
E\left(\left(\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}x_{i}-
\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}\mu \right)^{2}\right) =
</math>

<math>\displaystyle
=\frac{1}{n^{2}}E\left(\left(\underset{i=1}{\overset{n}{\sum }}(x_{i}-\mu )\right)^{2}\right)
</math>

Jeśli elementy próby są niezależne, to
<math>\displaystyle
E\left((x_{i}-\mu)(x_{j}-\mu )\right) =\delta _{ij}\sigma ^{2}(x_{i}),
</math>

gdzie <math>\delta_{ij}</math> oznacza deltę Kroneckera
(<math>\delta_{ij}=1\ \textrm{ dla }\ i=j,
\delta_{ij}=0\ \textrm{ dla }\ i\neq j</math>), czyli:

<math>\sigma ^{2}\left( \overline{x}\right)
=\frac{1}{n^{2}}E\left(\underset{i=1}{\overset{n}{\sum }}(x_{i}-\mu )^{2}\right)
=\frac{1}{n^{2}}\left(\underset{i=1}{\overset{n}{\sum }}E(x_{i}-\mu )^{2}\right)
= \frac{1}{n^{2}}\underset{i=1}{\overset{n}{
\sum }}\sigma ^{2}(x_i)
</math>

Ponadto, jeśli elementy próby pochodzą z tego samego rozkładu, to
<math>\sigma ^{2}(x_{i})=\sigma^{2}(x)</math>, czyli

<equation id="eq:91">
<math>\displaystyle
{ \sigma ^{2}(\overline{x})=\frac{1}{n^{2}}\underset{i=1}{\overset{n}{
\sum }}\sigma ^{2}(x)=\frac{1}{n}\sigma ^{2}(x)\ }.
</math>
</equation>

{| role="presentation" class="wikitable mw-collapsible mw-collapsed"
| Prawo wielkich liczb (opcjonalnie)  
|-
| Do zgodności estymatora wartości oczekiwanej odnosi się również prawo wielkich liczb. Mówi ono, że
<blockquote>
wartość średnia <math>\overline{x}=\frac{1}{n}\sum\limits_{i=1}^{n} x_i</math>, obliczona z odpowiednio dużej próby (o liczności co najmniej <math>n_0</math>), pobieranej z populacji o skończonej wariancji, może być
dowolnie bliska wartości oczekiwanej <math>\mu</math>.
</blockquote>

Co to znaczy "odpowiednio duża próba" i "dowolnie bliska"?

Jeśli chcemy, żeby wartość średnia nie odbiegała od <math>\mu</math> o więcej niż <math>\varepsilon</math> z prawdopodobieństwem ,,prawie jeden", czyli <math>1-\eta</math>, to dla wybranych (dowolnie małych, dodatnich) <math>\varepsilon </math> i <math>\eta</math> istnieje takie
<math>n_{0}</math>, że dla każdego <math>n>n_{0}</math>:

<equation id="eq:92">
<math>\displaystyle \exists {\varepsilon, \eta} \forall{n>n_0}
P\left( \left| \frac{1}{n}\sum\limits_{i=1}^{n} x_i -\mu \right| <\varepsilon
\right) > 1-\eta.
</math>
</equation>

Jest to tzw. słabe prawo wielkich liczb; mocne prawo wielkich liczb mówi, że

<math>\displaystyle
\underset{n\rightarrow \infty }{\lim} \frac{1}{n}\sum\limits_{i=1}^{n} x_i = \mu .
</math>
Dokładniejsze formulacje i dowody można znaleźć np. w książce "Wnioskowanie statystyczne" L. Gajek i M. Kałuszka, WNT 2000.
|}

==Estymator wariancji==
Spróbujmy skonstruować estymator wariancji z próby jako <math> s_o^{2}=\frac{1}{n}
\underset{i=1}{\overset{n}{\sum }}(x_{i}-\overline{x})^{2}.</math>

Aby wyliczyć jego wartość oczekiwaną, wyprowadźmy jeszcze kilka prostych zależności. Na początek wykażemy, że wariancja zmiennej losowej jest równa różnicy wartości oczekiwanej kwadratu tej zmiennej i kwadratu jej wartości oczekiwanej:

<math>
\sigma^{2}(x_i)=E((x_i-\mu
)^{2})=E(x_i^{2}-2x_i\mu+\mu ^{2})=E(x_i^{2})-2\mu E(x_i)+\mu^{2}=E(x_i^{2})-\mu^{2}=E(x_i^{2})-\left\{ E(x_i)\right\} ^{2}
</math>

Czyli <equation id="eq:64">
<center><math>
\sigma ^{2}(x_i) = E(x_i^{2})-\left\{ E(x_i)\right\} ^{2} = E(x_i^{2}) - \mu^2
</math></center>
</equation>

Wynika stąd w szczególności, że
<center><math>
E(x_i^{2}) = \sigma_{x_i}^2 + \mu^2
</math></center>

Analogicznie dla wariancji wartości średniej
<center><math>
E(\overline{x}^2) = \sigma_\overline{x}^2 + \mu^2
</math></center>

Ponieważ
<math>
{ \sigma ^{2}_\overline{x}=\frac{1}{n}\sigma^{2}_x }
</math>
dostajemy

<center><math>
\frac{1}{n}\sigma^{2}_\overline{x} = E(\overline{x}^2) - \mu^2
</math></center>

czyli

<center><math>
E(\overline{x}^2) = \frac{1}{n}\sigma^{2}_{x_i} - \mu^2
</math></center>

Policzmy teraz wartość oczekiwaną proponowanego estymatora wariancji
<math> s_o^{2}=\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}(x_{i}-\overline{x})^{2}</math>

<math>
E\left( s_o^{2}\right) =
\frac{1}{n} E\left(\sum\limits_{i=1}^{n}(x_{i}-\overline{x})^{2}\right)
</math>

<math> =
\frac{1}{n} E\left(\sum\limits_{i=1}^{n}x_{i}^2 + \sum\limits_{i=1}^{n}\overline{x}^{2} - 2\sum\limits_{i=1}^{n} \overline{x} x_i \right)
</math>

<math> =
\frac{1}{n} \left(\sum\limits_{i=1}^{n}E(x_{i}^2) + \sum\limits_{i=1}^{n}E(\overline{x}^{2}) - 2 E \left(\overline{x} \sum\limits_{i=1}^{n} x_i \right) \right)
</math>

<math> =
\frac{1}{n} \left(\sum\limits_{i=1}^{n}E(x_{i}^2) + n E(\overline{x}^{2}) - 2 n E (\overline{x}^2 ) \right)
</math>

<math> =
\frac{1}{n} \left(n E(x_{i}^2) - n E(\overline{x}^{2}) \right)
</math>

podstawiając wyprowadzone wcześniej wzory na <math>E(x_{i}^2)</math> i <math>E(\overline{x}^{2})</math> dostajemy

<math>
E\left( s_o^{2}\right) = \frac{1}{n} \left( n (\sigma^2_{x_i} - \mu^2) -n ( \frac{1}{n}\sigma^2_{x_i} - \mu^2 ) \right)
=\frac{n-1}{n}\sigma^{2}_{x_i}
</math>

czyli nie jest dla każdej wielkości próby <math>n</math> wartość oczekiwana tego estymatora wyniesie <math>\sigma^2(x)</math>. Tak więc <math>s_o^2</math> jest estymatorem obciążonym.
W tej sytuacji, jako nieobciążony estymator wariancji możemy zaproponować
<equation id="eq:93">
<center><math>
{ s^{2}=\frac{1}{n-1}\underset{i=1}{\overset{n}{\sum }}(x_{i}-
\overline{x})^{2} }
</math></center>
</equation>

===Estymator wariancji wartości średniej===
Podstawiając tę zależność do wyprowadzonego powyżej wzoru na
wariancję wartości średniej <xr id="eq:91">(%i)</xr>
w miejsce <math>\sigma^2</math>, dostajemy wzór na estymator wariancji wartości
średniej próby

<equation id="eq:94">
<center><math>
s^2_{\overline{x}} = \frac{1}{n(n-1)}\sum_{i=1}^n(x_{i}-\overline{x})^{2}.
</math>
</equation></center>

Pierwiastek tej wielkości

<equation id="eq:94a">
<center><math>
s_{\overline{x}} = \sqrt{
\frac{1}{n(n-1)}\sum_{i=1}^n(x_{i}-\overline{x})^{2}}
</math>
</equation></center>

jest estymatorem '''odchylenia standardowego wartości średniej'''.

WnioskowanieStatystyczne/Statystyki i estymatory

2026-03-12T14:42:15Z

Durka: /* Estymator wartości oczekiwanej */

[[Wnioskowanie_Statystyczne_-_wykład]]

==Statystyki i estymatory==
Funkcję <math>S(x_{1},x_{2},...x_{n})</math> określoną na elementach próby <math>\{x_i\}</math>
zwiemy '''statystyką'''. Obliczane w praktyce statystyki służą
weryfikacji hipotez statystycznych (zwiemy je wtedy '''statystykami testowymi''' — tym zajmiemy się w następnym rozdziale) lub estymacji (szacowaniu) parametrów rozkładu prawdopodobieństwa w populacji
zmiennej <math>x</math>, z której pobierana jest próba. W tym drugim przypadku zwiemy je
'''estymatorami'''. Na przykład wartość średnia próby

<math>\displaystyle
\overline{x}=\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}x_{i} \qquad
</math>
może być estymatorem wartości oczekiwanej populacji <math>\mu=E(x)</math>.

Estymator zwiemy '''nieobciążonym''', jeśli dla każdej
wielkości próby <math>n</math> jego wartość oczekiwana jest równa
wartości estymowanego parametru (oznaczmy go np. <math>\beta</math>):

<math>\displaystyle
\forall n \ E(S(x_{1}...x_{n}))=\beta.
</math>

Estymator zwiemy '''zgodnym''', jeśli przy wielkości próby dążącej do
nieskończoności jego wariancja dąży do zera:

<math>\displaystyle
\underset{n\rightarrow \infty }{\lim }\sigma (S(x_{1}...x_{n}))=0.
</math>

==Estymator wartości oczekiwanej==

Dla rozkładów ciągłych wartość oczekiwana <math>\displaystyle
\mu=E(x)=\overset{n}{\underset{i=1}{\sum }}x_{i}P(X=x_{i})
</math>

Dla rozkładów dyskretnych wartość oczekiwana <math>\displaystyle
\mu=E(x)=\underset{-\infty }{\overset{\infty }{\int }}x p(x)dx
</math>

Estymator wartości oczekiwanej postaci
<equation id="eq:91">
<math>\displaystyle
\overline{x}=\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}x_{i}
</math>
</equation>

jest nieobciążony i zgodny.

'''Dowód:'''

<math>\displaystyle
E(\overline{x})=E\left(\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}x_{i}\right)=
\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}E(x_{i})
=\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}\mu
=\frac{1}{n}n\mu =\mu
</math>

<math>\displaystyle
\sigma ^{2}\left( \overline{x}\right) =
E \left( \left( \overline{x}-E(\overline{x})\right)^{2}\right) =
E\left(\left(\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}x_{i}-
\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}\mu \right)^{2}\right) =
</math>

<math>\displaystyle
=\frac{1}{n^{2}}E\left(\left(\underset{i=1}{\overset{n}{\sum }}(x_{i}-\mu )\right)^{2}\right)
</math>

Jeśli elementy próby są niezależne, to
<math>\displaystyle
E\left((x_{i}-\mu)(x_{j}-\mu )\right) =\delta _{ij}\sigma ^{2}(x_{i}),
</math>

gdzie <math>\delta_{ij}</math> oznacza deltę Kroneckera
(<math>\delta_{ij}=1\ \textrm{ dla }\ i=j,
\delta_{ij}=0\ \textrm{ dla }\ i\neq j</math>), czyli:

<math>\sigma ^{2}\left( \overline{x}\right)
=\frac{1}{n^{2}}E\left(\underset{i=1}{\overset{n}{\sum }}(x_{i}-\mu )^{2}\right)
=\frac{1}{n^{2}}\left(\underset{i=1}{\overset{n}{\sum }}E(x_{i}-\mu )^{2}\right)
= \frac{1}{n^{2}}\underset{i=1}{\overset{n}{
\sum }}\sigma ^{2}(x_i)
</math>

Ponadto, jeśli elementy próby pochodzą z tego samego rozkładu, to
<math>\sigma ^{2}(x_{i})=\sigma^{2}(x)</math>, czyli

<equation id="eq:91">
<math>\displaystyle
{ \sigma ^{2}(\overline{x})=\frac{1}{n^{2}}\underset{i=1}{\overset{n}{
\sum }}\sigma ^{2}(x)=\frac{1}{n}\sigma ^{2}(x)\ }.
</math>
</equation>

{| role="presentation" class="wikitable mw-collapsible mw-collapsed"
| Prawo wielkich liczb (opcjonalnie)  
|-
| Do zgodności estymatora wartości oczekiwanej odnosi się również prawo wielkich liczb. Mówi ono, że
<blockquote>
wartość średnia <math>\overline{x}=\frac{1}{n}\sum\limits_{i=1}^{n} x_i</math>, obliczona z odpowiednio dużej próby (o liczności co najmniej <math>n_0</math>), pobieranej z populacji o skończonej wariancji, może być
dowolnie bliska wartości oczekiwanej <math>\mu</math>.
</blockquote>

Co to znaczy "odpowiednio duża próba" i "dowolnie bliska"?

Jeśli chcemy, żeby wartość średnia nie odbiegała od <math>\mu</math> o więcej niż <math>\varepsilon</math> z prawdopodobieństwem ,,prawie jeden", czyli <math>1-\eta</math>, to dla wybranych (dowolnie małych, dodatnich) <math>\varepsilon </math> i <math>\eta</math> istnieje takie
<math>n_{0}</math>, że dla każdego <math>n>n_{0}</math>:

<equation id="eq:92">
<math>\displaystyle \exists {\varepsilon, \eta} \forall{n>n_0}
P\left( \left| \frac{1}{n}\sum\limits_{i=1}^{n} x_i -\mu \right| <\varepsilon
\right) > 1-\eta.
</math>
</equation>

Jest to tzw. słabe prawo wielkich liczb; mocne prawo wielkich liczb mówi, że

<math>\displaystyle
\underset{n\rightarrow \infty }{\lim} \frac{1}{n}\sum\limits_{i=1}^{n} x_i = \mu .
</math>
Dokładniejsze formulacje i dowody można znaleźć np. w [http://www.wnt.com.pl/product.php?action=0&prod_id=195&hot=1 "Wnioskowaniu statystycznym" Gajka i Kałuszki].
|}

==Estymator wariancji==
Spróbujmy skonstruować estymator wariancji z próby jako <math> s_o^{2}=\frac{1}{n}
\underset{i=1}{\overset{n}{\sum }}(x_{i}-\overline{x})^{2}.</math>

Aby wyliczyć jego wartość oczekiwaną, wyprowadźmy jeszcze kilka prostych zależności. Na początek wykażemy, że wariancja zmiennej losowej jest równa różnicy wartości oczekiwanej kwadratu tej zmiennej i kwadratu jej wartości oczekiwanej:

<math>
\sigma^{2}(x_i)=E((x_i-\mu
)^{2})=E(x_i^{2}-2x_i\mu+\mu ^{2})=E(x_i^{2})-2\mu E(x_i)+\mu^{2}=E(x_i^{2})-\mu^{2}=E(x_i^{2})-\left\{ E(x_i)\right\} ^{2}
</math>

Czyli <equation id="eq:64">
<center><math>
\sigma ^{2}(x_i) = E(x_i^{2})-\left\{ E(x_i)\right\} ^{2} = E(x_i^{2}) - \mu^2
</math></center>
</equation>

Wynika stąd w szczególności, że
<center><math>
E(x_i^{2}) = \sigma_{x_i}^2 + \mu^2
</math></center>

Analogicznie dla wariancji wartości średniej
<center><math>
E(\overline{x}^2) = \sigma_\overline{x}^2 + \mu^2
</math></center>

Ponieważ
<math>
{ \sigma ^{2}_\overline{x}=\frac{1}{n}\sigma^{2}_x }
</math>
dostajemy

<center><math>
\frac{1}{n}\sigma^{2}_\overline{x} = E(\overline{x}^2) - \mu^2
</math></center>

czyli

<center><math>
E(\overline{x}^2) = \frac{1}{n}\sigma^{2}_{x_i} - \mu^2
</math></center>

Policzmy teraz wartość oczekiwaną proponowanego estymatora wariancji
<math> s_o^{2}=\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}(x_{i}-\overline{x})^{2}</math>

<math>
E\left( s_o^{2}\right) =
\frac{1}{n} E\left(\sum\limits_{i=1}^{n}(x_{i}-\overline{x})^{2}\right)
</math>

<math> =
\frac{1}{n} E\left(\sum\limits_{i=1}^{n}x_{i}^2 + \sum\limits_{i=1}^{n}\overline{x}^{2} - 2\sum\limits_{i=1}^{n} \overline{x} x_i \right)
</math>

<math> =
\frac{1}{n} \left(\sum\limits_{i=1}^{n}E(x_{i}^2) + \sum\limits_{i=1}^{n}E(\overline{x}^{2}) - 2 E \left(\overline{x} \sum\limits_{i=1}^{n} x_i \right) \right)
</math>

<math> =
\frac{1}{n} \left(\sum\limits_{i=1}^{n}E(x_{i}^2) + n E(\overline{x}^{2}) - 2 n E (\overline{x}^2 ) \right)
</math>

<math> =
\frac{1}{n} \left(n E(x_{i}^2) - n E(\overline{x}^{2}) \right)
</math>

podstawiając wyprowadzone wcześniej wzory na <math>E(x_{i}^2)</math> i <math>E(\overline{x}^{2})</math> dostajemy

<math>
E\left( s_o^{2}\right) = \frac{1}{n} \left( n (\sigma^2_{x_i} - \mu^2) -n ( \frac{1}{n}\sigma^2_{x_i} - \mu^2 ) \right)
=\frac{n-1}{n}\sigma^{2}_{x_i}
</math>

czyli nie jest dla każdej wielkości próby <math>n</math> wartość oczekiwana tego estymatora wyniesie <math>\sigma^2(x)</math>. Tak więc <math>s_o^2</math> jest estymatorem obciążonym.
W tej sytuacji, jako nieobciążony estymator wariancji możemy zaproponować
<equation id="eq:93">
<center><math>
{ s^{2}=\frac{1}{n-1}\underset{i=1}{\overset{n}{\sum }}(x_{i}-
\overline{x})^{2} }
</math></center>
</equation>

===Estymator wariancji wartości średniej===
Podstawiając tę zależność do wyprowadzonego powyżej wzoru na
wariancję wartości średniej <xr id="eq:91">(%i)</xr>
w miejsce <math>\sigma^2</math>, dostajemy wzór na estymator wariancji wartości
średniej próby

<equation id="eq:94">
<center><math>
s^2_{\overline{x}} = \frac{1}{n(n-1)}\sum_{i=1}^n(x_{i}-\overline{x})^{2}.
</math>
</equation></center>

Pierwiastek tej wielkości

<equation id="eq:94a">
<center><math>
s_{\overline{x}} = \sqrt{
\frac{1}{n(n-1)}\sum_{i=1}^n(x_{i}-\overline{x})^{2}}
</math>
</equation></center>

jest estymatorem '''odchylenia standardowego wartości średniej'''.

WnioskowanieStatystyczne/Statystyki i estymatory

2026-03-12T14:40:50Z

Durka: /* Estymator wartości oczekiwanej */

[[Wnioskowanie_Statystyczne_-_wykład]]

==Statystyki i estymatory==
Funkcję <math>S(x_{1},x_{2},...x_{n})</math> określoną na elementach próby <math>\{x_i\}</math>
zwiemy '''statystyką'''. Obliczane w praktyce statystyki służą
weryfikacji hipotez statystycznych (zwiemy je wtedy '''statystykami testowymi''' — tym zajmiemy się w następnym rozdziale) lub estymacji (szacowaniu) parametrów rozkładu prawdopodobieństwa w populacji
zmiennej <math>x</math>, z której pobierana jest próba. W tym drugim przypadku zwiemy je
'''estymatorami'''. Na przykład wartość średnia próby

<math>\displaystyle
\overline{x}=\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}x_{i} \qquad
</math>
może być estymatorem wartości oczekiwanej populacji <math>\mu=E(x)</math>.

Estymator zwiemy '''nieobciążonym''', jeśli dla każdej
wielkości próby <math>n</math> jego wartość oczekiwana jest równa
wartości estymowanego parametru (oznaczmy go np. <math>\beta</math>):

<math>\displaystyle
\forall n \ E(S(x_{1}...x_{n}))=\beta.
</math>

Estymator zwiemy '''zgodnym''', jeśli przy wielkości próby dążącej do
nieskończoności jego wariancja dąży do zera:

<math>\displaystyle
\underset{n\rightarrow \infty }{\lim }\sigma (S(x_{1}...x_{n}))=0.
</math>

==Estymator wartości oczekiwanej==

Dla rozkładów ciągłych wartość oczekiwana <math>\displaystyle
\mu=E(x)=\overset{n}{\underset{i=1}{\sum }}x_{i}P(X=x_{i})
</math>

Dla rozkładów dyskretnych wartość oczekiwana <math>\displaystyle
\mu=E(x)=\underset{-\infty }{\overset{\infty }{\int }}x p(x)dx
</math>

Estymator wartości oczekiwanej postaci
<equation id="eq:91">
<math>\displaystyle
\overline{x}=\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}x_{i}
</math>
</equation>

jest nieobciążony i zgodny.

'''Dowód:'''

<math>\displaystyle
E(\overline{x})=E\left(\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}x_{i}\right)=
\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}E(x_{i})
=\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}\mu
=\frac{1}{n}n\mu =\mu
</math>

<math>\displaystyle
\sigma ^{2}\left( \overline{x}\right) =
E \left( \left( \overline{x}-E(\overline{x})\right)^{2}\right) =
E\left(\left(\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}x_{i}-
\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}\mu \right)^{2}\right) =
</math>

<math>\displaystyle
=\frac{1}{n^{2}}E\left(\left(\underset{i=1}{\overset{n}{\sum }}(x_{i}-\mu )\right)^{2}\right)
</math>

Jeśli elementy próby są niezależne, to
<math>\displaystyle
E\left((x_{i}-\mu)(x_{j}-\mu )\right) =\delta _{ij}\sigma ^{2}(x_{i}),
</math>

gdzie <math>\delta_{ij}</math> oznacza deltę Kroneckera
(<math>\delta_{ij}=1\ \textrm{ dla }\ i=j,
\delta_{ij}=0\ \textrm{ dla }\ i\neq j</math>), czyli:

<math>\sigma ^{2}\left( \overline{x}\right)
=\frac{1}{n^{2}}E\left(\underset{i=1}{\overset{n}{\sum }}(x_{i}-\mu )^{2}\right)
=\frac{1}{n^{2}}\left(\underset{i=1}{\overset{n}{\sum }}E(x_{i}-\mu )^{2}\right)
= \frac{1}{n^{2}}\underset{i=1}{\overset{n}{
\sum }}\sigma ^{2}(x_i)
</math>

Ponadto, jeśli elementy próby pochodzą z tego samego rozkładu, to
<math>\sigma ^{2}(x_{i})=\sigma^{2}(x)</math>, czyli

<equation id="eq:91">
<math>\displaystyle
{ \sigma ^{2}(\overline{x})=\frac{1}{n^{2}}\underset{i=1}{\overset{n}{
\sum }}\sigma ^{2}(x)=\frac{1}{n}\sigma ^{2}(x)\ }.
</math>
</equation>

{| role="presentation" class="wikitable mw-collapsible mw-collapsed"
| Prawo wielkich liczb (opcjonalnie)  
|-
| Do zgodności estymatora wartości oczekiwanej <xr id="eq:89">(%i)</xr> odnosi się również prawo wielkich liczb. Mówi ono, że
<blockquote>
wartość średnia <math>\overline{x}=\frac{1}{n}\sum\limits_{i=1}^{n} x_i</math>, obliczona z odpowiednio dużej próby (o liczności co najmniej <math>n_0</math>), pobieranej z populacji o skończonej wariancji, może być
dowolnie bliska wartości oczekiwanej <math>\mu</math>.
</blockquote>

Co to znaczy "odpowiednio duża próba" i "dowolnie bliska"?

Jeśli chcemy, żeby wartość średnia nie odbiegała od <math>\mu</math> o więcej niż <math>\varepsilon</math> z prawdopodobieństwem ,,prawie jeden", czyli <math>1-\eta</math>, to dla wybranych (dowolnie małych, dodatnich) <math>\varepsilon </math> i <math>\eta</math> istnieje takie
<math>n_{0}</math>, że dla każdego <math>n>n_{0}</math>:

<equation id="eq:92">
<math>\displaystyle \exists {\varepsilon, \eta} \forall{n>n_0}
P\left( \left| \frac{1}{n}\sum\limits_{i=1}^{n} x_i -\mu \right| <\varepsilon
\right) > 1-\eta.
</math>
</equation>

Jest to tzw. słabe prawo wielkich liczb; mocne prawo wielkich liczb mówi, że

<math>\displaystyle
\underset{n\rightarrow \infty }{\lim} \frac{1}{n}\sum\limits_{i=1}^{n} x_i = \mu .
</math>
Dokładniejsze formulacje i dowody można znaleźć np. w [http://www.wnt.com.pl/product.php?action=0&prod_id=195&hot=1 "Wnioskowaniu statystycznym" Gajka i Kałuszki].
|}

==Estymator wariancji==
Spróbujmy skonstruować estymator wariancji z próby jako <math> s_o^{2}=\frac{1}{n}
\underset{i=1}{\overset{n}{\sum }}(x_{i}-\overline{x})^{2}.</math>

Aby wyliczyć jego wartość oczekiwaną, wyprowadźmy jeszcze kilka prostych zależności. Na początek wykażemy, że wariancja zmiennej losowej jest równa różnicy wartości oczekiwanej kwadratu tej zmiennej i kwadratu jej wartości oczekiwanej:

<math>
\sigma^{2}(x_i)=E((x_i-\mu
)^{2})=E(x_i^{2}-2x_i\mu+\mu ^{2})=E(x_i^{2})-2\mu E(x_i)+\mu^{2}=E(x_i^{2})-\mu^{2}=E(x_i^{2})-\left\{ E(x_i)\right\} ^{2}
</math>

Czyli <equation id="eq:64">
<center><math>
\sigma ^{2}(x_i) = E(x_i^{2})-\left\{ E(x_i)\right\} ^{2} = E(x_i^{2}) - \mu^2
</math></center>
</equation>

Wynika stąd w szczególności, że
<center><math>
E(x_i^{2}) = \sigma_{x_i}^2 + \mu^2
</math></center>

Analogicznie dla wariancji wartości średniej
<center><math>
E(\overline{x}^2) = \sigma_\overline{x}^2 + \mu^2
</math></center>

Ponieważ
<math>
{ \sigma ^{2}_\overline{x}=\frac{1}{n}\sigma^{2}_x }
</math>
dostajemy

<center><math>
\frac{1}{n}\sigma^{2}_\overline{x} = E(\overline{x}^2) - \mu^2
</math></center>

czyli

<center><math>
E(\overline{x}^2) = \frac{1}{n}\sigma^{2}_{x_i} - \mu^2
</math></center>

Policzmy teraz wartość oczekiwaną proponowanego estymatora wariancji
<math> s_o^{2}=\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}(x_{i}-\overline{x})^{2}</math>

<math>
E\left( s_o^{2}\right) =
\frac{1}{n} E\left(\sum\limits_{i=1}^{n}(x_{i}-\overline{x})^{2}\right)
</math>

<math> =
\frac{1}{n} E\left(\sum\limits_{i=1}^{n}x_{i}^2 + \sum\limits_{i=1}^{n}\overline{x}^{2} - 2\sum\limits_{i=1}^{n} \overline{x} x_i \right)
</math>

<math> =
\frac{1}{n} \left(\sum\limits_{i=1}^{n}E(x_{i}^2) + \sum\limits_{i=1}^{n}E(\overline{x}^{2}) - 2 E \left(\overline{x} \sum\limits_{i=1}^{n} x_i \right) \right)
</math>

<math> =
\frac{1}{n} \left(\sum\limits_{i=1}^{n}E(x_{i}^2) + n E(\overline{x}^{2}) - 2 n E (\overline{x}^2 ) \right)
</math>

<math> =
\frac{1}{n} \left(n E(x_{i}^2) - n E(\overline{x}^{2}) \right)
</math>

podstawiając wyprowadzone wcześniej wzory na <math>E(x_{i}^2)</math> i <math>E(\overline{x}^{2})</math> dostajemy

<math>
E\left( s_o^{2}\right) = \frac{1}{n} \left( n (\sigma^2_{x_i} - \mu^2) -n ( \frac{1}{n}\sigma^2_{x_i} - \mu^2 ) \right)
=\frac{n-1}{n}\sigma^{2}_{x_i}
</math>

czyli nie jest dla każdej wielkości próby <math>n</math> wartość oczekiwana tego estymatora wyniesie <math>\sigma^2(x)</math>. Tak więc <math>s_o^2</math> jest estymatorem obciążonym.
W tej sytuacji, jako nieobciążony estymator wariancji możemy zaproponować
<equation id="eq:93">
<center><math>
{ s^{2}=\frac{1}{n-1}\underset{i=1}{\overset{n}{\sum }}(x_{i}-
\overline{x})^{2} }
</math></center>
</equation>

===Estymator wariancji wartości średniej===
Podstawiając tę zależność do wyprowadzonego powyżej wzoru na
wariancję wartości średniej <xr id="eq:91">(%i)</xr>
w miejsce <math>\sigma^2</math>, dostajemy wzór na estymator wariancji wartości
średniej próby

<equation id="eq:94">
<center><math>
s^2_{\overline{x}} = \frac{1}{n(n-1)}\sum_{i=1}^n(x_{i}-\overline{x})^{2}.
</math>
</equation></center>

Pierwiastek tej wielkości

<equation id="eq:94a">
<center><math>
s_{\overline{x}} = \sqrt{
\frac{1}{n(n-1)}\sum_{i=1}^n(x_{i}-\overline{x})^{2}}
</math>
</equation></center>

jest estymatorem '''odchylenia standardowego wartości średniej'''.

WnioskowanieStatystyczne/Statystyki i estymatory

2026-03-12T14:40:15Z

Durka: /* Estymator wartości oczekiwanej */

[[Wnioskowanie_Statystyczne_-_wykład]]

==Statystyki i estymatory==
Funkcję <math>S(x_{1},x_{2},...x_{n})</math> określoną na elementach próby <math>\{x_i\}</math>
zwiemy '''statystyką'''. Obliczane w praktyce statystyki służą
weryfikacji hipotez statystycznych (zwiemy je wtedy '''statystykami testowymi''' — tym zajmiemy się w następnym rozdziale) lub estymacji (szacowaniu) parametrów rozkładu prawdopodobieństwa w populacji
zmiennej <math>x</math>, z której pobierana jest próba. W tym drugim przypadku zwiemy je
'''estymatorami'''. Na przykład wartość średnia próby

<math>\displaystyle
\overline{x}=\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}x_{i} \qquad
</math>
może być estymatorem wartości oczekiwanej populacji <math>\mu=E(x)</math>.

Estymator zwiemy '''nieobciążonym''', jeśli dla każdej
wielkości próby <math>n</math> jego wartość oczekiwana jest równa
wartości estymowanego parametru (oznaczmy go np. <math>\beta</math>):

<math>\displaystyle
\forall n \ E(S(x_{1}...x_{n}))=\beta.
</math>

Estymator zwiemy '''zgodnym''', jeśli przy wielkości próby dążącej do
nieskończoności jego wariancja dąży do zera:

<math>\displaystyle
\underset{n\rightarrow \infty }{\lim }\sigma (S(x_{1}...x_{n}))=0.
</math>

==Estymator wartości oczekiwanej==

Dla rozkładów ciągłych wartość oczekiwana <math>\displaystyle
\mu=E(x)=\overset{n}{\underset{i=1}{\sum }}x_{i}P(X=x_{i})
</math>

Dla rozkładów dyskretnych wartość oczekiwana <math>\displaystyle
\mu=E(x)=\underset{-\infty }{\overset{\infty }{\int }}x p(x)dx
</math>

Estymator wartości oczekiwanej postaci
<equation id="eq:91">
<math>\displaystyle
\overline{x}=\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}x_{i}
</math>
</equation>

jest nieobciążony i zgodny.

'''Dowód:'''

<math>\displaystyle
E(\overline{x})=E\left(\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}x_{i}\right)=
\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}E(x_{i})
=\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}\mu
=\frac{1}{n}n\mu =\mu
</math>

<math>\displaystyle
\sigma ^{2}\left( \overline{x}\right) =
E \left( \left( \overline{x}-E(\overline{x})\right)^{2}\right) =
E\left(\left(\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}x_{i}-
\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}\mu \right)^{2}\right) =
</math>

<math>\displaystyle
=\frac{1}{n^{2}}E\left(\left(\underset{i=1}{\overset{n}{\sum }}(x_{i}-\mu )\right)^{2}\right)
</math>

Jeśli elementy próby są niezależne, to
<math>\displaystyle
E\left((x_{i}-\mu)(x_{j}-\mu )\right) =\delta _{ij}\sigma ^{2}(x_{i}),
</math>

gdzie <math>\delta_{ij}</math> oznacza deltę Kroneckera
(<math>\delta_{ij}=1\ \textrm{ dla }\ i=j,
\delta_{ij}=0\ \textrm{ dla }\ i\neq j</math>), czyli:

<math>\sigma ^{2}\left( \overline{x}\right)
=\frac{1}{n^{2}}E\left(\underset{i=1}{\overset{n}{\sum }}(x_{i}-\mu )^{2}\right)
=\frac{1}{n^{2}}\left(\underset{i=1}{\overset{n}{\sum }}E(x_{i}-\mu )^{2}\right)
= \frac{1}{n^{2}}\underset{i=1}{\overset{n}{
\sum }}\sigma ^{2}(x_i)
</math>

Ponadto, jeśli elementy próby pochodzą z tego samego rozkładu, to
<math>\sigma ^{2}(x_{i})=\sigma^{2}(x)</math>, czyli

<equation id="eq:91">
<math>\displaystyle
{ \sigma ^{2}(\overline{x})=\frac{1}{n^{2}}\underset{i=1}{\overset{n}{
\sum }}\sigma ^{2}(x)=\frac{1}{n}\sigma ^{2}(x)\ }.
</math>
</equation>

{| role="presentation" class="wikitable mw-collapsible mw-collapsed"
| Prawo wielkich liczb (opcjonalnie)  
|-
| Do zgodności estymatora wartości oczekiwanej <xr id="eq:89">(%i)</xr> odnosi się również prawo wielkich liczb. Mówi ono, że
<blockquote>
wartość średnia <math>\overline{x}=\frac{1}{n}\sum\limits_{i=1}^{n} x_i</math>, obliczona z odpowiednio dużej próby (o liczności co najmniej <math>n_0</math>), pobieranej z populacji o skończonej wariancji, może być
dowolnie bliska wartości oczekiwanej <math>\mu</math>.
</blockquote>

Co to znaczy "odpowiednio duża próba" i "dowolnie bliska"?

Jeśli chcemy, żeby wartość średnia nie odbiegała od <math>\mu</math> o więcej niż <math>\varepsilon</math> z prawdopodobieństwem ,,prawie jeden", czyli <math>1-\eta</math>, to dla wybranych (dowolnie małych, dodatnich) <math>\varepsilon </math> i <math>\eta</math> istnieje takie
<math>n_{0}</math>, że dla każdego <math>n>n_{0}</math>:

<equation id="eq:92">
<math>\displaystyle \exists {\varepsilon, \eta} \forall{n>n_0}
P\left( \left| \frac{1}{n}\sum\limits_{i=1}^{n} x_i -\mu \right| <\varepsilon
\right) > 1-\eta.
</math>
</equation>

Jest to tzw. słabe prawo wielkich liczb; mocne prawo wielkich liczb mówi, że

<math>\displaystyle
\underset{n\rightarrow \infty }{\lim} \frac{1}{n}\sum\limits_{i=1}^{n} x_i = \mu .
</math>
Dokładniejsze formulacje i dowody można znaleźć np. w [http://www.wnt.com.pl/product.php?action=0&prod_id=195&hot=1 "Wnioskowaniu statystycznym" Gajka i Kałuszki].
|}

==Estymator wariancji==
Spróbujmy skonstruować estymator wariancji z próby jako <math> s_o^{2}=\frac{1}{n}
\underset{i=1}{\overset{n}{\sum }}(x_{i}-\overline{x})^{2}.</math>

Aby wyliczyć jego wartość oczekiwaną, wyprowadźmy jeszcze kilka prostych zależności. Na początek wykażemy, że wariancja zmiennej losowej jest równa różnicy wartości oczekiwanej kwadratu tej zmiennej i kwadratu jej wartości oczekiwanej:

<math>
\sigma^{2}(x_i)=E((x_i-\mu
)^{2})=E(x_i^{2}-2x_i\mu+\mu ^{2})=E(x_i^{2})-2\mu E(x_i)+\mu^{2}=E(x_i^{2})-\mu^{2}=E(x_i^{2})-\left\{ E(x_i)\right\} ^{2}
</math>

Czyli <equation id="eq:64">
<center><math>
\sigma ^{2}(x_i) = E(x_i^{2})-\left\{ E(x_i)\right\} ^{2} = E(x_i^{2}) - \mu^2
</math></center>
</equation>

Wynika stąd w szczególności, że
<center><math>
E(x_i^{2}) = \sigma_{x_i}^2 + \mu^2
</math></center>

Analogicznie dla wariancji wartości średniej
<center><math>
E(\overline{x}^2) = \sigma_\overline{x}^2 + \mu^2
</math></center>

Ponieważ
<math>
{ \sigma ^{2}_\overline{x}=\frac{1}{n}\sigma^{2}_x }
</math>
dostajemy

<center><math>
\frac{1}{n}\sigma^{2}_\overline{x} = E(\overline{x}^2) - \mu^2
</math></center>

czyli

<center><math>
E(\overline{x}^2) = \frac{1}{n}\sigma^{2}_{x_i} - \mu^2
</math></center>

Policzmy teraz wartość oczekiwaną proponowanego estymatora wariancji
<math> s_o^{2}=\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}(x_{i}-\overline{x})^{2}</math>

<math>
E\left( s_o^{2}\right) =
\frac{1}{n} E\left(\sum\limits_{i=1}^{n}(x_{i}-\overline{x})^{2}\right)
</math>

<math> =
\frac{1}{n} E\left(\sum\limits_{i=1}^{n}x_{i}^2 + \sum\limits_{i=1}^{n}\overline{x}^{2} - 2\sum\limits_{i=1}^{n} \overline{x} x_i \right)
</math>

<math> =
\frac{1}{n} \left(\sum\limits_{i=1}^{n}E(x_{i}^2) + \sum\limits_{i=1}^{n}E(\overline{x}^{2}) - 2 E \left(\overline{x} \sum\limits_{i=1}^{n} x_i \right) \right)
</math>

<math> =
\frac{1}{n} \left(\sum\limits_{i=1}^{n}E(x_{i}^2) + n E(\overline{x}^{2}) - 2 n E (\overline{x}^2 ) \right)
</math>

<math> =
\frac{1}{n} \left(n E(x_{i}^2) - n E(\overline{x}^{2}) \right)
</math>

podstawiając wyprowadzone wcześniej wzory na <math>E(x_{i}^2)</math> i <math>E(\overline{x}^{2})</math> dostajemy

<math>
E\left( s_o^{2}\right) = \frac{1}{n} \left( n (\sigma^2_{x_i} - \mu^2) -n ( \frac{1}{n}\sigma^2_{x_i} - \mu^2 ) \right)
=\frac{n-1}{n}\sigma^{2}_{x_i}
</math>

czyli nie jest dla każdej wielkości próby <math>n</math> wartość oczekiwana tego estymatora wyniesie <math>\sigma^2(x)</math>. Tak więc <math>s_o^2</math> jest estymatorem obciążonym.
W tej sytuacji, jako nieobciążony estymator wariancji możemy zaproponować
<equation id="eq:93">
<center><math>
{ s^{2}=\frac{1}{n-1}\underset{i=1}{\overset{n}{\sum }}(x_{i}-
\overline{x})^{2} }
</math></center>
</equation>

===Estymator wariancji wartości średniej===
Podstawiając tę zależność do wyprowadzonego powyżej wzoru na
wariancję wartości średniej <xr id="eq:91">(%i)</xr>
w miejsce <math>\sigma^2</math>, dostajemy wzór na estymator wariancji wartości
średniej próby

<equation id="eq:94">
<center><math>
s^2_{\overline{x}} = \frac{1}{n(n-1)}\sum_{i=1}^n(x_{i}-\overline{x})^{2}.
</math>
</equation></center>

Pierwiastek tej wielkości

<equation id="eq:94a">
<center><math>
s_{\overline{x}} = \sqrt{
\frac{1}{n(n-1)}\sum_{i=1}^n(x_{i}-\overline{x})^{2}}
</math>
</equation></center>

jest estymatorem '''odchylenia standardowego wartości średniej'''.

WnioskowanieStatystyczne/Statystyki i estymatory

2026-03-12T14:36:03Z

Durka: /* Estymator wartości oczekiwanej */

[[Wnioskowanie_Statystyczne_-_wykład]]

==Statystyki i estymatory==
Funkcję <math>S(x_{1},x_{2},...x_{n})</math> określoną na elementach próby <math>\{x_i\}</math>
zwiemy '''statystyką'''. Obliczane w praktyce statystyki służą
weryfikacji hipotez statystycznych (zwiemy je wtedy '''statystykami testowymi''' — tym zajmiemy się w następnym rozdziale) lub estymacji (szacowaniu) parametrów rozkładu prawdopodobieństwa w populacji
zmiennej <math>x</math>, z której pobierana jest próba. W tym drugim przypadku zwiemy je
'''estymatorami'''. Na przykład wartość średnia próby

<math>\displaystyle
\overline{x}=\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}x_{i} \qquad
</math>
może być estymatorem wartości oczekiwanej populacji <math>\mu=E(x)</math>.

Estymator zwiemy '''nieobciążonym''', jeśli dla każdej
wielkości próby <math>n</math> jego wartość oczekiwana jest równa
wartości estymowanego parametru (oznaczmy go np. <math>\beta</math>):

<math>\displaystyle
\forall n \ E(S(x_{1}...x_{n}))=\beta.
</math>

Estymator zwiemy '''zgodnym''', jeśli przy wielkości próby dążącej do
nieskończoności jego wariancja dąży do zera:

<math>\displaystyle
\underset{n\rightarrow \infty }{\lim }\sigma (S(x_{1}...x_{n}))=0.
</math>

==Estymator wartości oczekiwanej==

Dla rozkładów ciągłych wartość oczekiwana <math>\displaystyle
\mu=E(x)=\overset{n}{\underset{i=1}{\sum }}x_{i}P(X=x_{i})
</math>

Dla rozkładów dyskretnych wartość oczekiwana <math>\displaystyle
\mu=E(x)=\underset{-\infty }{\overset{\infty }{\int }}x p(x)dx
</math>

Estymator wartości oczekiwanej postaci
<equation id="eq:91">
<math>\displaystyle
\overline{x}=\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}x_{i}
</math>
</equation>

jest nieobciążony i zgodny.

'''Dowód:'''

<math>\displaystyle
E(\overline{x})=E\left(\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}x_{i}\right)=
\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}E(x_{i})
=\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}\mu
=\frac{1}{n}n\mu =\mu
</math>

<math>\displaystyle
\sigma ^{2}\left( \overline{x}\right) =
E \left( \left( \overline{x}-E(\overline{x})\right)^{2}\right) =
E\left(\left(\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}x_{i}-
\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}\mu \right)^{2}\right) =
</math>

<math>\displaystyle
=\frac{1}{n^{2}}E\left(\left(\underset{i=1}{\overset{n}{\sum }}(x_{i}-\mu )\right)^{2}\right)
</math>

Jeśli elementy próby są niezależne, to
<math>\displaystyle
E\left((x_{i}-\mu)(x_{j}-\mu )\right) =\delta _{ij}\sigma ^{2}(x_{i}),
</math>

gdzie <math>\delta_{ij}</math> oznacza deltę Kroneckera
(<math>\delta_{ij}=1\ \textrm{ dla }\ i=j,
\delta_{ij}=0\ \textrm{ dla }\ i\neq j</math>), czyli:

<math>\sigma ^{2}\left( \overline{x}\right)
=\frac{1}{n^{2}}E\left(\underset{i=1}{\overset{n}{\sum }}(x_{i}-\mu )^{2}\right)
=\frac{1}{n^{2}}\left(\underset{i=1}{\overset{n}{\sum }}E(x_{i}-\mu )^{2}\right)
= \frac{1}{n^{2}}\underset{i=1}{\overset{n}{
\sum }}\sigma ^{2}(x_i)
</math>

Ponadto, jeśli elementy próby pochodzą z tego samego rozkładu, to
<math>\sigma ^{2}(x_{i})=\sigma^{2}(x)</math>, czyli

<equation id="eq:91">
<math>\displaystyle
{ \sigma ^{2}(\overline{x})=\frac{1}{n^{2}}\underset{i=1}{\overset{n}{
\sum }}\sigma ^{2}(x)=\frac{1}{n}\sigma ^{2}(x)\ }.
</math>
</equation>

{| role="presentation" class="wikitable mw-collapsible mw-collapsed"
| Prawo wielkich liczb (opcjonalnie)
|-
| Do zgodności estymatora wartości oczekiwanej <xr id="eq:89">(%i)</xr> odnosi się również prawo wielkich liczb. Mówi ono, że
<blockquote>
wartość średnia <math>\overline{x}=\frac{1}{n}\sum\limits_{i=1}^{n} x_i</math>, obliczona z odpowiednio dużej próby (o liczności co najmniej <math>n_0</math>), pobieranej z populacji o skończonej wariancji, może być
dowolnie bliska wartości oczekiwanej <math>\mu</math>.
</blockquote>

Co to znaczy "odpowiednio duża próba" i "dowolnie bliska"?

Jeśli chcemy, żeby wartość średnia nie odbiegała od <math>\mu</math> o więcej niż <math>\varepsilon</math> z prawdopodobieństwem ,,prawie jeden", czyli <math>1-\eta</math>, to dla wybranych (dowolnie małych, dodatnich) <math>\varepsilon </math> i <math>\eta</math> istnieje takie
<math>n_{0}</math>, że dla każdego <math>n>n_{0}</math>:

<equation id="eq:92">
<math>\displaystyle \exists {\varepsilon, \eta} \forall{n>n_0}
P\left( \left| \frac{1}{n}\sum\limits_{i=1}^{n} x_i -\mu \right| <\varepsilon
\right) > 1-\eta.
</math>
</equation>

Jest to tzw. słabe prawo wielkich liczb; mocne prawo wielkich liczb mówi, że

<math>\displaystyle
\underset{n\rightarrow \infty }{\lim} \frac{1}{n}\sum\limits_{i=1}^{n} x_i = \mu .
</math>
Dokładniejsze formulacje i dowody można znaleźć np. w [http://www.wnt.com.pl/product.php?action=0&prod_id=195&hot=1 "Wnioskowaniu statystycznym" Gajka i Kałuszki].
|}



==Estymator wariancji==
Spróbujmy skonstruować estymator wariancji z próby jako <math> s_o^{2}=\frac{1}{n}
\underset{i=1}{\overset{n}{\sum }}(x_{i}-\overline{x})^{2}.</math>

Aby wyliczyć jego wartość oczekiwaną, wyprowadźmy jeszcze kilka prostych zależności. Na początek wykażemy, że wariancja zmiennej losowej jest równa różnicy wartości oczekiwanej kwadratu tej zmiennej i kwadratu jej wartości oczekiwanej:

<math>
\sigma^{2}(x_i)=E((x_i-\mu
)^{2})=E(x_i^{2}-2x_i\mu+\mu ^{2})=E(x_i^{2})-2\mu E(x_i)+\mu^{2}=E(x_i^{2})-\mu^{2}=E(x_i^{2})-\left\{ E(x_i)\right\} ^{2}
</math>

Czyli <equation id="eq:64">
<center><math>
\sigma ^{2}(x_i) = E(x_i^{2})-\left\{ E(x_i)\right\} ^{2} = E(x_i^{2}) - \mu^2
</math></center>
</equation>

Wynika stąd w szczególności, że
<center><math>
E(x_i^{2}) = \sigma_{x_i}^2 + \mu^2
</math></center>

Analogicznie dla wariancji wartości średniej
<center><math>
E(\overline{x}^2) = \sigma_\overline{x}^2 + \mu^2
</math></center>

Ponieważ
<math>
{ \sigma ^{2}_\overline{x}=\frac{1}{n}\sigma^{2}_x }
</math>
dostajemy

<center><math>
\frac{1}{n}\sigma^{2}_\overline{x} = E(\overline{x}^2) - \mu^2
</math></center>

czyli

<center><math>
E(\overline{x}^2) = \frac{1}{n}\sigma^{2}_{x_i} - \mu^2
</math></center>

Policzmy teraz wartość oczekiwaną proponowanego estymatora wariancji
<math> s_o^{2}=\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}(x_{i}-\overline{x})^{2}</math>

<math>
E\left( s_o^{2}\right) =
\frac{1}{n} E\left(\sum\limits_{i=1}^{n}(x_{i}-\overline{x})^{2}\right)
</math>

<math> =
\frac{1}{n} E\left(\sum\limits_{i=1}^{n}x_{i}^2 + \sum\limits_{i=1}^{n}\overline{x}^{2} - 2\sum\limits_{i=1}^{n} \overline{x} x_i \right)
</math>

<math> =
\frac{1}{n} \left(\sum\limits_{i=1}^{n}E(x_{i}^2) + \sum\limits_{i=1}^{n}E(\overline{x}^{2}) - 2 E \left(\overline{x} \sum\limits_{i=1}^{n} x_i \right) \right)
</math>

<math> =
\frac{1}{n} \left(\sum\limits_{i=1}^{n}E(x_{i}^2) + n E(\overline{x}^{2}) - 2 n E (\overline{x}^2 ) \right)
</math>

<math> =
\frac{1}{n} \left(n E(x_{i}^2) - n E(\overline{x}^{2}) \right)
</math>

podstawiając wyprowadzone wcześniej wzory na <math>E(x_{i}^2)</math> i <math>E(\overline{x}^{2})</math> dostajemy

<math>
E\left( s_o^{2}\right) = \frac{1}{n} \left( n (\sigma^2_{x_i} - \mu^2) -n ( \frac{1}{n}\sigma^2_{x_i} - \mu^2 ) \right)
=\frac{n-1}{n}\sigma^{2}_{x_i}
</math>

czyli nie jest dla każdej wielkości próby <math>n</math> wartość oczekiwana tego estymatora wyniesie <math>\sigma^2(x)</math>. Tak więc <math>s_o^2</math> jest estymatorem obciążonym.
W tej sytuacji, jako nieobciążony estymator wariancji możemy zaproponować
<equation id="eq:93">
<center><math>
{ s^{2}=\frac{1}{n-1}\underset{i=1}{\overset{n}{\sum }}(x_{i}-
\overline{x})^{2} }
</math></center>
</equation>

===Estymator wariancji wartości średniej===
Podstawiając tę zależność do wyprowadzonego powyżej wzoru na
wariancję wartości średniej <xr id="eq:91">(%i)</xr>
w miejsce <math>\sigma^2</math>, dostajemy wzór na estymator wariancji wartości
średniej próby

<equation id="eq:94">
<center><math>
s^2_{\overline{x}} = \frac{1}{n(n-1)}\sum_{i=1}^n(x_{i}-\overline{x})^{2}.
</math>
</equation></center>

Pierwiastek tej wielkości

<equation id="eq:94a">
<center><math>
s_{\overline{x}} = \sqrt{
\frac{1}{n(n-1)}\sum_{i=1}^n(x_{i}-\overline{x})^{2}}
</math>
</equation></center>

jest estymatorem '''odchylenia standardowego wartości średniej'''.

WnioskowanieStatystyczne/Statystyki i estymatory

2026-03-12T14:11:01Z

Durka: /* Statystyki i estymatory */

[[Wnioskowanie_Statystyczne_-_wykład]]

==Statystyki i estymatory==
Funkcję <math>S(x_{1},x_{2},...x_{n})</math> określoną na elementach próby <math>\{x_i\}</math>
zwiemy '''statystyką'''. Obliczane w praktyce statystyki służą
weryfikacji hipotez statystycznych (zwiemy je wtedy '''statystykami testowymi''' — tym zajmiemy się w następnym rozdziale) lub estymacji (szacowaniu) parametrów rozkładu prawdopodobieństwa w populacji
zmiennej <math>x</math>, z której pobierana jest próba. W tym drugim przypadku zwiemy je
'''estymatorami'''. Na przykład wartość średnia próby

<math>\displaystyle
\overline{x}=\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}x_{i} \qquad
</math>
może być estymatorem wartości oczekiwanej populacji <math>\mu=E(x)</math>.

Estymator zwiemy '''nieobciążonym''', jeśli dla każdej
wielkości próby <math>n</math> jego wartość oczekiwana jest równa
wartości estymowanego parametru (oznaczmy go np. <math>\beta</math>):

<math>\displaystyle
\forall n \ E(S(x_{1}...x_{n}))=\beta.
</math>

Estymator zwiemy '''zgodnym''', jeśli przy wielkości próby dążącej do
nieskończoności jego wariancja dąży do zera:

<math>\displaystyle
\underset{n\rightarrow \infty }{\lim }\sigma (S(x_{1}...x_{n}))=0.
</math>

==Estymator wartości oczekiwanej==
<math>
\mu=E(x)=\overset{n}{\underset{i=1}{\sum }}x_{i}P(X=x_{i})
</math>

<math>
\mu=E(x)=\underset{-\infty }{\overset{\infty }{\int }}x p(x)dx.
</math>

Estymator wartości oczekiwanej postaci

<math>
\overline{x}=\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}x_{i}
</math>

jest nieobciążony i zgodny.

'''Dowód:'''

<math>
E(\overline{x})=E\left(\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}x_{i}\right)=
\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}E(x_{i})
=\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}\mu
=\frac{1}{n}n\mu =\mu
</math>

<math>
\sigma ^{2}\left( \overline{x}\right) =
E \left( \left( \overline{x}-E(\overline{x})\right)^{2}\right) =
E\left(\left(\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}x_{i}-
\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}\mu \right)^{2}\right) =
</math>

<math>
=\frac{1}{n^{2}}E\left(\left(\underset{i=1}{\overset{n}{\sum }}(x_{i}-\mu )\right)^{2}\right)
</math>

Jeśli elementy próby są niezależne, to

<equation id="eq:90">
<math>
E\left((x_{i}-\mu)(x_{j}-\mu )\right) =\delta _{ij}\sigma ^{2}(x_{i}),
</math>
</equation>

gdzie <math>\delta_{ij}</math> oznacza deltę Kroneckera
(<math>\delta_{ij}=1\ \textrm{ dla }\ i=j,
\delta_{ij}=0\ \textrm{ dla }\ i\neq j</math>), czyli:

<math>\sigma ^{2}\left( \overline{x}\right)
=\frac{1}{n^{2}}E\left(\underset{i=1}{\overset{n}{\sum }}(x_{i}-\mu )^{2}\right)
=\frac{1}{n^{2}}\left(\underset{i=1}{\overset{n}{\sum }}E(x_{i}-\mu )^{2}\right)
= \frac{1}{n^{2}}\underset{i=1}{\overset{n}{
\sum }}\sigma ^{2}(x_i)
</math>

Ponadto, jeśli elementy próby pochodzą z tego samego rozkładu, to
<math>\sigma ^{2}(x_{i})=\sigma^{2}(x)</math>, czyli

<equation id="eq:91">
<math>
{ \sigma ^{2}(\overline{x})=\frac{1}{n^{2}}\underset{i=1}{\overset{n}{
\sum }}\sigma ^{2}(x)=\frac{1}{n}\sigma ^{2}(x)\ }.
</math>
</equation>



==Estymator wariancji==
Spróbujmy skonstruować estymator wariancji z próby jako <math> s_o^{2}=\frac{1}{n}
\underset{i=1}{\overset{n}{\sum }}(x_{i}-\overline{x})^{2}.</math>

Aby wyliczyć jego wartość oczekiwaną, wyprowadźmy jeszcze kilka prostych zależności. Na początek wykażemy, że wariancja zmiennej losowej jest równa różnicy wartości oczekiwanej kwadratu tej zmiennej i kwadratu jej wartości oczekiwanej:

<math>
\sigma^{2}(x_i)=E((x_i-\mu
)^{2})=E(x_i^{2}-2x_i\mu+\mu ^{2})=E(x_i^{2})-2\mu E(x_i)+\mu^{2}=E(x_i^{2})-\mu^{2}=E(x_i^{2})-\left\{ E(x_i)\right\} ^{2}
</math>

Czyli <equation id="eq:64">
<center><math>
\sigma ^{2}(x_i) = E(x_i^{2})-\left\{ E(x_i)\right\} ^{2} = E(x_i^{2}) - \mu^2
</math></center>
</equation>

Wynika stąd w szczególności, że
<center><math>
E(x_i^{2}) = \sigma_{x_i}^2 + \mu^2
</math></center>

Analogicznie dla wariancji wartości średniej
<center><math>
E(\overline{x}^2) = \sigma_\overline{x}^2 + \mu^2
</math></center>

Ponieważ
<math>
{ \sigma ^{2}_\overline{x}=\frac{1}{n}\sigma^{2}_x }
</math>
dostajemy

<center><math>
\frac{1}{n}\sigma^{2}_\overline{x} = E(\overline{x}^2) - \mu^2
</math></center>

czyli

<center><math>
E(\overline{x}^2) = \frac{1}{n}\sigma^{2}_{x_i} - \mu^2
</math></center>

Policzmy teraz wartość oczekiwaną proponowanego estymatora wariancji
<math> s_o^{2}=\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}(x_{i}-\overline{x})^{2}</math>

<math>
E\left( s_o^{2}\right) =
\frac{1}{n} E\left(\sum\limits_{i=1}^{n}(x_{i}-\overline{x})^{2}\right)
</math>

<math> =
\frac{1}{n} E\left(\sum\limits_{i=1}^{n}x_{i}^2 + \sum\limits_{i=1}^{n}\overline{x}^{2} - 2\sum\limits_{i=1}^{n} \overline{x} x_i \right)
</math>

<math> =
\frac{1}{n} \left(\sum\limits_{i=1}^{n}E(x_{i}^2) + \sum\limits_{i=1}^{n}E(\overline{x}^{2}) - 2 E \left(\overline{x} \sum\limits_{i=1}^{n} x_i \right) \right)
</math>

<math> =
\frac{1}{n} \left(\sum\limits_{i=1}^{n}E(x_{i}^2) + n E(\overline{x}^{2}) - 2 n E (\overline{x}^2 ) \right)
</math>

<math> =
\frac{1}{n} \left(n E(x_{i}^2) - n E(\overline{x}^{2}) \right)
</math>

podstawiając wyprowadzone wcześniej wzory na <math>E(x_{i}^2)</math> i <math>E(\overline{x}^{2})</math> dostajemy

<math>
E\left( s_o^{2}\right) = \frac{1}{n} \left( n (\sigma^2_{x_i} - \mu^2) -n ( \frac{1}{n}\sigma^2_{x_i} - \mu^2 ) \right)
=\frac{n-1}{n}\sigma^{2}_{x_i}
</math>

czyli nie jest dla każdej wielkości próby <math>n</math> wartość oczekiwana tego estymatora wyniesie <math>\sigma^2(x)</math>. Tak więc <math>s_o^2</math> jest estymatorem obciążonym.
W tej sytuacji, jako nieobciążony estymator wariancji możemy zaproponować
<equation id="eq:93">
<center><math>
{ s^{2}=\frac{1}{n-1}\underset{i=1}{\overset{n}{\sum }}(x_{i}-
\overline{x})^{2} }
</math></center>
</equation>

===Estymator wariancji wartości średniej===
Podstawiając tę zależność do wyprowadzonego powyżej wzoru na
wariancję wartości średniej <xr id="eq:91">(%i)</xr>
w miejsce <math>\sigma^2</math>, dostajemy wzór na estymator wariancji wartości
średniej próby

<equation id="eq:94">
<center><math>
s^2_{\overline{x}} = \frac{1}{n(n-1)}\sum_{i=1}^n(x_{i}-\overline{x})^{2}.
</math>
</equation></center>

Pierwiastek tej wielkości

<equation id="eq:94a">
<center><math>
s_{\overline{x}} = \sqrt{
\frac{1}{n(n-1)}\sum_{i=1}^n(x_{i}-\overline{x})^{2}}
</math>
</equation></center>

jest estymatorem '''odchylenia standardowego wartości średniej'''.

WnioskowanieStatystyczne/Statystyki i estymatory

2026-03-12T14:09:33Z

Durka: /* Statystyki i estymatory */

[[Wnioskowanie_Statystyczne_-_wykład]]

==Statystyki i estymatory==
Funkcję <math>S(x_{1},x_{2},...x_{n})</math> określoną na elementach próby <math>\{x_i\}</math>
zwiemy '''statystyką'''. Obliczane w praktyce statystyki służą
weryfikacji hipotez statystycznych (zwiemy je wtedy '''statystykami testowymi''' — tym zajmiemy się w następnym rozdziale) lub estymacji (szacowaniu) parametrów rozkładu prawdopodobieństwa w populacji
zmiennej <math>x</math>, z której pobierana jest próba. W tym drugim przypadku zwiemy je
'''estymatorami'''. Na przykład wartość średnia próby

<equation id="eq:89">
<math>\displaystyle
\overline{x}=\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}x_{i}
</math>
</equation>

może być estymatorem wartości oczekiwanej populacji <math>\mu=E(x)</math>.

Estymator zwiemy '''nieobciążonym''', jeśli dla każdej
wielkości próby <math>n</math> jego wartość oczekiwana jest równa
wartości estymowanego parametru (oznaczmy go np. <math>\beta</math>):

<math>\displaystyle
\forall n \ E(S(x_{1}...x_{n}))=\beta.
</math>

Estymator zwiemy '''zgodnym''', jeśli przy wielkości próby dążącej do
nieskończoności jego wariancja dąży do zera:

<math>\displaystyle
\underset{n\rightarrow \infty }{\lim }\sigma (S(x_{1}...x_{n}))=0.
</math>

==Estymator wartości oczekiwanej==
<math>
\mu=E(x)=\overset{n}{\underset{i=1}{\sum }}x_{i}P(X=x_{i})
</math>

<math>
\mu=E(x)=\underset{-\infty }{\overset{\infty }{\int }}x p(x)dx.
</math>

Estymator wartości oczekiwanej postaci

<math>
\overline{x}=\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}x_{i}
</math>

jest nieobciążony i zgodny.

'''Dowód:'''

<math>
E(\overline{x})=E\left(\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}x_{i}\right)=
\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}E(x_{i})
=\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}\mu
=\frac{1}{n}n\mu =\mu
</math>

<math>
\sigma ^{2}\left( \overline{x}\right) =
E \left( \left( \overline{x}-E(\overline{x})\right)^{2}\right) =
E\left(\left(\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}x_{i}-
\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}\mu \right)^{2}\right) =
</math>

<math>
=\frac{1}{n^{2}}E\left(\left(\underset{i=1}{\overset{n}{\sum }}(x_{i}-\mu )\right)^{2}\right)
</math>

Jeśli elementy próby są niezależne, to

<equation id="eq:90">
<math>
E\left((x_{i}-\mu)(x_{j}-\mu )\right) =\delta _{ij}\sigma ^{2}(x_{i}),
</math>
</equation>

gdzie <math>\delta_{ij}</math> oznacza deltę Kroneckera
(<math>\delta_{ij}=1\ \textrm{ dla }\ i=j,
\delta_{ij}=0\ \textrm{ dla }\ i\neq j</math>), czyli:

<math>\sigma ^{2}\left( \overline{x}\right)
=\frac{1}{n^{2}}E\left(\underset{i=1}{\overset{n}{\sum }}(x_{i}-\mu )^{2}\right)
=\frac{1}{n^{2}}\left(\underset{i=1}{\overset{n}{\sum }}E(x_{i}-\mu )^{2}\right)
= \frac{1}{n^{2}}\underset{i=1}{\overset{n}{
\sum }}\sigma ^{2}(x_i)
</math>

Ponadto, jeśli elementy próby pochodzą z tego samego rozkładu, to
<math>\sigma ^{2}(x_{i})=\sigma^{2}(x)</math>, czyli

<equation id="eq:91">
<math>
{ \sigma ^{2}(\overline{x})=\frac{1}{n^{2}}\underset{i=1}{\overset{n}{
\sum }}\sigma ^{2}(x)=\frac{1}{n}\sigma ^{2}(x)\ }.
</math>
</equation>



==Estymator wariancji==
Spróbujmy skonstruować estymator wariancji z próby jako <math> s_o^{2}=\frac{1}{n}
\underset{i=1}{\overset{n}{\sum }}(x_{i}-\overline{x})^{2}.</math>

Aby wyliczyć jego wartość oczekiwaną, wyprowadźmy jeszcze kilka prostych zależności. Na początek wykażemy, że wariancja zmiennej losowej jest równa różnicy wartości oczekiwanej kwadratu tej zmiennej i kwadratu jej wartości oczekiwanej:

<math>
\sigma^{2}(x_i)=E((x_i-\mu
)^{2})=E(x_i^{2}-2x_i\mu+\mu ^{2})=E(x_i^{2})-2\mu E(x_i)+\mu^{2}=E(x_i^{2})-\mu^{2}=E(x_i^{2})-\left\{ E(x_i)\right\} ^{2}
</math>

Czyli <equation id="eq:64">
<center><math>
\sigma ^{2}(x_i) = E(x_i^{2})-\left\{ E(x_i)\right\} ^{2} = E(x_i^{2}) - \mu^2
</math></center>
</equation>

Wynika stąd w szczególności, że
<center><math>
E(x_i^{2}) = \sigma_{x_i}^2 + \mu^2
</math></center>

Analogicznie dla wariancji wartości średniej
<center><math>
E(\overline{x}^2) = \sigma_\overline{x}^2 + \mu^2
</math></center>

Ponieważ
<math>
{ \sigma ^{2}_\overline{x}=\frac{1}{n}\sigma^{2}_x }
</math>
dostajemy

<center><math>
\frac{1}{n}\sigma^{2}_\overline{x} = E(\overline{x}^2) - \mu^2
</math></center>

czyli

<center><math>
E(\overline{x}^2) = \frac{1}{n}\sigma^{2}_{x_i} - \mu^2
</math></center>

Policzmy teraz wartość oczekiwaną proponowanego estymatora wariancji
<math> s_o^{2}=\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}(x_{i}-\overline{x})^{2}</math>

<math>
E\left( s_o^{2}\right) =
\frac{1}{n} E\left(\sum\limits_{i=1}^{n}(x_{i}-\overline{x})^{2}\right)
</math>

<math> =
\frac{1}{n} E\left(\sum\limits_{i=1}^{n}x_{i}^2 + \sum\limits_{i=1}^{n}\overline{x}^{2} - 2\sum\limits_{i=1}^{n} \overline{x} x_i \right)
</math>

<math> =
\frac{1}{n} \left(\sum\limits_{i=1}^{n}E(x_{i}^2) + \sum\limits_{i=1}^{n}E(\overline{x}^{2}) - 2 E \left(\overline{x} \sum\limits_{i=1}^{n} x_i \right) \right)
</math>

<math> =
\frac{1}{n} \left(\sum\limits_{i=1}^{n}E(x_{i}^2) + n E(\overline{x}^{2}) - 2 n E (\overline{x}^2 ) \right)
</math>

<math> =
\frac{1}{n} \left(n E(x_{i}^2) - n E(\overline{x}^{2}) \right)
</math>

podstawiając wyprowadzone wcześniej wzory na <math>E(x_{i}^2)</math> i <math>E(\overline{x}^{2})</math> dostajemy

<math>
E\left( s_o^{2}\right) = \frac{1}{n} \left( n (\sigma^2_{x_i} - \mu^2) -n ( \frac{1}{n}\sigma^2_{x_i} - \mu^2 ) \right)
=\frac{n-1}{n}\sigma^{2}_{x_i}
</math>

czyli nie jest dla każdej wielkości próby <math>n</math> wartość oczekiwana tego estymatora wyniesie <math>\sigma^2(x)</math>. Tak więc <math>s_o^2</math> jest estymatorem obciążonym.
W tej sytuacji, jako nieobciążony estymator wariancji możemy zaproponować
<equation id="eq:93">
<center><math>
{ s^{2}=\frac{1}{n-1}\underset{i=1}{\overset{n}{\sum }}(x_{i}-
\overline{x})^{2} }
</math></center>
</equation>

===Estymator wariancji wartości średniej===
Podstawiając tę zależność do wyprowadzonego powyżej wzoru na
wariancję wartości średniej <xr id="eq:91">(%i)</xr>
w miejsce <math>\sigma^2</math>, dostajemy wzór na estymator wariancji wartości
średniej próby

<equation id="eq:94">
<center><math>
s^2_{\overline{x}} = \frac{1}{n(n-1)}\sum_{i=1}^n(x_{i}-\overline{x})^{2}.
</math>
</equation></center>

Pierwiastek tej wielkości

<equation id="eq:94a">
<center><math>
s_{\overline{x}} = \sqrt{
\frac{1}{n(n-1)}\sum_{i=1}^n(x_{i}-\overline{x})^{2}}
</math>
</equation></center>

jest estymatorem '''odchylenia standardowego wartości średniej'''.

WnioskowanieStatystyczne/Statystyki i estymatory

2026-03-12T14:09:05Z

Durka: /* Statystyki i estymatory */

[[Wnioskowanie_Statystyczne_-_wykład]]

==Statystyki i estymatory==
Funkcję <math>S(x_{1},x_{2},...x_{n})</math> określoną na elementach próby <math>\{x_i\}</math>
zwiemy '''statystyką'''. Obliczane w praktyce statystyki służą
weryfikacji hipotez statystycznych (zwiemy je wtedy '''statystykami testowymi''' — tym zajmiemy się w następnym rozdziale) lub estymacji (szacowaniu) parametrów rozkładu prawdopodobieństwa w populacji
zmiennej <math>x</math>, z której pobierana jest próba. W tym drugim przypadku zwiemy je
'''estymatorami'''. Na przykład wartość średnia próby
<equation id="eq:89">
<math>\displaystyle
\overline{x}=\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}x_{i}
</math>
</equation>
może być estymatorem wartości oczekiwanej populacji <math>\mu=E(x)</math>.

Estymator zwiemy '''nieobciążonym''', jeśli dla każdej
wielkości próby <math>n</math> jego wartość oczekiwana jest równa
wartości estymowanego parametru (oznaczmy go np. <math>\beta</math>):

<math>\displaystyle
\forall n \ E(S(x_{1}...x_{n}))=\beta.
</math>

Estymator zwiemy '''zgodnym''', jeśli przy wielkości próby dążącej do
nieskończoności jego wariancja dąży do zera:

<math>\displaystyle
\underset{n\rightarrow \infty }{\lim }\sigma (S(x_{1}...x_{n}))=0.
</math>

==Estymator wartości oczekiwanej==
<math>
\mu=E(x)=\overset{n}{\underset{i=1}{\sum }}x_{i}P(X=x_{i})
</math>

<math>
\mu=E(x)=\underset{-\infty }{\overset{\infty }{\int }}x p(x)dx.
</math>

Estymator wartości oczekiwanej postaci

<math>
\overline{x}=\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}x_{i}
</math>

jest nieobciążony i zgodny.

'''Dowód:'''

<math>
E(\overline{x})=E\left(\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}x_{i}\right)=
\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}E(x_{i})
=\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}\mu
=\frac{1}{n}n\mu =\mu
</math>

<math>
\sigma ^{2}\left( \overline{x}\right) =
E \left( \left( \overline{x}-E(\overline{x})\right)^{2}\right) =
E\left(\left(\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}x_{i}-
\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}\mu \right)^{2}\right) =
</math>

<math>
=\frac{1}{n^{2}}E\left(\left(\underset{i=1}{\overset{n}{\sum }}(x_{i}-\mu )\right)^{2}\right)
</math>

Jeśli elementy próby są niezależne, to

<equation id="eq:90">
<math>
E\left((x_{i}-\mu)(x_{j}-\mu )\right) =\delta _{ij}\sigma ^{2}(x_{i}),
</math>
</equation>

gdzie <math>\delta_{ij}</math> oznacza deltę Kroneckera
(<math>\delta_{ij}=1\ \textrm{ dla }\ i=j,
\delta_{ij}=0\ \textrm{ dla }\ i\neq j</math>), czyli:

<math>\sigma ^{2}\left( \overline{x}\right)
=\frac{1}{n^{2}}E\left(\underset{i=1}{\overset{n}{\sum }}(x_{i}-\mu )^{2}\right)
=\frac{1}{n^{2}}\left(\underset{i=1}{\overset{n}{\sum }}E(x_{i}-\mu )^{2}\right)
= \frac{1}{n^{2}}\underset{i=1}{\overset{n}{
\sum }}\sigma ^{2}(x_i)
</math>

Ponadto, jeśli elementy próby pochodzą z tego samego rozkładu, to
<math>\sigma ^{2}(x_{i})=\sigma^{2}(x)</math>, czyli

<equation id="eq:91">
<math>
{ \sigma ^{2}(\overline{x})=\frac{1}{n^{2}}\underset{i=1}{\overset{n}{
\sum }}\sigma ^{2}(x)=\frac{1}{n}\sigma ^{2}(x)\ }.
</math>
</equation>



==Estymator wariancji==
Spróbujmy skonstruować estymator wariancji z próby jako <math> s_o^{2}=\frac{1}{n}
\underset{i=1}{\overset{n}{\sum }}(x_{i}-\overline{x})^{2}.</math>

Aby wyliczyć jego wartość oczekiwaną, wyprowadźmy jeszcze kilka prostych zależności. Na początek wykażemy, że wariancja zmiennej losowej jest równa różnicy wartości oczekiwanej kwadratu tej zmiennej i kwadratu jej wartości oczekiwanej:

<math>
\sigma^{2}(x_i)=E((x_i-\mu
)^{2})=E(x_i^{2}-2x_i\mu+\mu ^{2})=E(x_i^{2})-2\mu E(x_i)+\mu^{2}=E(x_i^{2})-\mu^{2}=E(x_i^{2})-\left\{ E(x_i)\right\} ^{2}
</math>

Czyli <equation id="eq:64">
<center><math>
\sigma ^{2}(x_i) = E(x_i^{2})-\left\{ E(x_i)\right\} ^{2} = E(x_i^{2}) - \mu^2
</math></center>
</equation>

Wynika stąd w szczególności, że
<center><math>
E(x_i^{2}) = \sigma_{x_i}^2 + \mu^2
</math></center>

Analogicznie dla wariancji wartości średniej
<center><math>
E(\overline{x}^2) = \sigma_\overline{x}^2 + \mu^2
</math></center>

Ponieważ
<math>
{ \sigma ^{2}_\overline{x}=\frac{1}{n}\sigma^{2}_x }
</math>
dostajemy

<center><math>
\frac{1}{n}\sigma^{2}_\overline{x} = E(\overline{x}^2) - \mu^2
</math></center>

czyli

<center><math>
E(\overline{x}^2) = \frac{1}{n}\sigma^{2}_{x_i} - \mu^2
</math></center>

Policzmy teraz wartość oczekiwaną proponowanego estymatora wariancji
<math> s_o^{2}=\frac{1}{n}\underset{i=1}{\overset{n}{\sum }}(x_{i}-\overline{x})^{2}</math>

<math>
E\left( s_o^{2}\right) =
\frac{1}{n} E\left(\sum\limits_{i=1}^{n}(x_{i}-\overline{x})^{2}\right)
</math>

<math> =
\frac{1}{n} E\left(\sum\limits_{i=1}^{n}x_{i}^2 + \sum\limits_{i=1}^{n}\overline{x}^{2} - 2\sum\limits_{i=1}^{n} \overline{x} x_i \right)
</math>

<math> =
\frac{1}{n} \left(\sum\limits_{i=1}^{n}E(x_{i}^2) + \sum\limits_{i=1}^{n}E(\overline{x}^{2}) - 2 E \left(\overline{x} \sum\limits_{i=1}^{n} x_i \right) \right)
</math>

<math> =
\frac{1}{n} \left(\sum\limits_{i=1}^{n}E(x_{i}^2) + n E(\overline{x}^{2}) - 2 n E (\overline{x}^2 ) \right)
</math>

<math> =
\frac{1}{n} \left(n E(x_{i}^2) - n E(\overline{x}^{2}) \right)
</math>

podstawiając wyprowadzone wcześniej wzory na <math>E(x_{i}^2)</math> i <math>E(\overline{x}^{2})</math> dostajemy

<math>
E\left( s_o^{2}\right) = \frac{1}{n} \left( n (\sigma^2_{x_i} - \mu^2) -n ( \frac{1}{n}\sigma^2_{x_i} - \mu^2 ) \right)
=\frac{n-1}{n}\sigma^{2}_{x_i}
</math>

czyli nie jest dla każdej wielkości próby <math>n</math> wartość oczekiwana tego estymatora wyniesie <math>\sigma^2(x)</math>. Tak więc <math>s_o^2</math> jest estymatorem obciążonym.
W tej sytuacji, jako nieobciążony estymator wariancji możemy zaproponować
<equation id="eq:93">
<center><math>
{ s^{2}=\frac{1}{n-1}\underset{i=1}{\overset{n}{\sum }}(x_{i}-
\overline{x})^{2} }
</math></center>
</equation>

===Estymator wariancji wartości średniej===
Podstawiając tę zależność do wyprowadzonego powyżej wzoru na
wariancję wartości średniej <xr id="eq:91">(%i)</xr>
w miejsce <math>\sigma^2</math>, dostajemy wzór na estymator wariancji wartości
średniej próby

<equation id="eq:94">
<center><math>
s^2_{\overline{x}} = \frac{1}{n(n-1)}\sum_{i=1}^n(x_{i}-\overline{x})^{2}.
</math>
</equation></center>

Pierwiastek tej wielkości

<equation id="eq:94a">
<center><math>
s_{\overline{x}} = \sqrt{
\frac{1}{n(n-1)}\sum_{i=1}^n(x_{i}-\overline{x})^{2}}
</math>
</equation></center>

jest estymatorem '''odchylenia standardowego wartości średniej'''.

WnioskowanieStatystyczne/Klasyczna teoria

2026-03-06T15:48:53Z

Durka: /* Założenia i ograniczenia teorii klasycznej */

[[Wnioskowanie_Statystyczne_-_wykład]]

==Założenia i ograniczenia teorii klasycznej==
Klasyczna statystyka powstawała w czasach, gdy obliczenia wykonywano
wyłącznie na papierze — albo za pomocą suwaków logarytmicznych itp.,
ale bez komputerów. Analityczny opis prawdopodobieństw prowadzi, z
wyjątkiem najprostszych przykładów, do skomplikowanych wzorów. W
dodatku opiera się zwykle na silnie upraszczających założeniach —
najczęściej punktem wyjścia jest przyjęcie, że dane podlegają
[[WnioskowanieStatystyczne/CLT|rozkładowi Gaussa]]
zwanemu też rozkładem normalnym lub krzywą dzwonową. <ref>Oczywiście
założenie to przyjmujemy, jeśli nie znamy rozkładu badanej
populacji. Jego znajomość jest jednak w praktyce dość rzadka i dlatego
pozostaje przyjąć wybór uzasadniony dla przypadków, w których mamy do
czynienia z [[WnioskowanieStatystyczne/Centralne_Twierdzenie_Graniczne|sumowaniem dużej
liczby małych błędów]], czyli rozkład Gaussa. </ref>

Jednak "długie wzory" to nie jedyny problem statystyki klasycznej.
Już na długo przed pojawieniem się współczesnych metod opartych na
komputerach, podstawy teorii statystyki były przedmiotem gorących
dyskusji — poczynając od samej [[WnioskowanieStatystyczne/Prawdopodobienstwo|definicji
prawdopodobieństwa]]. Główną alternatywą dla najbardziej
rozpowszechnionej statystyki klasycznej (zwanej również częstościową,
od sposobu definiowania prawdopodobieństwa) jest
[[WnioskowanieStatystyczne/Twierdzenie_Bayesa|podejście Bayesowskie]]. Jest ono bardziej
eleganckie z filozoficznego punktu widzenia (choć dla niektórych
immanentnie obecny element subiektywności jest trudny do
zaakceptowania), jednak nie w każdym przypadku podaje konkretne
recepty na obliczanie prawdopodobieństwa.

Wreszcie są również sytuacje, w których stopień skomplikowania
uniemożliwia wyprowadzenie jakichkolwiek wzorów analitycznych, przez
co powyższe podejścia stają się bezsilne i jako jedyna recepta
pozostaje "brutalna siła" obliczeniowa.

Z drugiej strony, jeśli dla danego problemu znane jest poprawne
rozwiązanie klasyczne, bywa ono nie tylko szybsze, ale i dokładniejsze
niż symulacje czy repróbkowanie. Jeśli wynik wyraża się nawet bardzo
skomplikowanym wzorem, można go obliczyć bez porównania szybciej,<ref>
Nawet jeśli we wzorach występują trudne do obliczenia całki, gdyż
wartości częściej używanych całek zapisywano w tablicach. Jeszcze do
niedawna większość podręczników statystyki zawierała tablice całek
funkcji Gaussa, funkcji <math>\Gamma</math>, <math>\chi^2</math>
itp. Dziś wszystkimi obliczeniami zajmuje się komputer, my możemy
skupić się na sednie problemu i poprawnym wyborze metody.</ref> niż
setki czy tysiące powtórzeń znacznie prostszego wzoru, będące podstawą
metod repróbkowania opisywanych w poprzedniej części.

Ponadto metody klasyczne są wciąż podstawowym językiem
wyrażania istotności wyników i weryfikacji hipotez w większości
zastosowań statystyki. Dlatego też współczesny kurs powinien zawierać
zarówno elementy repróbkowania, jak i statystyki klasycznej.
Ich znajomość pozwoli na wybranie metody odpowiedniej (lub
najprostszej) dla konkretnego problemu.

--------------------------
<references />

WnioskowanieStatystyczne/wstep

2026-03-06T15:46:15Z

Durka: /* Wstęp */

__TOC__
[[Wnioskowanie_Statystyczne_-_wykład]]
==Wstęp==
Nigdy w historii matematyki tak wielu nie popełniało tak licznych błędów w tak niewielu zastosowaniach. To parafraza wypowiedzi Winstona Churchilla (w brytyjskim parlamencie 20 sierpnia 1940 roku), ale tutaj chodzi o statystykę. Dlaczego?
* Zdecydowana większość ludzi korzystających z metod statystycznych to specjaliści w zupełnie innych dziedzinach, względem których statystyka pełni rolę służebną.
* Klasyczna teoria statystyki powstawała ponad pół wieku temu i z braku podówczas komputerów opiera się na zaawansowanych metodach analitycznych (czytaj: długich i skomplikowanych wzorach) oraz koniecznych do ich wyprowadzenia założeniach, nie zawsze spełnianych w praktyce.
* Próba wyjaśnienia tej złożonej teorii na kursie lub w podręczniku dla nie-statystyków kończy się zwykle katalogiem przepisów ''kiedy stosować który test''. Niestety, żaden katalog nie uwzględni wszystkich przypadków, z którymi możemy mieć do czynienia, i nie zastąpi zrozumienia podstaw. Na przykład studium 50 artykułów w najbardziej prestiżowym czasopiśmie medycznym ([http://content.nejm.org/ New England Journal of Medicine]), w których wykorzystano do analizy wyników test ''t'' wykazało, że w ponad połowie z nich użycie tego testu było nieprawidłowe — cytat za książką [http://www.juliansimon.com/writings/Resampling_Philosophy/ Juliana L. Simona &bdquo;The Philosophy and Practice of Resampling Statistics"].
* Główną konsekwencją rozpowszechnienia komputerów jest ułatwienie dostępu do tych skomplikowanych metod: z wczytaniem danych do specjalizowanego pakietu statystycznego jakoś sobie poradzimy, potem tylko trzeba &bdquo;doklikać się” do jakiegoś testu i... komputer zawsze &bdquo;wyrzuci” jakiś wynik. Ale komputer nie przyjmie odpowiedzialności za dobór metody do problemu i poprawne sformułowanie hipotezy.

Na szczęście komputery niosą tu również dobrą nowinę. Są nią nowe, rewolucyjnie proste i intuicyjne metody
oparte na idei repróbkowania (ang. ''resampling'') — testy permutacyjne i bootstrap — oraz możliwość szerokiego stosowania
symulacji Monte Carlo. Uwalniając użytkownika od skomplikowanej teorii i wzorów pozwalają skupić się na istocie pytania, na które
statystyka ma odpowiedzieć. Ponadto działają często w sytuacjach, w których tradycyjne metody analityczne zawodzą (jak np. bootstrap w szacowaniu błędów złożonych funkcji).

Ideę testów permutacyjnych po raz pierwszy zaproponował R. A. Fischer w latach 1930-tych jako teoretyczny argument za testem [[WnioskowanieStatystyczne/Test_t|<math>t</math> Studenta]] (student to w tym przypadku pseudonim [https://pl.wikipedia.org/wiki/William_Sealy_Gosset Williama Gosseta]); symulacje [[WnioskowanieStatystyczne/Z_komputerem#.22Prawdziwe.22_Monte_Carlo|Monte Carlo]] ([[wikipedia:Stanisław Ulam|Stanisław Ulam]]) zaczęto stosować po II wojnie światowej, gdy pojawiły się pierwsze komputery. Idee repróbkowania ([[wikipedia:Julian L Simon|Julian L. Simon]]) i bootstrapu ([[wikipedia:Bradley Efron|Bradley Efron]]) w dzisiejszej postaci sformułowano w latach 80. XX wieku, jednak praktyczne możliwości wykorzystania tych metod na szerszą skalę pojawiły się dopiero w latach 90. dzięki rozwojowi technologii komputerowej.

Nowe metody oparte są na &bdquo;brutalnej mocy” obliczeniowej. Kilkadziesiąt lat temu fakt ten uniemożliwiał ich praktyczne zastosowanie (pewnie dlatego nie zawracano sobie podówczas głowy ich wymyślaniem). Kilkanaście lat temu stanowiło to poważną przeszkodę w ich rozpowszechnieniu. Dzisiaj stosowanie tych metod może Tobie co najwyżej uświadomić, że komputer na Twoim biurku ma w sobie więcej mocy obliczeniowej niż maszyna do pisania, którą na co dzień zastępuje.

To &bdquo;brutalne” podejście nie zachwyca, jak się łatwo domyślić, wyrafinowaną elegancją matematyczną (zachwyca raczej prostotą). Być może to właśnie jest przyczyną jego relatywnie małej popularności, szczególnie wśród wykształconych matematycznie przedstawicieli nauk przyrodniczych. Ale nawet wśród nich większość zgadza się, że statystyka pełni w stosunku do innych nauk rolę służebną — choć często kluczowo ważną.

Wreszcie niekwestionowanym walorem tych metod jest ich ogromna wartość dydaktyczna, umożliwiająca zrozumienie podstaw &bdquo;przed” zmierzeniem się z komplikacjami matematycznymi i ideowymi statystyki klasycznej.

==Co znajdziemy w tej książce i jak z niej korzystać==

Pierwsza część to luźne i bezstresowe (bez użycia wzorów) wprowadzenie podstawowych pojęć statystyki, dzięki którym dochodzimy — wciąż bez żadnego wzoru — do całkiem poważnych i przydatnych zastosowań metody Monte Carlo i repróbkowania (testów permutacyjnych i bootstrapu).
Celem tej części jest:
* zapoznanie Czytelnika z najnowszymi trendami w statystyce,
* umożliwienie samodzielnego i poprawnego rozwiązywania wielu problemów statystycznych w sposób intuicyjny drogą symulacji komputerowych, co pozwala na skoncentrowanie się na poprawnym sformułowaniu problemu (hipotezy) i znacząco zmniejsza szansę popełnienia grubego błędu metodycznego,
* wprowadzenie w sposób intuicyjny i na konkretnych przykładach pojęć z klasycznej teorii statystyki (jak np. poziom istotności i moc testu), co ułatwi zrozumienie części drugiej.

W części drugiej całki itp. są już nie do uniknięcia; jednak liczba wzorów podawanych bez dowodu ograniczona jest do koniecznego minimum. Znajdziemy tam:
* podstawy wystarczające do zrozumienia klasycznej — i wciąż najbardziej powszechnej — metodologii weryfikacji hipotez statystycznych; stanowi ona podstawę większości zastosowań wnioskowania statystycznego, czyli &bdquo;testów statystycznych",
* dokładne i poparte przykładami omówienie najczęściej stosowanych testów: <math>t</math> Studenta, <math>\chi^2</math> dla tabel i dopasowania rozkładu, testu serii Walda–Wolfowitza i testu rang Wilcoxona–Manna–Whitneya,
* wyprowadzenie od podstaw statystyki [[WnioskowanieStatystyczne/Test_serii|testu serii]], co pozwala na prześledzenie kompletnej drogi powstawania metody statystycznej również w podejściu klasycznym,
*oparty na wielu dokładnie analizowanych przykładach opis podstawowego schematu weryfikacji hipotez statystycznych, na którym opierają się wszystkie powszechnie stosowane testy statystyczne.

Do zrozumienia części pierwszej nie jest wymagane praktycznie żadne
przygotowanie matematyczne. Dla samodzielnego zastosowania opisywanych w niej
metod konieczne jest zastosowanie dowolnego języka programowania bądź
specjalizowanego pakietu statystycznego.

Przyswojenie podstawowych pojęć wprowadzonych w części
pierwszej znacznie ułatwia zrozumienie części drugiej, w której
korzysta się już z pojęcia całki i podstaw kombinatoryki.

Pierwsza część książki oparta jest na intensywnym wykorzystaniu
komputerów. Dodatek A opisuje ogólne ograniczenia,
którym podlegają wszelkie rozwiązania problemów za pomocą maszyn liczących.

Na koniec Dodatek B zawiera oryginalne teksty wszystkich programów, wykorzystanych do tworzenia
rysunków i wykonywania obliczeń prezentowanych w tej książce, w języku
''Matlab''. Jest to język wysokiego poziomu o stosunkowo intuicyjnej
składni, dzięki czemu teksty te mogą stanowić uzupełnienie opisywanych
algorytmów również dla osób nie korzystających z pakietu ''Matlab''.
Studiowanie tych programów nie jest bynajmniej konieczne do zrozumienia
prezentowanych w książce zagadnień. Programy te, jak również inne związane z książką materiały i ewentualne uaktualnienia, znaleźć można w Internecie pod adresem [http://statystyka.durka.info http://statystyka.durka.info].

SVAROG i empi

2026-03-06T13:37:24Z

Durka: /* ⬆ SVAROG */

=[[Analiza_sygnałów_-_lecture|⬆]] SVAROG=
[[Plik:Svarog elektrowlosy EEG transp.png|frameless|x250px]]

Svarog (Signal Viewer, Recorder and Analyzer on GPL) to tworzony na Wydziale Fizyki UW i w firmie BrainTech program do wyświetlania i analizy wielozmiennych sygnałów (głównie elektrofizjologiczych), dostępny na licencji GPL. Jest to prawdopodobnie najlepsza w świecie [https://pl.wikipedia.org/wiki/Wolne_i_otwarte_oprogramowanie FOSSS] przeglądarka EEG, której interfejs dopasowano do preferencji elektroencefalografistów. Ponadto, w ramach Funduszu Inicjatyw Dydaktycznych UW, program uzupełniono o implementacje wykorzystywanych w analizie EEG metod, których samodzielne programowanie nie mieści się w ramach ćwiczeń, jak np. [[Falki_(wavelets)|transformacja falkowa]], [[Spektrogram|STFT]], [[Analiza_sygnałów_wielowymiarowych#Analiza_składowych_niezależnych_(ICA)|ICA]], [[Analiza_sygnałów_wielowymiarowych#Wielozmienny_model_AR|DTF]] i [[Reprezentacje_przybliżone#Algorytm_matching_pursuit_i_słowniki_czas-częstość|matching pursuit]].

Strona projektu, zawierająca kod źródłowy, to https://gitlab.com/fuw_software/svarog4. Potrzebne do korzystania z programu skompilowane pliki znajdują się w "artefakcie" na stronie https://gitlab.com/fuw_software/svarog4/-/artifacts

Po rozpakowaniu archiwum <code>target.zip</code> utworzy się folder svarog, w którym znajdziemy główny plik svarog-standalone.jar (Java ARchive). Ten plik — jeśli w systemie jest skonfigurowane środowisko wykonawcze Javy (Java Runtime Environment, JRE) — można zwykle uruchomić podwójnym kliknięciem. Wyjątkiem będzie tutaj pierwsze uruchomienie, gdyż współczesne systemy ze względów bezpieczeństwa ograniczają uruchamianie programów z nieznanych źródeł. Dlatego przy pierwszym uruchomieniu system zwykle wyświetli ostrzeżenie. 

W przypadku kłopotów z uruchomieniem programu można skorzystać ze starszych wersji, które dystrybuowano razem z wirtualną maszyną Javy dla głównych systemów, dostępnych pod adresem https://gitlab.com/fuw_software/svarog2-packager/-/releases.

[[Plik:Svarog_FFT.png|frameless|700px]]

=empi=
Jednym z poleceń, które znajdziemy w menu Svaroga, jest dekompozycja wybranego odcinka sygnału algorytmem [[Reprezentacje_przybli%C5%BCone#Algorytm_matching_pursuit_i_słowniki_czas-częstość|matching pursuit]]. Ta funkcja technicznie różni się od pozostałych, gdyż wywołuje zewnętrzny program [[Reprezentacje_przybliżone#empi_.E2.80.94_implementacja_MMP|empi]], napisany w C++ ze wsparciem dla GPU, a nie w Javie, więc musi być kompilowany dla konkretnych systemów operacyjnych. Dlatego w podfolderach folderu svarog/mp znajdziemy binaria programu empi, skompilowane dla najważniejszych systemów. Aby wybrać właściwą wersję, należy uruchomić w Svarogu opcję "Preferences" z menu "Tools", gdzie w zakładce "Tools" znajduje się możliwość skonfigurowania ścieżki do właściwego kompilatu empi.

Nawet po prawidłowym skonfigurowaniu ścieżki, pierwsze uruchomienie dekompozycji MP z poziomu Svaroga może zwrócić błąd. Wynika on stąd, że, podobnie jak sam Svarog, program empi również nie pochodzi ze "znanego systemowi" źródła, w związku z czym stanowi potencjalne niebezpieczeństwo. Dlatego przed pierwszym wywołaniem tej funkcji z poziomu Svaroga trzeba najpierw uruchomić sam program empi i udzielić odpowiedniej zgody — w przypadku systemu MacOS wymaga to np. otwarcia okna ustawień systemowych i wyrażenia odp. zgody w zakładce "prywatność i ochrona".

==empi do pracy wsadowej==
Empi w badaniach naukowych wykorzystujemy zwykle do dekompozycji sygnałów, której wyniki (czyli parametry dopasowanych do sygnału funkcji Gabora) zapisujemy w plikach z rozszerzeniem .db czyli bazach danych struktur. Pliki te mogą być wczytywane do Svaroga w celu wyświetlenie dekompozycji w przestrzeni czas-częstość, ale często pracujemy też bezpośrednio na parametrach dopasowanych do sygnału funkcji. Przykładowe skrypty w Pythonie i Matlabie dostępne są pod adresem https://github.com/develancer/empi/tree/master/demo

==Literatura==
* S. Mallat and Z. Zhang (1993) Matching pursuit with time-frequency dictionaries. IEEE Transactions on Signal Processing, 41:3397-3415.
* Piotr Różański (2024) [https://dl.acm.org/doi/10.1145/3674832 empi: GPU-Accelerated Matching Pursuit with Continuous Dictionaries]. ACM Transactions on Mathematical Software Vol. 50, No. 3.
* [https://biomedical-engineering-online.biomedcentral.com/articles/10.1186/1475-925X-12-94 Multivariate matching pursuit in optimal Gabor dictionaries: theory and software with interface for EEG/MEG via Svarog]
* [https://journal.frontiersin.org/article/10.3389/fnhum.2015.00258/full Spindles in Svarog: framework and software for parametrization of EEG transients].

<div align="right">
[[Analiza_sygnałów_-_lecture|⬆]]
</div>

WnioskowanieStatystyczne/CLT

2026-03-05T17:24:26Z

Durka: /* Rozkład Gaussa */

[[Wnioskowanie_Statystyczne_-_wykład]]

==Rozkład Gaussa==

Rozkład Gaussa (zwany też rozkładem normalnym lub krzywą dzwonową) zależy od
parametrów <math>\mu</math> i <math>\sigma</math>. Jego gęstość prawdopodobieństwa określona jest wzorem:

<center><math display="block">\displaystyle
p(x)=N(\mu, \sigma)= \frac{1}{\sqrt{2\pi }\sigma }e^{\frac{-(x-\mu )^{2}}{2\sigma ^{2}}}.
</math></center>

Parametry te są tak dobrane, że wartość oczekiwana wynosi
<math>\mu</math>, a wariancja <math>\sigma^2</math>.

[[Plik:Rozklad_gaussa.png|600px|thumb|left|<math>N(0,1)</math>, czyli
standardowy rozkład Gaussa o zerowej średniej (<math>\mu=0</math>) i
jednostkowej wariancji (<math>\sigma=1</math>).]]

Rozkład Gaussa dla zerowej wartości oczekiwanej i jednostkowej
wariancji (<math>\mu=0, \sigma^2=1</math>) zwiemy
''standardowym rozkładem Gaussa''
i oznaczamy zwykle <math>N(0,1)</math>.
Na wykresie zaznaczono na nim m. in. wartość całki od <math>-\infty</math> do
<math>-1</math>, czyli prawdopodobieństwo, że wylosowana z tego
rozkładu liczba będzie mniejsza niż <math>-1</math>. Jak widać, wynosi
ono ok. 16%, a jeśli weźmiemy pod uwagę również wartości większe od 1,
będzie to aż 32%! Oznacza to, że przy losowaniu wielu liczb z tego
rozkładu niemal 1/3 wyników może znaleźć się w odległości
większej niż <math>\sigma</math> od wartości oczekiwanej.

<equation id="eq:80">
<math>\displaystyle
x\in N(\mu,\sigma)\quad \Rightarrow \quad
\begin{cases}
P(\left| x-\mu \right| \geq \sigma )\approx 0,\!317,\\
P(\left| x-\mu \right| \geq 2\sigma )\ \approx 0,\!046,\\
\ P(\left| x-\mu \right| \geq 3\sigma )\approx 0,\!003.
\end{cases}
</math>
</equation>



Rozkład Gaussa pełni w statystyce bardzo znaczącą rolę ze względu na ''Centralne Twierdzenie Graniczne'', mówiące o asysmptotycznym rozkładzie sumy dużej liczby niezależnych zmiennych losowych, których rozkłady spełniają pewne warunki. Udowodnimy je w najprostszym przypadku, kiedy wszystkie te zmienne pochodzą z tego samego rozkładu gęstości prawdopodobieństwa. Na potrzeby tego dowodu musimy najpierw wprowadzić pojęcie funkcji charakterystycznej.



==Funkcja charakterystyczna rozkładu prawdopodobieństwa==

Dla zmiennej losowej <math>z</math> jest to wartość oczekiwana wyrażenia <math>e^{itz}</math>, gdzie <math>i=\sqrt{-1}</math>. Dla rozkładów ciągłych jest to [[Przekształcenie_Fouriera|transformata Fouriera]] funkcji gęstości prawdopodobieństwa <math>f(z)</math>:
<center><math>\displaystyle
\phi_z (t)=E(e^{itz})=\underset{-\infty }{\overset{\infty }{\int }}
e^{itz}f\left( z\right) dz
</math></center>
Użyteczne będą poniższe związki, które wyprowadzić można bezpośrednio z definicji:

====Funkcja charakterystyczna rozkładu sumy zmiennych niezależnych====
Dla ''niezależnych'' zmiennych <math>x</math> i <math>y</math>:
<equation id="eq:85">
<center>
<math>
z=x+y\Rightarrow \phi_{z}(t)
=\phi_{x}\left( t\right) \cdot \phi_{y}(t).
</math>
</center>
</equation>

Dowód:

<math>
\phi _{z}(t)
= E(e^{it(x+y)})=E(e^{itx}\cdot e^{ity})
= E(e^{itx})\cdot E(e^{ity})=\phi _{x}\left( t\right) \cdot \phi_{y}(t).
</math>

====Pochodna funkcji charakterystycznej====
Bezpośrednio z definicji — różniczkujemy po <math>dt</math>, więc przy każdym różniczkowaniu spada nam z wykładnika <math>i z</math>, <math>z</math> zostaje pod całką a <math>i</math> jako stała wychodzi przed całkę — widać, że:
<equation id="eq:pochodna_funkcji_tworzacej">
<center><math>\displaystyle
\frac{d^{n}\phi (t)}{dt^{n}}=i^{n}\underset{}{\underset{-\infty }{\overset{
\infty }{\int }}z^{n}}\ e^{itz}f(z) dz
</math></center>
</equation>

====Związek pochodnej funkcji charakterystycznej z momentami zmiennej losowej====
<math>n</math>-ta pochodna funkcji charakterystycznej w zerze (czyli dla <math>t=0</math>) wynosi
<equation id="eq:84">
<center><math>\displaystyle
\phi^{(n)}(0)=
i^{n}\underset{}{\underset{-\infty }{\overset{\infty }{\int }}z^{n}}\ e^{i 0 x} f(z) dz =
i^{n}\underset{}{\underset{-\infty }{\overset{\infty }{\int }}z^{n}} f(z) dz =
i^{n}E(z^{n})
</math></center>
</equation>

==Twierdzenie Lindeberga–Lévy'ego==
Zakładamy, że <math>x_{i}</math> są niezależnymi zmiennymi podlegającymi (dowolnemu) rozkładowi o skończonej wartości oczekiwanej <math>\mu</math> i wariancji <math>\sigma^{2}</math>, czyli wszystkie sumowane zmienne <math>x_i</math> pochodzą z tego samego rozkładu prawdopodobieństwa, o którym nie zakładamy nic ponad to, że ma skończone <math>\mu</math> i <math>\sigma</math>.
Wielkość

<center>
<equation id="eq:82"> <math>
S=\dfrac{ \sum\limits_{i=1}^{n}x_{i}\; -\; n\mu}{\sigma \sqrt{n}}
</math> </equation>
</center>

dla <math>n\rightarrow \infty</math> zbiega do rozkładu normalnego o zerowej wartości średniej i jednostkowej wariancji.

===Dowód twierdzenia Lindeberga–Lévy'ego===
Rozważmy zmienną <math>y_i</math> o zerowej wartości oczekiwanej i jednostkowej wariancji
<center><math>
y_{i} = \dfrac{x_{i}-\mu}{\sigma} .
</math></center>

Funkcję charakterystyczną rozkładu zmiennej <math>y_i</math>
<center><math>\phi_{y_i}(z) = E(e^{i z y_i}) </math></center>
możemy rozwinąć w szereg Taylora wokół <math>z=0</math><equation id="eq:86">
<center><math>\displaystyle
\phi_{y_i}(z)=\underset{n=0}{\overset{\infty }{\sum }}\frac{\phi^{(n)}(0)}{n!}z^n
</math></center>
</equation>

Z wyprowadzonej wcześniej własności funkcji charakterystycznej <xr id="eq:84">(%i)</xr>
<math>
\phi^{(n)}(0)=
i^{n}E(z^{n})
</math>
wynika, że

<math>\phi_{y_i}^{(0)}(0)= i^0 E(x^0) = 1</math>,

<math>\phi_{y_i}^{(1)}(0) = i^1 E(x^1) = i E(x) = 0</math> (wartość oczekiwana <math> y_i</math>),

<math>\phi_{y_i}^{(2)}(0)= i^2 E(x^2) = -1</math> (<math>i^2</math> * wariancja),

czyli funkcja charakterystyczna zmiennej <math>y_i</math> rozwinięta w szereg Taylora <xr id="eq:86">(%i)</xr> do wyrazów drugiego rzędu będzie miała postać
<equation id="eq:87">
<center><math>\displaystyle
\phi_{y_i}(z)=1-\frac{z^{2}}{2}+\cdots .
</math></center>
</equation>

Wrócmy do występującej w twierdzeniu sumy <math>S</math>

<math>
S=\dfrac{ \sum\limits_{i=1}^{n}x_{i}\; -\; n\mu}{\sigma \sqrt{n}} =
\dfrac{1}{\sigma \sqrt{n}} \sum\limits_{i=1}^{n}(x_{i} -\mu) =
\dfrac{1}{\sqrt{n}} \sum\limits_{i=1}^{n}\dfrac{x_{i} -\mu}{\sigma}
= \dfrac{1}{\sqrt{n}} \sum\limits_{i=1}^{n} y_i
</math>

Jej funkcja charakterystyczna to

<math>\displaystyle \phi_S(z) = E(e^{izS}) = E\left(e^{iz \frac{1}{\sqrt{n}} \sum\limits_{i=1}^{n} y_i} \right)
</math>
<math>\displaystyle
= E\left(\prod_{i=1}^{n} e^{iz \frac{1}{\sqrt{n}} y_i} \right)
</math>

Ponieważ zmienne <math>y_i</math> są wzajemnie niezależne,

<math>\displaystyle \phi_S(z)= \prod_{i=1}^{n} E\left( e^{i\frac{z}{\sqrt{n}} y_i } \right)
= \prod_{i=1}^{n} \phi_{y_i}\left(\frac{z}{\sqrt{n}}\right)
</math>

Ponieważ zmienne <math>y_i</math> pochodzą z tego samego rozkładu prawdopodobieństwa,

<math>\displaystyle \phi_S(z)=
\prod_{i=1}^{n} \phi_{y_i}\left(\frac{z}{\sqrt{n}}\right) =
\left( \phi_{y_i}\left(\frac{z}{\sqrt{n}}\right) \right)^n =
\left( 1-\frac{(z/\sqrt{n})^{2}}{2}+\cdots \right)^n =
\left( 1-\frac{z^2}{2n}+\cdots \right)^n
</math>

Przy przejściu z <math>n</math> do nieskończoności (i pomijaniu wyrazów rzędu wyższego niż drugi) dostajemy
<center><math>\displaystyle
\phi_y(z)\rightarrow
\underset{n\rightarrow \infty }{\lim }\left(1-\frac{z^2}{2n}\right)^n=
e^{\frac{-z^{2}}{2}}
</math></center>

bo
<math>e^x=\lim_{n\rightarrow\infty} (1+x/n)^n</math>

Pozostaje pokazać, że jest to postać funkcji charakterystycznej rozkładu Gaussa.

====Transformata Fouriera funkcji Gaussa====
Funkcja charakterystyczna rozkładu normalnego o wartości oczekiwanej 0 i jednostkowej wariancji będzie miała postać

<math>
\phi _{x}(t)=
\int\limits_{-\infty}^\infty e^{itx}\frac{1}{\sqrt{2\pi }} e^{\frac{-x^{2}}{2}} dx =
</math>

<math>
\dfrac{1}{\sqrt{2\pi}} \int\limits_{-\infty}^\infty \left( \cos(tx) + i \sin(tx) \right) e^{\frac{-x^2}{2}} dx =
</math>

<math>
\dfrac{1}{\sqrt{2\pi}} \int\limits_{-\infty}^\infty \cos(tx) e^{\frac{-x^2}{2}} dx +
\dfrac{1}{\sqrt{2\pi}} \int\limits_{-\infty}^\infty i \sin(tx) e^{\frac{-x^2}{2}} dx
</math>

ponieważ funkcja <math>\sin(x)</math> jest antysymetryczna, druga całka znika. Dostajemy

<math>
\int\limits_{-\infty}^\infty e^{itx}\frac{1}{\sqrt{2\pi }} e^{\frac{-x^2}{2}} dx =
\dfrac{1}{\sqrt{2\pi}} \int\limits_{-\infty}^\infty \cos(tx) e^{\frac{-x^2}{2}} dx
</math>

Dla części symetrycznej znajdujemy w tablicach całkę oznaczoną

<math>
\int\limits_{0}^{\infty} e^{-a^2 x^2} \cos(b x) dx
=
\frac{ \sqrt{\pi} e^{-\tfrac{b^2}{4a^2}} } {2 a}
</math>

po wymnożeniu przez 2 i podstawieniu <math> b=t</math> i <math>a^2=\frac{1}{2}</math> dostajemy

<math>
\int\limits_{-\infty}^{\infty} e^{-\frac{1}{2} x^2} \cos(t x) dx
=
\frac{ \sqrt{\pi} e^{ -\frac{t^2} { 4 \frac{1}{2} } } } {\frac{1}{\sqrt{2}}}
=
\sqrt{2\pi} e^{-\frac{t^2}{2}}
</math> , czyli

<center><math>\displaystyle
\phi _{x}(t) =
\int\limits_{-\infty}^\infty e^{itx}\frac{1}{\sqrt{2\pi }} e^{\frac{-x^{2}}{2}} dx =
e^{-t^2 / 2}
</math></center>

W analizie sygnałów wynik ten będzie oznaczał, że transformacja Fouriera funkcji Gaussa jest funkcją Gaussa. W tym konkretnym przypadku otrzymaliśmy funkcję tożsamą z funkcją charakterystyczną rozkładu rozważanej sumy zmiennych, czyli rozkład ten będzie (w przypadku granicznym) miał postać funkcji Gaussa.

[[Plik:Ctg.png|300px|thumb|left|<figure id="fig:ctg"></figure>Ilustracja działania Centralnego Twierdzenia Granicznego. Zmienną
<math>x_i</math> bierzemy z rozkładu równomiernego, kolejne histogramy przedstawiają sumę 2, 3 i 4
zmiennych <math>x_i</math> dla 10 000 losowań. Widać dużą zgodność z dopasowanym rozkładem
normalnym (ciągła linia) już dla niewielu sumowanych zmiennych.
]]

<xr id="fig:ctg">Rysunek %i</xr> ilustruje powyższe twierdzenie dla
przypadku sumy zmiennych pochodzących z rozkładu równomiernego. Jak
widać, już dla sumy 3 zmiennych rozkład wydaje się bardzo podobny do
normalnego. Niestety, często istotne bywają różnice dla wartości bardzo dużych lub bardzo małych. Otóż według
[[WnioskowanieStatystyczne/Rozklady-przyklady#label-eq:78|wzoru]] wartości gęstości
prawdopodobieństwa rozkładu normalnego dążą do zera dla dużych
wartości bezwzględnych zmiennej asymptotycznie, lecz zera faktycznie
nie osiągają. Inaczej mówiąc, prawdopodobieństwo wylosowania dowolnie
dużej wartości z rozkładu Gaussa będzie małe, ale nie zerowe. Za to
suma np. czterech zmiennych z rozkładu równomiernego od zera do
jedynki (prawy dolny wykres <xr id="fig:ctg">rys. %i</xr>) nie
przekroczy nigdy wartości 4, czyli prawdopodobieństwo dla
<math>x>4</math> będzie dokładnie zerem. I choć w skali <xr
id="fig:ctg">rysunku %i</xr> efekt ten jest prawie niewidoczny, warto
pamiętać, że testy oparte na założeniu normalności rozkładów często
operują właśnie w okolicach tych "ogonów", gdzie przybliżenie
rozkładu normalnego, uzyskane za pomocą tej prostej procedury,
zawodzi.

-----------------------
<references />

WnioskowanieStatystyczne/CLT

2026-03-05T17:20:27Z

Durka: /* Dowód twierdzenia Lindeberga–Lévy'ego */

[[Wnioskowanie_Statystyczne_-_wykład]]

==Rozkład Gaussa==

Rozkład Gaussa (zwany też rozkładem normalnym lub krzywą dzwonową) zależy od
parametrów <math>\mu</math> i <math>\sigma</math>. Jego gęstość prawdopodobieństwa określona jest wzorem:

<center><math display="block">\displaystyle
p(x)=N(\mu, \sigma)= \frac{1}{\sqrt{2\pi }\sigma }e^{\frac{-(x-\mu )^{2}}{2\sigma ^{2}}}.
</math></center>

Parametry te są tak dobrane, że wartość oczekiwana wynosi
<math>\mu</math>, a wariancja <math>\sigma^2</math>.

[[Plik:Rozklad_gaussa.png|600px|thumb|left|<math>N(0,1)</math>, czyli
standardowy rozkład Gaussa o zerowej średniej (<math>\mu=0</math>) i
jednostkowej wariancji (<math>\sigma=1</math>).]]

Rozkład Gaussa dla zerowej wartości oczekiwanej i jednostkowej
wariancji (<math>\mu=0, \sigma^2=1</math>) zwiemy
''standardowym rozkładem Gaussa''
i oznaczamy zwykle <math>N(0,1)</math>.
Na wykresie zaznaczono na nim m. in. wartość całki od <math>-\infty</math> do
<math>-1</math>, czyli prawdopodobieństwo, że wylosowana z tego
rozkładu liczba będzie mniejsza niż <math>-1</math>. Jak widać, wynosi
ono ok. 16%, a jeśli weźmiemy pod uwagę również wartości większe od 1,
będzie to aż 32%! Oznacza to, że przy losowaniu wielu liczb z tego
rozkładu niemal 1/3 wyników może znaleźć się w odległości
większej niż <math>\sigma</math> od wartości oczekiwanej.

<equation id="eq:80">
<math>
x\in N(\mu,\sigma)\quad \Rightarrow \quad
\begin{cases}
P(\left| x-\mu \right| \geq \sigma )\approx 0,\!317,\\
P(\left| x-\mu \right| \geq 2\sigma )\ \approx 0,\!046,\\
\ P(\left| x-\mu \right| \geq 3\sigma )\approx 0,\!003.
\end{cases}
</math>
</equation>



Rozkład Gaussa pełni w statystyce bardzo znaczącą rolę ze względu na ''Centralne Twierdzenie Graniczne'', mówiące o asysmptotycznym rozkładzie sumy dużej liczby niezależnych zmiennych losowych, których rozkłady spełniają pewne warunki. Udowodnimy je w najprostszym przypadku, kiedy wszystkie te zmienne pochodzą z tego samego rozkładu gęstości prawdopodobieństwa. Na potrzeby tego dowodu musimy najpierw wprowadzić pojęcie funkcji charakterystycznej.



==Funkcja charakterystyczna rozkładu prawdopodobieństwa==

Dla zmiennej losowej <math>z</math> jest to wartość oczekiwana wyrażenia <math>e^{itz}</math>, gdzie <math>i=\sqrt{-1}</math>. Dla rozkładów ciągłych jest to [[Przekształcenie_Fouriera|transformata Fouriera]] funkcji gęstości prawdopodobieństwa <math>f(z)</math>:
<center><math>\displaystyle
\phi_z (t)=E(e^{itz})=\underset{-\infty }{\overset{\infty }{\int }}
e^{itz}f\left( z\right) dz
</math></center>
Użyteczne będą poniższe związki, które wyprowadzić można bezpośrednio z definicji:

====Funkcja charakterystyczna rozkładu sumy zmiennych niezależnych====
Dla ''niezależnych'' zmiennych <math>x</math> i <math>y</math>:
<equation id="eq:85">
<center>
<math>
z=x+y\Rightarrow \phi_{z}(t)
=\phi_{x}\left( t\right) \cdot \phi_{y}(t).
</math>
</center>
</equation>

Dowód:

<math>
\phi _{z}(t)
= E(e^{it(x+y)})=E(e^{itx}\cdot e^{ity})
= E(e^{itx})\cdot E(e^{ity})=\phi _{x}\left( t\right) \cdot \phi_{y}(t).
</math>

====Pochodna funkcji charakterystycznej====
Bezpośrednio z definicji — różniczkujemy po <math>dt</math>, więc przy każdym różniczkowaniu spada nam z wykładnika <math>i z</math>, <math>z</math> zostaje pod całką a <math>i</math> jako stała wychodzi przed całkę — widać, że:
<equation id="eq:pochodna_funkcji_tworzacej">
<center><math>\displaystyle
\frac{d^{n}\phi (t)}{dt^{n}}=i^{n}\underset{}{\underset{-\infty }{\overset{
\infty }{\int }}z^{n}}\ e^{itz}f(z) dz
</math></center>
</equation>

====Związek pochodnej funkcji charakterystycznej z momentami zmiennej losowej====
<math>n</math>-ta pochodna funkcji charakterystycznej w zerze (czyli dla <math>t=0</math>) wynosi
<equation id="eq:84">
<center><math>\displaystyle
\phi^{(n)}(0)=
i^{n}\underset{}{\underset{-\infty }{\overset{\infty }{\int }}z^{n}}\ e^{i 0 x} f(z) dz =
i^{n}\underset{}{\underset{-\infty }{\overset{\infty }{\int }}z^{n}} f(z) dz =
i^{n}E(z^{n})
</math></center>
</equation>

==Twierdzenie Lindeberga–Lévy'ego==
Zakładamy, że <math>x_{i}</math> są niezależnymi zmiennymi podlegającymi (dowolnemu) rozkładowi o skończonej wartości oczekiwanej <math>\mu</math> i wariancji <math>\sigma^{2}</math>, czyli wszystkie sumowane zmienne <math>x_i</math> pochodzą z tego samego rozkładu prawdopodobieństwa, o którym nie zakładamy nic ponad to, że ma skończone <math>\mu</math> i <math>\sigma</math>.
Wielkość

<center>
<equation id="eq:82"> <math>
S=\dfrac{ \sum\limits_{i=1}^{n}x_{i}\; -\; n\mu}{\sigma \sqrt{n}}
</math> </equation>
</center>

dla <math>n\rightarrow \infty</math> zbiega do rozkładu normalnego o zerowej wartości średniej i jednostkowej wariancji.

===Dowód twierdzenia Lindeberga–Lévy'ego===
Rozważmy zmienną <math>y_i</math> o zerowej wartości oczekiwanej i jednostkowej wariancji
<center><math>
y_{i} = \dfrac{x_{i}-\mu}{\sigma} .
</math></center>

Funkcję charakterystyczną rozkładu zmiennej <math>y_i</math>
<center><math>\phi_{y_i}(z) = E(e^{i z y_i}) </math></center>
możemy rozwinąć w szereg Taylora wokół <math>z=0</math><equation id="eq:86">
<center><math>\displaystyle
\phi_{y_i}(z)=\underset{n=0}{\overset{\infty }{\sum }}\frac{\phi^{(n)}(0)}{n!}z^n
</math></center>
</equation>

Z wyprowadzonej wcześniej własności funkcji charakterystycznej <xr id="eq:84">(%i)</xr>
<math>
\phi^{(n)}(0)=
i^{n}E(z^{n})
</math>
wynika, że

<math>\phi_{y_i}^{(0)}(0)= i^0 E(x^0) = 1</math>,

<math>\phi_{y_i}^{(1)}(0) = i^1 E(x^1) = i E(x) = 0</math> (wartość oczekiwana <math> y_i</math>),

<math>\phi_{y_i}^{(2)}(0)= i^2 E(x^2) = -1</math> (<math>i^2</math> * wariancja),

czyli funkcja charakterystyczna zmiennej <math>y_i</math> rozwinięta w szereg Taylora <xr id="eq:86">(%i)</xr> do wyrazów drugiego rzędu będzie miała postać
<equation id="eq:87">
<center><math>\displaystyle
\phi_{y_i}(z)=1-\frac{z^{2}}{2}+\cdots .
</math></center>
</equation>

Wrócmy do występującej w twierdzeniu sumy <math>S</math>

<math>
S=\dfrac{ \sum\limits_{i=1}^{n}x_{i}\; -\; n\mu}{\sigma \sqrt{n}} =
\dfrac{1}{\sigma \sqrt{n}} \sum\limits_{i=1}^{n}(x_{i} -\mu) =
\dfrac{1}{\sqrt{n}} \sum\limits_{i=1}^{n}\dfrac{x_{i} -\mu}{\sigma}
= \dfrac{1}{\sqrt{n}} \sum\limits_{i=1}^{n} y_i
</math>

Jej funkcja charakterystyczna to

<math>\displaystyle \phi_S(z) = E(e^{izS}) = E\left(e^{iz \frac{1}{\sqrt{n}} \sum\limits_{i=1}^{n} y_i} \right)
</math>
<math>\displaystyle
= E\left(\prod_{i=1}^{n} e^{iz \frac{1}{\sqrt{n}} y_i} \right)
</math>

Ponieważ zmienne <math>y_i</math> są wzajemnie niezależne,

<math>\displaystyle \phi_S(z)= \prod_{i=1}^{n} E\left( e^{i\frac{z}{\sqrt{n}} y_i } \right)
= \prod_{i=1}^{n} \phi_{y_i}\left(\frac{z}{\sqrt{n}}\right)
</math>

Ponieważ zmienne <math>y_i</math> pochodzą z tego samego rozkładu prawdopodobieństwa,

<math>\displaystyle \phi_S(z)=
\prod_{i=1}^{n} \phi_{y_i}\left(\frac{z}{\sqrt{n}}\right) =
\left( \phi_{y_i}\left(\frac{z}{\sqrt{n}}\right) \right)^n =
\left( 1-\frac{(z/\sqrt{n})^{2}}{2}+\cdots \right)^n =
\left( 1-\frac{z^2}{2n}+\cdots \right)^n
</math>

Przy przejściu z <math>n</math> do nieskończoności (i pomijaniu wyrazów rzędu wyższego niż drugi) dostajemy
<center><math>\displaystyle
\phi_y(z)\rightarrow
\underset{n\rightarrow \infty }{\lim }\left(1-\frac{z^2}{2n}\right)^n=
e^{\frac{-z^{2}}{2}}
</math></center>

bo
<math>e^x=\lim_{n\rightarrow\infty} (1+x/n)^n</math>

Pozostaje pokazać, że jest to postać funkcji charakterystycznej rozkładu Gaussa.

====Transformata Fouriera funkcji Gaussa====
Funkcja charakterystyczna rozkładu normalnego o wartości oczekiwanej 0 i jednostkowej wariancji będzie miała postać

<math>
\phi _{x}(t)=
\int\limits_{-\infty}^\infty e^{itx}\frac{1}{\sqrt{2\pi }} e^{\frac{-x^{2}}{2}} dx =
</math>

<math>
\dfrac{1}{\sqrt{2\pi}} \int\limits_{-\infty}^\infty \left( \cos(tx) + i \sin(tx) \right) e^{\frac{-x^2}{2}} dx =
</math>

<math>
\dfrac{1}{\sqrt{2\pi}} \int\limits_{-\infty}^\infty \cos(tx) e^{\frac{-x^2}{2}} dx +
\dfrac{1}{\sqrt{2\pi}} \int\limits_{-\infty}^\infty i \sin(tx) e^{\frac{-x^2}{2}} dx
</math>

ponieważ funkcja <math>\sin(x)</math> jest antysymetryczna, druga całka znika. Dostajemy

<math>
\int\limits_{-\infty}^\infty e^{itx}\frac{1}{\sqrt{2\pi }} e^{\frac{-x^2}{2}} dx =
\dfrac{1}{\sqrt{2\pi}} \int\limits_{-\infty}^\infty \cos(tx) e^{\frac{-x^2}{2}} dx
</math>

Dla części symetrycznej znajdujemy w tablicach całkę oznaczoną

<math>
\int\limits_{0}^{\infty} e^{-a^2 x^2} \cos(b x) dx
=
\frac{ \sqrt{\pi} e^{-\tfrac{b^2}{4a^2}} } {2 a}
</math>

po wymnożeniu przez 2 i podstawieniu <math> b=t</math> i <math>a^2=\frac{1}{2}</math> dostajemy

<math>
\int\limits_{-\infty}^{\infty} e^{-\frac{1}{2} x^2} \cos(t x) dx
=
\frac{ \sqrt{\pi} e^{ -\frac{t^2} { 4 \frac{1}{2} } } } {\frac{1}{\sqrt{2}}}
=
\sqrt{2\pi} e^{-\frac{t^2}{2}}
</math> , czyli

<center><math>\displaystyle
\phi _{x}(t) =
\int\limits_{-\infty}^\infty e^{itx}\frac{1}{\sqrt{2\pi }} e^{\frac{-x^{2}}{2}} dx =
e^{-t^2 / 2}
</math></center>

W analizie sygnałów wynik ten będzie oznaczał, że transformacja Fouriera funkcji Gaussa jest funkcją Gaussa. W tym konkretnym przypadku otrzymaliśmy funkcję tożsamą z funkcją charakterystyczną rozkładu rozważanej sumy zmiennych, czyli rozkład ten będzie (w przypadku granicznym) miał postać funkcji Gaussa.

[[Plik:Ctg.png|300px|thumb|left|<figure id="fig:ctg"></figure>Ilustracja działania Centralnego Twierdzenia Granicznego. Zmienną
<math>x_i</math> bierzemy z rozkładu równomiernego, kolejne histogramy przedstawiają sumę 2, 3 i 4
zmiennych <math>x_i</math> dla 10 000 losowań. Widać dużą zgodność z dopasowanym rozkładem
normalnym (ciągła linia) już dla niewielu sumowanych zmiennych.
]]

<xr id="fig:ctg">Rysunek %i</xr> ilustruje powyższe twierdzenie dla
przypadku sumy zmiennych pochodzących z rozkładu równomiernego. Jak
widać, już dla sumy 3 zmiennych rozkład wydaje się bardzo podobny do
normalnego. Niestety, często istotne bywają różnice dla wartości bardzo dużych lub bardzo małych. Otóż według
[[WnioskowanieStatystyczne/Rozklady-przyklady#label-eq:78|wzoru]] wartości gęstości
prawdopodobieństwa rozkładu normalnego dążą do zera dla dużych
wartości bezwzględnych zmiennej asymptotycznie, lecz zera faktycznie
nie osiągają. Inaczej mówiąc, prawdopodobieństwo wylosowania dowolnie
dużej wartości z rozkładu Gaussa będzie małe, ale nie zerowe. Za to
suma np. czterech zmiennych z rozkładu równomiernego od zera do
jedynki (prawy dolny wykres <xr id="fig:ctg">rys. %i</xr>) nie
przekroczy nigdy wartości 4, czyli prawdopodobieństwo dla
<math>x>4</math> będzie dokładnie zerem. I choć w skali <xr
id="fig:ctg">rysunku %i</xr> efekt ten jest prawie niewidoczny, warto
pamiętać, że testy oparte na założeniu normalności rozkładów często
operują właśnie w okolicach tych "ogonów", gdzie przybliżenie
rozkładu normalnego, uzyskane za pomocą tej prostej procedury,
zawodzi.

-----------------------
<references />

WnioskowanieStatystyczne/CLT

2026-03-05T17:16:37Z

Durka: /* Dowód twierdzenia Lindeberga–Lévy'ego */

[[Wnioskowanie_Statystyczne_-_wykład]]

==Rozkład Gaussa==

Rozkład Gaussa (zwany też rozkładem normalnym lub krzywą dzwonową) zależy od
parametrów <math>\mu</math> i <math>\sigma</math>. Jego gęstość prawdopodobieństwa określona jest wzorem:

<center><math display="block">\displaystyle
p(x)=N(\mu, \sigma)= \frac{1}{\sqrt{2\pi }\sigma }e^{\frac{-(x-\mu )^{2}}{2\sigma ^{2}}}.
</math></center>

Parametry te są tak dobrane, że wartość oczekiwana wynosi
<math>\mu</math>, a wariancja <math>\sigma^2</math>.

[[Plik:Rozklad_gaussa.png|600px|thumb|left|<math>N(0,1)</math>, czyli
standardowy rozkład Gaussa o zerowej średniej (<math>\mu=0</math>) i
jednostkowej wariancji (<math>\sigma=1</math>).]]

Rozkład Gaussa dla zerowej wartości oczekiwanej i jednostkowej
wariancji (<math>\mu=0, \sigma^2=1</math>) zwiemy
''standardowym rozkładem Gaussa''
i oznaczamy zwykle <math>N(0,1)</math>.
Na wykresie zaznaczono na nim m. in. wartość całki od <math>-\infty</math> do
<math>-1</math>, czyli prawdopodobieństwo, że wylosowana z tego
rozkładu liczba będzie mniejsza niż <math>-1</math>. Jak widać, wynosi
ono ok. 16%, a jeśli weźmiemy pod uwagę również wartości większe od 1,
będzie to aż 32%! Oznacza to, że przy losowaniu wielu liczb z tego
rozkładu niemal 1/3 wyników może znaleźć się w odległości
większej niż <math>\sigma</math> od wartości oczekiwanej.

<equation id="eq:80">
<math>
x\in N(\mu,\sigma)\quad \Rightarrow \quad
\begin{cases}
P(\left| x-\mu \right| \geq \sigma )\approx 0,\!317,\\
P(\left| x-\mu \right| \geq 2\sigma )\ \approx 0,\!046,\\
\ P(\left| x-\mu \right| \geq 3\sigma )\approx 0,\!003.
\end{cases}
</math>
</equation>



Rozkład Gaussa pełni w statystyce bardzo znaczącą rolę ze względu na ''Centralne Twierdzenie Graniczne'', mówiące o asysmptotycznym rozkładzie sumy dużej liczby niezależnych zmiennych losowych, których rozkłady spełniają pewne warunki. Udowodnimy je w najprostszym przypadku, kiedy wszystkie te zmienne pochodzą z tego samego rozkładu gęstości prawdopodobieństwa. Na potrzeby tego dowodu musimy najpierw wprowadzić pojęcie funkcji charakterystycznej.



==Funkcja charakterystyczna rozkładu prawdopodobieństwa==

Dla zmiennej losowej <math>z</math> jest to wartość oczekiwana wyrażenia <math>e^{itz}</math>, gdzie <math>i=\sqrt{-1}</math>. Dla rozkładów ciągłych jest to [[Przekształcenie_Fouriera|transformata Fouriera]] funkcji gęstości prawdopodobieństwa <math>f(z)</math>:
<center><math>\displaystyle
\phi_z (t)=E(e^{itz})=\underset{-\infty }{\overset{\infty }{\int }}
e^{itz}f\left( z\right) dz
</math></center>
Użyteczne będą poniższe związki, które wyprowadzić można bezpośrednio z definicji:

====Funkcja charakterystyczna rozkładu sumy zmiennych niezależnych====
Dla ''niezależnych'' zmiennych <math>x</math> i <math>y</math>:
<equation id="eq:85">
<center>
<math>
z=x+y\Rightarrow \phi_{z}(t)
=\phi_{x}\left( t\right) \cdot \phi_{y}(t).
</math>
</center>
</equation>

Dowód:

<math>
\phi _{z}(t)
= E(e^{it(x+y)})=E(e^{itx}\cdot e^{ity})
= E(e^{itx})\cdot E(e^{ity})=\phi _{x}\left( t\right) \cdot \phi_{y}(t).
</math>

====Pochodna funkcji charakterystycznej====
Bezpośrednio z definicji — różniczkujemy po <math>dt</math>, więc przy każdym różniczkowaniu spada nam z wykładnika <math>i z</math>, <math>z</math> zostaje pod całką a <math>i</math> jako stała wychodzi przed całkę — widać, że:
<equation id="eq:pochodna_funkcji_tworzacej">
<center><math>\displaystyle
\frac{d^{n}\phi (t)}{dt^{n}}=i^{n}\underset{}{\underset{-\infty }{\overset{
\infty }{\int }}z^{n}}\ e^{itz}f(z) dz
</math></center>
</equation>

====Związek pochodnej funkcji charakterystycznej z momentami zmiennej losowej====
<math>n</math>-ta pochodna funkcji charakterystycznej w zerze (czyli dla <math>t=0</math>) wynosi
<equation id="eq:84">
<center><math>\displaystyle
\phi^{(n)}(0)=
i^{n}\underset{}{\underset{-\infty }{\overset{\infty }{\int }}z^{n}}\ e^{i 0 x} f(z) dz =
i^{n}\underset{}{\underset{-\infty }{\overset{\infty }{\int }}z^{n}} f(z) dz =
i^{n}E(z^{n})
</math></center>
</equation>

==Twierdzenie Lindeberga–Lévy'ego==
Zakładamy, że <math>x_{i}</math> są niezależnymi zmiennymi podlegającymi (dowolnemu) rozkładowi o skończonej wartości oczekiwanej <math>\mu</math> i wariancji <math>\sigma^{2}</math>, czyli wszystkie sumowane zmienne <math>x_i</math> pochodzą z tego samego rozkładu prawdopodobieństwa, o którym nie zakładamy nic ponad to, że ma skończone <math>\mu</math> i <math>\sigma</math>.
Wielkość

<center>
<equation id="eq:82"> <math>
S=\dfrac{ \sum\limits_{i=1}^{n}x_{i}\; -\; n\mu}{\sigma \sqrt{n}}
</math> </equation>
</center>

dla <math>n\rightarrow \infty</math> zbiega do rozkładu normalnego o zerowej wartości średniej i jednostkowej wariancji.

===Dowód twierdzenia Lindeberga–Lévy'ego===
Rozważmy zmienną <math>y_i</math> o zerowej wartości oczekiwanej i jednostkowej wariancji
<center><math>
y_{i} = \dfrac{x_{i}-\mu}{\sigma} .
</math></center>

Funkcję charakterystyczną rozkładu zmiennej <math>y_i</math>
<center><math>\phi_{y_i}(z) = E(e^{i z y_i}) </math></center>
możemy rozwinąć w szereg Taylora wokół <math>z=0</math><equation id="eq:86">
<center><math>\displaystyle
\phi_{y_i}(z)=\underset{n=0}{\overset{\infty }{\sum }}\frac{\phi^{(n)}(0)}{n!}z^n
</math></center>
</equation>
Z wyprowadzonej wcześniej własności funkcji charakterystycznej <xr id="eq:84">(%i)</xr>
<math>
\phi^{(n)}(0)=
i^{n}E(z^{n})
</math>
wynika, że

<math>\phi_{y_i}^{(0)}(0)= i^0 E(x^0) = 1</math>,

<math>\phi_{y_i}^{(1)}(0) = i^1 E(x^1) = i E(x) = 0</math> (wartość oczekiwana <math> y_i</math>),

<math>\phi_{y_i}^{(2)}(0)= i^2 E(x^2) = -1</math> (<math>i^2</math> * wariancja),

czyli funkcja charakterystyczna zmiennej <math>y_i</math> rozwinięta w szereg Taylora <xr id="eq:86">(%i)</xr> do wyrazów drugiego rzędu będzie miała postać
<equation id="eq:87">
<center><math>\displaystyle
\phi_{y_i}(z)=1-\frac{z^{2}}{2}+\cdots .
</math></center>
</equation>

Wrócmy do występującej w twierdzeniu sumy <math>S</math>

<math>
S=\dfrac{ \sum\limits_{i=1}^{n}x_{i}\; -\; n\mu}{\sigma \sqrt{n}} =
\dfrac{1}{\sigma \sqrt{n}} \sum\limits_{i=1}^{n}(x_{i} -\mu) =
\dfrac{1}{\sqrt{n}} \sum\limits_{i=1}^{n}\dfrac{x_{i} -\mu}{\sigma}
= \dfrac{1}{\sqrt{n}} \sum\limits_{i=1}^{n} y_i
</math>

Jej funkcja charakterystyczna

<math>\phi_S(z) = E(e^{izS}) = E\left(e^{iz \frac{1}{\sqrt{n}} \sum\limits_{i=1}^{n} y_i} \right)
</math>
<math>
= E\left(\prod_{i=1}^{n} e^{iz \frac{1}{\sqrt{n}} y_i} \right)
</math>

ponieważ zmienne <math>y_i</math> są wzajemnie niezależne,

<math>\phi_S(z)= \prod_{i=1}^{n} E\left( e^{i\frac{z}{\sqrt{n}} y_i } \right)
= \prod_{i=1}^{n} \phi_{y_i}\left(\frac{z}{\sqrt{n}}\right)
</math>

ponieważ zmienne <math>y_i</math> pochodzą z tego samego rozkładu prawdopodobieństwa,

<math>\phi_S(z)=
\prod_{i=1}^{n} \phi_{y_i}\left(\frac{z}{\sqrt{n}}\right) =
\left( \phi_{y_i}\left(\frac{z}{\sqrt{n}}\right) \right)^n =
\left( 1-\frac{(z/\sqrt{n})^{2}}{2}+\cdots \right)^n =
\left( 1-\frac{z^2}{2n}+\cdots \right)^n
</math>

Przy przejściu z <math>n</math> do nieskończoności (i pomijaniu wyrazów rzędu wyższego niż drugi) dostajemy
<center><math>
\phi_y(z)\rightarrow
\underset{n\rightarrow \infty }{\lim }\left(1-\frac{z^2}{2n}\right)^n=
e^{\frac{-z^{2}}{2}}
</math></center>

bo
<math>e^x=\lim_{n\rightarrow\infty} (1+x/n)^n</math>

Pozostaje pokazać, że jest to postać funkcji charakterystycznej rozkładu Gaussa.

====Transformata Fouriera funkcji Gaussa====
Funkcja charakterystyczna rozkładu normalnego o wartości oczekiwanej 0 i jednostkowej wariancji będzie miała postać

<math>
\phi _{x}(t)=
\int\limits_{-\infty}^\infty e^{itx}\frac{1}{\sqrt{2\pi }} e^{\frac{-x^{2}}{2}} dx =
</math>

<math>
\dfrac{1}{\sqrt{2\pi}} \int\limits_{-\infty}^\infty \left( \cos(tx) + i \sin(tx) \right) e^{\frac{-x^2}{2}} dx =
</math>

<math>
\dfrac{1}{\sqrt{2\pi}} \int\limits_{-\infty}^\infty \cos(tx) e^{\frac{-x^2}{2}} dx +
\dfrac{1}{\sqrt{2\pi}} \int\limits_{-\infty}^\infty i \sin(tx) e^{\frac{-x^2}{2}} dx
</math>

ponieważ funkcja <math>\sin(x)</math> jest antysymetryczna, druga całka znika. Dostajemy

<math>
\int\limits_{-\infty}^\infty e^{itx}\frac{1}{\sqrt{2\pi }} e^{\frac{-x^2}{2}} dx =
\dfrac{1}{\sqrt{2\pi}} \int\limits_{-\infty}^\infty \cos(tx) e^{\frac{-x^2}{2}} dx
</math>

Dla części symetrycznej znajdujemy w tablicach całkę oznaczoną

<math>
\int\limits_{0}^{\infty} e^{-a^2 x^2} \cos(b x) dx
=
\frac{ \sqrt{\pi} e^{-\tfrac{b^2}{4a^2}} } {2 a}
</math>

po wymnożeniu przez 2 i podstawieniu <math> b=t</math> i <math>a^2=\frac{1}{2}</math> dostajemy

<math>
\int\limits_{-\infty}^{\infty} e^{-\frac{1}{2} x^2} \cos(t x) dx
=
\frac{ \sqrt{\pi} e^{ -\frac{t^2} { 4 \frac{1}{2} } } } {\frac{1}{\sqrt{2}}}
=
\sqrt{2\pi} e^{-\frac{t^2}{2}}
</math> , czyli

<center><math>
\phi _{x}(t) =
\int\limits_{-\infty}^\infty e^{itx}\frac{1}{\sqrt{2\pi }} e^{\frac{-x^{2}}{2}} dx =
e^{-t^2 / 2}
</math></center>

W analizie sygnałów wynik ten będzie oznaczał, że transformacja Fouriera funkcji Gaussa jest funkcją Gaussa. W tym konkretnym przypadku otrzymaliśmy funkcję tożsamą z funkcją charakterystyczną rozkładu rozważanej sumy zmiennych, czyli rozkład ten będzie (w przypadku granicznym) miał postać funkcji Gaussa.

[[Plik:Ctg.png|300px|thumb|left|<figure id="fig:ctg"></figure>Ilustracja działania Centralnego Twierdzenia Granicznego. Zmienną
<math>x_i</math> bierzemy z rozkładu równomiernego, kolejne histogramy przedstawiają sumę 2, 3 i 4
zmiennych <math>x_i</math> dla 10 000 losowań. Widać dużą zgodność z dopasowanym rozkładem
normalnym (ciągła linia) już dla niewielu sumowanych zmiennych.
]]

<xr id="fig:ctg">Rysunek %i</xr> ilustruje powyższe twierdzenie dla
przypadku sumy zmiennych pochodzących z rozkładu równomiernego. Jak
widać, już dla sumy 3 zmiennych rozkład wydaje się bardzo podobny do
normalnego. Niestety, często istotne bywają różnice dla wartości bardzo dużych lub bardzo małych. Otóż według
[[WnioskowanieStatystyczne/Rozklady-przyklady#label-eq:78|wzoru]] wartości gęstości
prawdopodobieństwa rozkładu normalnego dążą do zera dla dużych
wartości bezwzględnych zmiennej asymptotycznie, lecz zera faktycznie
nie osiągają. Inaczej mówiąc, prawdopodobieństwo wylosowania dowolnie
dużej wartości z rozkładu Gaussa będzie małe, ale nie zerowe. Za to
suma np. czterech zmiennych z rozkładu równomiernego od zera do
jedynki (prawy dolny wykres <xr id="fig:ctg">rys. %i</xr>) nie
przekroczy nigdy wartości 4, czyli prawdopodobieństwo dla
<math>x>4</math> będzie dokładnie zerem. I choć w skali <xr
id="fig:ctg">rysunku %i</xr> efekt ten jest prawie niewidoczny, warto
pamiętać, że testy oparte na założeniu normalności rozkładów często
operują właśnie w okolicach tych "ogonów", gdzie przybliżenie
rozkładu normalnego, uzyskane za pomocą tej prostej procedury,
zawodzi.

-----------------------
<references />

WnioskowanieStatystyczne/CLT

2026-03-05T17:16:02Z

Durka: /* Dowód twierdzenia Lindeberga–Lévy'ego */

[[Wnioskowanie_Statystyczne_-_wykład]]

==Rozkład Gaussa==

Rozkład Gaussa (zwany też rozkładem normalnym lub krzywą dzwonową) zależy od
parametrów <math>\mu</math> i <math>\sigma</math>. Jego gęstość prawdopodobieństwa określona jest wzorem:

<center><math display="block">\displaystyle
p(x)=N(\mu, \sigma)= \frac{1}{\sqrt{2\pi }\sigma }e^{\frac{-(x-\mu )^{2}}{2\sigma ^{2}}}.
</math></center>

Parametry te są tak dobrane, że wartość oczekiwana wynosi
<math>\mu</math>, a wariancja <math>\sigma^2</math>.

[[Plik:Rozklad_gaussa.png|600px|thumb|left|<math>N(0,1)</math>, czyli
standardowy rozkład Gaussa o zerowej średniej (<math>\mu=0</math>) i
jednostkowej wariancji (<math>\sigma=1</math>).]]

Rozkład Gaussa dla zerowej wartości oczekiwanej i jednostkowej
wariancji (<math>\mu=0, \sigma^2=1</math>) zwiemy
''standardowym rozkładem Gaussa''
i oznaczamy zwykle <math>N(0,1)</math>.
Na wykresie zaznaczono na nim m. in. wartość całki od <math>-\infty</math> do
<math>-1</math>, czyli prawdopodobieństwo, że wylosowana z tego
rozkładu liczba będzie mniejsza niż <math>-1</math>. Jak widać, wynosi
ono ok. 16%, a jeśli weźmiemy pod uwagę również wartości większe od 1,
będzie to aż 32%! Oznacza to, że przy losowaniu wielu liczb z tego
rozkładu niemal 1/3 wyników może znaleźć się w odległości
większej niż <math>\sigma</math> od wartości oczekiwanej.

<equation id="eq:80">
<math>
x\in N(\mu,\sigma)\quad \Rightarrow \quad
\begin{cases}
P(\left| x-\mu \right| \geq \sigma )\approx 0,\!317,\\
P(\left| x-\mu \right| \geq 2\sigma )\ \approx 0,\!046,\\
\ P(\left| x-\mu \right| \geq 3\sigma )\approx 0,\!003.
\end{cases}
</math>
</equation>



Rozkład Gaussa pełni w statystyce bardzo znaczącą rolę ze względu na ''Centralne Twierdzenie Graniczne'', mówiące o asysmptotycznym rozkładzie sumy dużej liczby niezależnych zmiennych losowych, których rozkłady spełniają pewne warunki. Udowodnimy je w najprostszym przypadku, kiedy wszystkie te zmienne pochodzą z tego samego rozkładu gęstości prawdopodobieństwa. Na potrzeby tego dowodu musimy najpierw wprowadzić pojęcie funkcji charakterystycznej.



==Funkcja charakterystyczna rozkładu prawdopodobieństwa==

Dla zmiennej losowej <math>z</math> jest to wartość oczekiwana wyrażenia <math>e^{itz}</math>, gdzie <math>i=\sqrt{-1}</math>. Dla rozkładów ciągłych jest to [[Przekształcenie_Fouriera|transformata Fouriera]] funkcji gęstości prawdopodobieństwa <math>f(z)</math>:
<center><math>\displaystyle
\phi_z (t)=E(e^{itz})=\underset{-\infty }{\overset{\infty }{\int }}
e^{itz}f\left( z\right) dz
</math></center>
Użyteczne będą poniższe związki, które wyprowadzić można bezpośrednio z definicji:

====Funkcja charakterystyczna rozkładu sumy zmiennych niezależnych====
Dla ''niezależnych'' zmiennych <math>x</math> i <math>y</math>:
<equation id="eq:85">
<center>
<math>
z=x+y\Rightarrow \phi_{z}(t)
=\phi_{x}\left( t\right) \cdot \phi_{y}(t).
</math>
</center>
</equation>

Dowód:

<math>
\phi _{z}(t)
= E(e^{it(x+y)})=E(e^{itx}\cdot e^{ity})
= E(e^{itx})\cdot E(e^{ity})=\phi _{x}\left( t\right) \cdot \phi_{y}(t).
</math>

====Pochodna funkcji charakterystycznej====
Bezpośrednio z definicji — różniczkujemy po <math>dt</math>, więc przy każdym różniczkowaniu spada nam z wykładnika <math>i z</math>, <math>z</math> zostaje pod całką a <math>i</math> jako stała wychodzi przed całkę — widać, że:
<equation id="eq:pochodna_funkcji_tworzacej">
<center><math>\displaystyle
\frac{d^{n}\phi (t)}{dt^{n}}=i^{n}\underset{}{\underset{-\infty }{\overset{
\infty }{\int }}z^{n}}\ e^{itz}f(z) dz
</math></center>
</equation>

====Związek pochodnej funkcji charakterystycznej z momentami zmiennej losowej====
<math>n</math>-ta pochodna funkcji charakterystycznej w zerze (czyli dla <math>t=0</math>) wynosi
<equation id="eq:84">
<center><math>\displaystyle
\phi^{(n)}(0)=
i^{n}\underset{}{\underset{-\infty }{\overset{\infty }{\int }}z^{n}}\ e^{i 0 x} f(z) dz =
i^{n}\underset{}{\underset{-\infty }{\overset{\infty }{\int }}z^{n}} f(z) dz =
i^{n}E(z^{n})
</math></center>
</equation>

==Twierdzenie Lindeberga–Lévy'ego==
Zakładamy, że <math>x_{i}</math> są niezależnymi zmiennymi podlegającymi (dowolnemu) rozkładowi o skończonej wartości oczekiwanej <math>\mu</math> i wariancji <math>\sigma^{2}</math>, czyli wszystkie sumowane zmienne <math>x_i</math> pochodzą z tego samego rozkładu prawdopodobieństwa, o którym nie zakładamy nic ponad to, że ma skończone <math>\mu</math> i <math>\sigma</math>.
Wielkość

<center>
<equation id="eq:82"> <math>
S=\dfrac{ \sum\limits_{i=1}^{n}x_{i}\; -\; n\mu}{\sigma \sqrt{n}}
</math> </equation>
</center>

dla <math>n\rightarrow \infty</math> zbiega do rozkładu normalnego o zerowej wartości średniej i jednostkowej wariancji.

===Dowód twierdzenia Lindeberga–Lévy'ego===
Rozważmy zmienną <math>y_i</math> o zerowej wartości oczekiwanej i jednostkowej wariancji
<center><math>
y_{i} = \dfrac{x_{i}-\mu}{\sigma} .
</math></center>

Funkcję charakterystyczną rozkładu zmiennej <math>y_i</math>
<center><math>\phi_{y_i}(z) = E(e^{i z y_i}) </math></center>
możemy rozwinąć w szereg Taylora wokół <math>z=0</math><equation id="eq:86">
<center><math>\displaystyle
\phi_{y_i}(z)=\underset{n=0}{\overset{\infty }{\sum }}\frac{\phi^{(n)}(0)}{n!}z^n
</math></center>
</equation>
Z wyprowadzonej wcześniej własności funkcji charakterystycznej <xr id="eq:84">(%i)</xr>
<math>
\phi^{(n)}(0)=
i^{n}E(z^{n})
</math>
wynika, że

<math>\phi_{y_i}^{(0)}(0)= i^0 E(x^0) = 1</math>,

<math>\phi_{y_i}^{(1)}(0) = i^1 E(x^1) = i E(x) = 0</math> (wartość oczekiwana <math> y_i</math>),

<math>\phi_{y_i}^{(2)}(0)= i^2 E(x^2) = -1</math> (<math>i^2</math> * wariancja),

czyli funkcja charakterystyczna zmiennej <math>y_i</math> rozwinięta w szereg Taylora <xr id="eq:86">(%i)</xr> do wyrazów drugiego rzędu będzie miała postać
<equation id="eq:87">
<center><math>
\phi_{y_i}(z)=1-\frac{z^{2}}{2}+\cdots .
</math></center>
</equation>

Wrócmy do występującej w twierdzeniu sumy <math>S</math>

<math>
S=\dfrac{ \sum\limits_{i=1}^{n}x_{i}\; -\; n\mu}{\sigma \sqrt{n}} =
\dfrac{1}{\sigma \sqrt{n}} \sum\limits_{i=1}^{n}(x_{i} -\mu) =
\dfrac{1}{\sqrt{n}} \sum\limits_{i=1}^{n}\dfrac{x_{i} -\mu}{\sigma}
= \dfrac{1}{\sqrt{n}} \sum\limits_{i=1}^{n} y_i
</math>

Jej funkcja charakterystyczna

<math>\phi_S(z) = E(e^{izS}) = E\left(e^{iz \frac{1}{\sqrt{n}} \sum\limits_{i=1}^{n} y_i} \right)
</math>
<math>
= E\left(\prod_{i=1}^{n} e^{iz \frac{1}{\sqrt{n}} y_i} \right)
</math>

ponieważ zmienne <math>y_i</math> są wzajemnie niezależne,

<math>\phi_S(z)= \prod_{i=1}^{n} E\left( e^{i\frac{z}{\sqrt{n}} y_i } \right)
= \prod_{i=1}^{n} \phi_{y_i}\left(\frac{z}{\sqrt{n}}\right)
</math>

ponieważ zmienne <math>y_i</math> pochodzą z tego samego rozkładu prawdopodobieństwa,

<math>\phi_S(z)=
\prod_{i=1}^{n} \phi_{y_i}\left(\frac{z}{\sqrt{n}}\right) =
\left( \phi_{y_i}\left(\frac{z}{\sqrt{n}}\right) \right)^n =
\left( 1-\frac{(z/\sqrt{n})^{2}}{2}+\cdots \right)^n =
\left( 1-\frac{z^2}{2n}+\cdots \right)^n
</math>

Przy przejściu z <math>n</math> do nieskończoności (i pomijaniu wyrazów rzędu wyższego niż drugi) dostajemy
<center><math>
\phi_y(z)\rightarrow
\underset{n\rightarrow \infty }{\lim }\left(1-\frac{z^2}{2n}\right)^n=
e^{\frac{-z^{2}}{2}}
</math></center>

bo
<math>e^x=\lim_{n\rightarrow\infty} (1+x/n)^n</math>

Pozostaje pokazać, że jest to postać funkcji charakterystycznej rozkładu Gaussa.

====Transformata Fouriera funkcji Gaussa====
Funkcja charakterystyczna rozkładu normalnego o wartości oczekiwanej 0 i jednostkowej wariancji będzie miała postać

<math>
\phi _{x}(t)=
\int\limits_{-\infty}^\infty e^{itx}\frac{1}{\sqrt{2\pi }} e^{\frac{-x^{2}}{2}} dx =
</math>

<math>
\dfrac{1}{\sqrt{2\pi}} \int\limits_{-\infty}^\infty \left( \cos(tx) + i \sin(tx) \right) e^{\frac{-x^2}{2}} dx =
</math>

<math>
\dfrac{1}{\sqrt{2\pi}} \int\limits_{-\infty}^\infty \cos(tx) e^{\frac{-x^2}{2}} dx +
\dfrac{1}{\sqrt{2\pi}} \int\limits_{-\infty}^\infty i \sin(tx) e^{\frac{-x^2}{2}} dx
</math>

ponieważ funkcja <math>\sin(x)</math> jest antysymetryczna, druga całka znika. Dostajemy

<math>
\int\limits_{-\infty}^\infty e^{itx}\frac{1}{\sqrt{2\pi }} e^{\frac{-x^2}{2}} dx =
\dfrac{1}{\sqrt{2\pi}} \int\limits_{-\infty}^\infty \cos(tx) e^{\frac{-x^2}{2}} dx
</math>

Dla części symetrycznej znajdujemy w tablicach całkę oznaczoną

<math>
\int\limits_{0}^{\infty} e^{-a^2 x^2} \cos(b x) dx
=
\frac{ \sqrt{\pi} e^{-\tfrac{b^2}{4a^2}} } {2 a}
</math>

po wymnożeniu przez 2 i podstawieniu <math> b=t</math> i <math>a^2=\frac{1}{2}</math> dostajemy

<math>
\int\limits_{-\infty}^{\infty} e^{-\frac{1}{2} x^2} \cos(t x) dx
=
\frac{ \sqrt{\pi} e^{ -\frac{t^2} { 4 \frac{1}{2} } } } {\frac{1}{\sqrt{2}}}
=
\sqrt{2\pi} e^{-\frac{t^2}{2}}
</math> , czyli

<center><math>
\phi _{x}(t) =
\int\limits_{-\infty}^\infty e^{itx}\frac{1}{\sqrt{2\pi }} e^{\frac{-x^{2}}{2}} dx =
e^{-t^2 / 2}
</math></center>

W analizie sygnałów wynik ten będzie oznaczał, że transformacja Fouriera funkcji Gaussa jest funkcją Gaussa. W tym konkretnym przypadku otrzymaliśmy funkcję tożsamą z funkcją charakterystyczną rozkładu rozważanej sumy zmiennych, czyli rozkład ten będzie (w przypadku granicznym) miał postać funkcji Gaussa.

[[Plik:Ctg.png|300px|thumb|left|<figure id="fig:ctg"></figure>Ilustracja działania Centralnego Twierdzenia Granicznego. Zmienną
<math>x_i</math> bierzemy z rozkładu równomiernego, kolejne histogramy przedstawiają sumę 2, 3 i 4
zmiennych <math>x_i</math> dla 10 000 losowań. Widać dużą zgodność z dopasowanym rozkładem
normalnym (ciągła linia) już dla niewielu sumowanych zmiennych.
]]

<xr id="fig:ctg">Rysunek %i</xr> ilustruje powyższe twierdzenie dla
przypadku sumy zmiennych pochodzących z rozkładu równomiernego. Jak
widać, już dla sumy 3 zmiennych rozkład wydaje się bardzo podobny do
normalnego. Niestety, często istotne bywają różnice dla wartości bardzo dużych lub bardzo małych. Otóż według
[[WnioskowanieStatystyczne/Rozklady-przyklady#label-eq:78|wzoru]] wartości gęstości
prawdopodobieństwa rozkładu normalnego dążą do zera dla dużych
wartości bezwzględnych zmiennej asymptotycznie, lecz zera faktycznie
nie osiągają. Inaczej mówiąc, prawdopodobieństwo wylosowania dowolnie
dużej wartości z rozkładu Gaussa będzie małe, ale nie zerowe. Za to
suma np. czterech zmiennych z rozkładu równomiernego od zera do
jedynki (prawy dolny wykres <xr id="fig:ctg">rys. %i</xr>) nie
przekroczy nigdy wartości 4, czyli prawdopodobieństwo dla
<math>x>4</math> będzie dokładnie zerem. I choć w skali <xr
id="fig:ctg">rysunku %i</xr> efekt ten jest prawie niewidoczny, warto
pamiętać, że testy oparte na założeniu normalności rozkładów często
operują właśnie w okolicach tych "ogonów", gdzie przybliżenie
rozkładu normalnego, uzyskane za pomocą tej prostej procedury,
zawodzi.

-----------------------
<references />

WnioskowanieStatystyczne/CLT

2026-03-05T17:15:32Z

Durka: /* Dowód twierdzenia Lindeberga–Lévy'ego */

[[Wnioskowanie_Statystyczne_-_wykład]]

==Rozkład Gaussa==

Rozkład Gaussa (zwany też rozkładem normalnym lub krzywą dzwonową) zależy od
parametrów <math>\mu</math> i <math>\sigma</math>. Jego gęstość prawdopodobieństwa określona jest wzorem:

<center><math display="block">\displaystyle
p(x)=N(\mu, \sigma)= \frac{1}{\sqrt{2\pi }\sigma }e^{\frac{-(x-\mu )^{2}}{2\sigma ^{2}}}.
</math></center>

Parametry te są tak dobrane, że wartość oczekiwana wynosi
<math>\mu</math>, a wariancja <math>\sigma^2</math>.

[[Plik:Rozklad_gaussa.png|600px|thumb|left|<math>N(0,1)</math>, czyli
standardowy rozkład Gaussa o zerowej średniej (<math>\mu=0</math>) i
jednostkowej wariancji (<math>\sigma=1</math>).]]

Rozkład Gaussa dla zerowej wartości oczekiwanej i jednostkowej
wariancji (<math>\mu=0, \sigma^2=1</math>) zwiemy
''standardowym rozkładem Gaussa''
i oznaczamy zwykle <math>N(0,1)</math>.
Na wykresie zaznaczono na nim m. in. wartość całki od <math>-\infty</math> do
<math>-1</math>, czyli prawdopodobieństwo, że wylosowana z tego
rozkładu liczba będzie mniejsza niż <math>-1</math>. Jak widać, wynosi
ono ok. 16%, a jeśli weźmiemy pod uwagę również wartości większe od 1,
będzie to aż 32%! Oznacza to, że przy losowaniu wielu liczb z tego
rozkładu niemal 1/3 wyników może znaleźć się w odległości
większej niż <math>\sigma</math> od wartości oczekiwanej.

<equation id="eq:80">
<math>
x\in N(\mu,\sigma)\quad \Rightarrow \quad
\begin{cases}
P(\left| x-\mu \right| \geq \sigma )\approx 0,\!317,\\
P(\left| x-\mu \right| \geq 2\sigma )\ \approx 0,\!046,\\
\ P(\left| x-\mu \right| \geq 3\sigma )\approx 0,\!003.
\end{cases}
</math>
</equation>



Rozkład Gaussa pełni w statystyce bardzo znaczącą rolę ze względu na ''Centralne Twierdzenie Graniczne'', mówiące o asysmptotycznym rozkładzie sumy dużej liczby niezależnych zmiennych losowych, których rozkłady spełniają pewne warunki. Udowodnimy je w najprostszym przypadku, kiedy wszystkie te zmienne pochodzą z tego samego rozkładu gęstości prawdopodobieństwa. Na potrzeby tego dowodu musimy najpierw wprowadzić pojęcie funkcji charakterystycznej.



==Funkcja charakterystyczna rozkładu prawdopodobieństwa==

Dla zmiennej losowej <math>z</math> jest to wartość oczekiwana wyrażenia <math>e^{itz}</math>, gdzie <math>i=\sqrt{-1}</math>. Dla rozkładów ciągłych jest to [[Przekształcenie_Fouriera|transformata Fouriera]] funkcji gęstości prawdopodobieństwa <math>f(z)</math>:
<center><math>\displaystyle
\phi_z (t)=E(e^{itz})=\underset{-\infty }{\overset{\infty }{\int }}
e^{itz}f\left( z\right) dz
</math></center>
Użyteczne będą poniższe związki, które wyprowadzić można bezpośrednio z definicji:

====Funkcja charakterystyczna rozkładu sumy zmiennych niezależnych====
Dla ''niezależnych'' zmiennych <math>x</math> i <math>y</math>:
<equation id="eq:85">
<center>
<math>
z=x+y\Rightarrow \phi_{z}(t)
=\phi_{x}\left( t\right) \cdot \phi_{y}(t).
</math>
</center>
</equation>

Dowód:

<math>
\phi _{z}(t)
= E(e^{it(x+y)})=E(e^{itx}\cdot e^{ity})
= E(e^{itx})\cdot E(e^{ity})=\phi _{x}\left( t\right) \cdot \phi_{y}(t).
</math>

====Pochodna funkcji charakterystycznej====
Bezpośrednio z definicji — różniczkujemy po <math>dt</math>, więc przy każdym różniczkowaniu spada nam z wykładnika <math>i z</math>, <math>z</math> zostaje pod całką a <math>i</math> jako stała wychodzi przed całkę — widać, że:
<equation id="eq:pochodna_funkcji_tworzacej">
<center><math>\displaystyle
\frac{d^{n}\phi (t)}{dt^{n}}=i^{n}\underset{}{\underset{-\infty }{\overset{
\infty }{\int }}z^{n}}\ e^{itz}f(z) dz
</math></center>
</equation>

====Związek pochodnej funkcji charakterystycznej z momentami zmiennej losowej====
<math>n</math>-ta pochodna funkcji charakterystycznej w zerze (czyli dla <math>t=0</math>) wynosi
<equation id="eq:84">
<center><math>\displaystyle
\phi^{(n)}(0)=
i^{n}\underset{}{\underset{-\infty }{\overset{\infty }{\int }}z^{n}}\ e^{i 0 x} f(z) dz =
i^{n}\underset{}{\underset{-\infty }{\overset{\infty }{\int }}z^{n}} f(z) dz =
i^{n}E(z^{n})
</math></center>
</equation>

==Twierdzenie Lindeberga–Lévy'ego==
Zakładamy, że <math>x_{i}</math> są niezależnymi zmiennymi podlegającymi (dowolnemu) rozkładowi o skończonej wartości oczekiwanej <math>\mu</math> i wariancji <math>\sigma^{2}</math>, czyli wszystkie sumowane zmienne <math>x_i</math> pochodzą z tego samego rozkładu prawdopodobieństwa, o którym nie zakładamy nic ponad to, że ma skończone <math>\mu</math> i <math>\sigma</math>.
Wielkość

<center>
<equation id="eq:82"> <math>
S=\dfrac{ \sum\limits_{i=1}^{n}x_{i}\; -\; n\mu}{\sigma \sqrt{n}}
</math> </equation>
</center>

dla <math>n\rightarrow \infty</math> zbiega do rozkładu normalnego o zerowej wartości średniej i jednostkowej wariancji.

===Dowód twierdzenia Lindeberga–Lévy'ego===
Rozważmy zmienną <math>y_i</math> o zerowej wartości oczekiwanej i jednostkowej wariancji
<center><math>
y_{i} = \dfrac{x_{i}-\mu}{\sigma} .
</math></center>

Funkcję charakterystyczną rozkładu zmiennej <math>y_i</math>
<center><math>\phi_{y_i}(z) = E(e^{i z y_i}) </math></center>
możemy rozwinąć w szereg Taylora wokół <math>z=0</math>\displaystyle
<equation id="eq:86">
<center><math>
\phi_{y_i}(z)=\underset{n=0}{\overset{\infty }{\sum }}\frac{\phi^{(n)}(0)}{n!}z^n
</math></center>
</equation>
Z wyprowadzonej wcześniej własności funkcji charakterystycznej <xr id="eq:84">(%i)</xr>
<math>
\phi^{(n)}(0)=
i^{n}E(z^{n})
</math>
wynika, że

<math>\phi_{y_i}^{(0)}(0)= i^0 E(x^0) = 1</math>,

<math>\phi_{y_i}^{(1)}(0) = i^1 E(x^1) = i E(x) = 0</math> (wartość oczekiwana <math> y_i</math>),

<math>\phi_{y_i}^{(2)}(0)= i^2 E(x^2) = -1</math> (<math>i^2</math> * wariancja),

czyli funkcja charakterystyczna zmiennej <math>y_i</math> rozwinięta w szereg Taylora <xr id="eq:86">(%i)</xr> do wyrazów drugiego rzędu będzie miała postać
<equation id="eq:87">
<center><math>
\phi_{y_i}(z)=1-\frac{z^{2}}{2}+\cdots .
</math></center>
</equation>

Wrócmy do występującej w twierdzeniu sumy <math>S</math>

<math>
S=\dfrac{ \sum\limits_{i=1}^{n}x_{i}\; -\; n\mu}{\sigma \sqrt{n}} =
\dfrac{1}{\sigma \sqrt{n}} \sum\limits_{i=1}^{n}(x_{i} -\mu) =
\dfrac{1}{\sqrt{n}} \sum\limits_{i=1}^{n}\dfrac{x_{i} -\mu}{\sigma}
= \dfrac{1}{\sqrt{n}} \sum\limits_{i=1}^{n} y_i
</math>

Jej funkcja charakterystyczna

<math>\phi_S(z) = E(e^{izS}) = E\left(e^{iz \frac{1}{\sqrt{n}} \sum\limits_{i=1}^{n} y_i} \right)
</math>
<math>
= E\left(\prod_{i=1}^{n} e^{iz \frac{1}{\sqrt{n}} y_i} \right)
</math>

ponieważ zmienne <math>y_i</math> są wzajemnie niezależne,

<math>\phi_S(z)= \prod_{i=1}^{n} E\left( e^{i\frac{z}{\sqrt{n}} y_i } \right)
= \prod_{i=1}^{n} \phi_{y_i}\left(\frac{z}{\sqrt{n}}\right)
</math>

ponieważ zmienne <math>y_i</math> pochodzą z tego samego rozkładu prawdopodobieństwa,

<math>\phi_S(z)=
\prod_{i=1}^{n} \phi_{y_i}\left(\frac{z}{\sqrt{n}}\right) =
\left( \phi_{y_i}\left(\frac{z}{\sqrt{n}}\right) \right)^n =
\left( 1-\frac{(z/\sqrt{n})^{2}}{2}+\cdots \right)^n =
\left( 1-\frac{z^2}{2n}+\cdots \right)^n
</math>

Przy przejściu z <math>n</math> do nieskończoności (i pomijaniu wyrazów rzędu wyższego niż drugi) dostajemy
<center><math>
\phi_y(z)\rightarrow
\underset{n\rightarrow \infty }{\lim }\left(1-\frac{z^2}{2n}\right)^n=
e^{\frac{-z^{2}}{2}}
</math></center>

bo
<math>e^x=\lim_{n\rightarrow\infty} (1+x/n)^n</math>

Pozostaje pokazać, że jest to postać funkcji charakterystycznej rozkładu Gaussa.

====Transformata Fouriera funkcji Gaussa====
Funkcja charakterystyczna rozkładu normalnego o wartości oczekiwanej 0 i jednostkowej wariancji będzie miała postać

<math>
\phi _{x}(t)=
\int\limits_{-\infty}^\infty e^{itx}\frac{1}{\sqrt{2\pi }} e^{\frac{-x^{2}}{2}} dx =
</math>

<math>
\dfrac{1}{\sqrt{2\pi}} \int\limits_{-\infty}^\infty \left( \cos(tx) + i \sin(tx) \right) e^{\frac{-x^2}{2}} dx =
</math>

<math>
\dfrac{1}{\sqrt{2\pi}} \int\limits_{-\infty}^\infty \cos(tx) e^{\frac{-x^2}{2}} dx +
\dfrac{1}{\sqrt{2\pi}} \int\limits_{-\infty}^\infty i \sin(tx) e^{\frac{-x^2}{2}} dx
</math>

ponieważ funkcja <math>\sin(x)</math> jest antysymetryczna, druga całka znika. Dostajemy

<math>
\int\limits_{-\infty}^\infty e^{itx}\frac{1}{\sqrt{2\pi }} e^{\frac{-x^2}{2}} dx =
\dfrac{1}{\sqrt{2\pi}} \int\limits_{-\infty}^\infty \cos(tx) e^{\frac{-x^2}{2}} dx
</math>

Dla części symetrycznej znajdujemy w tablicach całkę oznaczoną

<math>
\int\limits_{0}^{\infty} e^{-a^2 x^2} \cos(b x) dx
=
\frac{ \sqrt{\pi} e^{-\tfrac{b^2}{4a^2}} } {2 a}
</math>

po wymnożeniu przez 2 i podstawieniu <math> b=t</math> i <math>a^2=\frac{1}{2}</math> dostajemy

<math>
\int\limits_{-\infty}^{\infty} e^{-\frac{1}{2} x^2} \cos(t x) dx
=
\frac{ \sqrt{\pi} e^{ -\frac{t^2} { 4 \frac{1}{2} } } } {\frac{1}{\sqrt{2}}}
=
\sqrt{2\pi} e^{-\frac{t^2}{2}}
</math> , czyli

<center><math>
\phi _{x}(t) =
\int\limits_{-\infty}^\infty e^{itx}\frac{1}{\sqrt{2\pi }} e^{\frac{-x^{2}}{2}} dx =
e^{-t^2 / 2}
</math></center>

W analizie sygnałów wynik ten będzie oznaczał, że transformacja Fouriera funkcji Gaussa jest funkcją Gaussa. W tym konkretnym przypadku otrzymaliśmy funkcję tożsamą z funkcją charakterystyczną rozkładu rozważanej sumy zmiennych, czyli rozkład ten będzie (w przypadku granicznym) miał postać funkcji Gaussa.

[[Plik:Ctg.png|300px|thumb|left|<figure id="fig:ctg"></figure>Ilustracja działania Centralnego Twierdzenia Granicznego. Zmienną
<math>x_i</math> bierzemy z rozkładu równomiernego, kolejne histogramy przedstawiają sumę 2, 3 i 4
zmiennych <math>x_i</math> dla 10 000 losowań. Widać dużą zgodność z dopasowanym rozkładem
normalnym (ciągła linia) już dla niewielu sumowanych zmiennych.
]]

<xr id="fig:ctg">Rysunek %i</xr> ilustruje powyższe twierdzenie dla
przypadku sumy zmiennych pochodzących z rozkładu równomiernego. Jak
widać, już dla sumy 3 zmiennych rozkład wydaje się bardzo podobny do
normalnego. Niestety, często istotne bywają różnice dla wartości bardzo dużych lub bardzo małych. Otóż według
[[WnioskowanieStatystyczne/Rozklady-przyklady#label-eq:78|wzoru]] wartości gęstości
prawdopodobieństwa rozkładu normalnego dążą do zera dla dużych
wartości bezwzględnych zmiennej asymptotycznie, lecz zera faktycznie
nie osiągają. Inaczej mówiąc, prawdopodobieństwo wylosowania dowolnie
dużej wartości z rozkładu Gaussa będzie małe, ale nie zerowe. Za to
suma np. czterech zmiennych z rozkładu równomiernego od zera do
jedynki (prawy dolny wykres <xr id="fig:ctg">rys. %i</xr>) nie
przekroczy nigdy wartości 4, czyli prawdopodobieństwo dla
<math>x>4</math> będzie dokładnie zerem. I choć w skali <xr
id="fig:ctg">rysunku %i</xr> efekt ten jest prawie niewidoczny, warto
pamiętać, że testy oparte na założeniu normalności rozkładów często
operują właśnie w okolicach tych "ogonów", gdzie przybliżenie
rozkładu normalnego, uzyskane za pomocą tej prostej procedury,
zawodzi.

-----------------------
<references />

WnioskowanieStatystyczne/CLT

2026-03-05T17:14:19Z

Durka: /* Rozkład Gaussa */

[[Wnioskowanie_Statystyczne_-_wykład]]

==Rozkład Gaussa==

Rozkład Gaussa (zwany też rozkładem normalnym lub krzywą dzwonową) zależy od
parametrów <math>\mu</math> i <math>\sigma</math>. Jego gęstość prawdopodobieństwa określona jest wzorem:

<center><math display="block">\displaystyle
p(x)=N(\mu, \sigma)= \frac{1}{\sqrt{2\pi }\sigma }e^{\frac{-(x-\mu )^{2}}{2\sigma ^{2}}}.
</math></center>

Parametry te są tak dobrane, że wartość oczekiwana wynosi
<math>\mu</math>, a wariancja <math>\sigma^2</math>.

[[Plik:Rozklad_gaussa.png|600px|thumb|left|<math>N(0,1)</math>, czyli
standardowy rozkład Gaussa o zerowej średniej (<math>\mu=0</math>) i
jednostkowej wariancji (<math>\sigma=1</math>).]]

Rozkład Gaussa dla zerowej wartości oczekiwanej i jednostkowej
wariancji (<math>\mu=0, \sigma^2=1</math>) zwiemy
''standardowym rozkładem Gaussa''
i oznaczamy zwykle <math>N(0,1)</math>.
Na wykresie zaznaczono na nim m. in. wartość całki od <math>-\infty</math> do
<math>-1</math>, czyli prawdopodobieństwo, że wylosowana z tego
rozkładu liczba będzie mniejsza niż <math>-1</math>. Jak widać, wynosi
ono ok. 16%, a jeśli weźmiemy pod uwagę również wartości większe od 1,
będzie to aż 32%! Oznacza to, że przy losowaniu wielu liczb z tego
rozkładu niemal 1/3 wyników może znaleźć się w odległości
większej niż <math>\sigma</math> od wartości oczekiwanej.

<equation id="eq:80">
<math>
x\in N(\mu,\sigma)\quad \Rightarrow \quad
\begin{cases}
P(\left| x-\mu \right| \geq \sigma )\approx 0,\!317,\\
P(\left| x-\mu \right| \geq 2\sigma )\ \approx 0,\!046,\\
\ P(\left| x-\mu \right| \geq 3\sigma )\approx 0,\!003.
\end{cases}
</math>
</equation>



Rozkład Gaussa pełni w statystyce bardzo znaczącą rolę ze względu na ''Centralne Twierdzenie Graniczne'', mówiące o asysmptotycznym rozkładzie sumy dużej liczby niezależnych zmiennych losowych, których rozkłady spełniają pewne warunki. Udowodnimy je w najprostszym przypadku, kiedy wszystkie te zmienne pochodzą z tego samego rozkładu gęstości prawdopodobieństwa. Na potrzeby tego dowodu musimy najpierw wprowadzić pojęcie funkcji charakterystycznej.



==Funkcja charakterystyczna rozkładu prawdopodobieństwa==

Dla zmiennej losowej <math>z</math> jest to wartość oczekiwana wyrażenia <math>e^{itz}</math>, gdzie <math>i=\sqrt{-1}</math>. Dla rozkładów ciągłych jest to [[Przekształcenie_Fouriera|transformata Fouriera]] funkcji gęstości prawdopodobieństwa <math>f(z)</math>:
<center><math>\displaystyle
\phi_z (t)=E(e^{itz})=\underset{-\infty }{\overset{\infty }{\int }}
e^{itz}f\left( z\right) dz
</math></center>
Użyteczne będą poniższe związki, które wyprowadzić można bezpośrednio z definicji:

====Funkcja charakterystyczna rozkładu sumy zmiennych niezależnych====
Dla ''niezależnych'' zmiennych <math>x</math> i <math>y</math>:
<equation id="eq:85">
<center>
<math>
z=x+y\Rightarrow \phi_{z}(t)
=\phi_{x}\left( t\right) \cdot \phi_{y}(t).
</math>
</center>
</equation>

Dowód:

<math>
\phi _{z}(t)
= E(e^{it(x+y)})=E(e^{itx}\cdot e^{ity})
= E(e^{itx})\cdot E(e^{ity})=\phi _{x}\left( t\right) \cdot \phi_{y}(t).
</math>

====Pochodna funkcji charakterystycznej====
Bezpośrednio z definicji — różniczkujemy po <math>dt</math>, więc przy każdym różniczkowaniu spada nam z wykładnika <math>i z</math>, <math>z</math> zostaje pod całką a <math>i</math> jako stała wychodzi przed całkę — widać, że:
<equation id="eq:pochodna_funkcji_tworzacej">
<center><math>\displaystyle
\frac{d^{n}\phi (t)}{dt^{n}}=i^{n}\underset{}{\underset{-\infty }{\overset{
\infty }{\int }}z^{n}}\ e^{itz}f(z) dz
</math></center>
</equation>

====Związek pochodnej funkcji charakterystycznej z momentami zmiennej losowej====
<math>n</math>-ta pochodna funkcji charakterystycznej w zerze (czyli dla <math>t=0</math>) wynosi
<equation id="eq:84">
<center><math>\displaystyle
\phi^{(n)}(0)=
i^{n}\underset{}{\underset{-\infty }{\overset{\infty }{\int }}z^{n}}\ e^{i 0 x} f(z) dz =
i^{n}\underset{}{\underset{-\infty }{\overset{\infty }{\int }}z^{n}} f(z) dz =
i^{n}E(z^{n})
</math></center>
</equation>

==Twierdzenie Lindeberga–Lévy'ego==
Zakładamy, że <math>x_{i}</math> są niezależnymi zmiennymi podlegającymi (dowolnemu) rozkładowi o skończonej wartości oczekiwanej <math>\mu</math> i wariancji <math>\sigma^{2}</math>, czyli wszystkie sumowane zmienne <math>x_i</math> pochodzą z tego samego rozkładu prawdopodobieństwa, o którym nie zakładamy nic ponad to, że ma skończone <math>\mu</math> i <math>\sigma</math>.
Wielkość

<center>
<equation id="eq:82"> <math>
S=\dfrac{ \sum\limits_{i=1}^{n}x_{i}\; -\; n\mu}{\sigma \sqrt{n}}
</math> </equation>
</center>

dla <math>n\rightarrow \infty</math> zbiega do rozkładu normalnego o zerowej wartości średniej i jednostkowej wariancji.

===Dowód twierdzenia Lindeberga–Lévy'ego===
Rozważmy zmienną <math>y_i</math> o zerowej wartości oczekiwanej i jednostkowej wariancji
<center><math>
y_{i} = \dfrac{x_{i}-\mu}{\sigma} .
</math></center>

Funkcję charakterystyczną rozkładu zmiennej <math>y_i</math>
<center><math>\phi_{y_i}(z) = E(e^{i z y_i}) </math></center>
możemy rozwinąć w szereg Taylora wokół <math>z=0</math>
<equation id="eq:86">
<center><math>
\phi_{y_i}(z)=\underset{n=0}{\overset{\infty }{\sum }}\frac{\phi^{(n)}(0)}{n!}z^n
</math></center>
</equation>
Z wyprowadzonej wcześniej własności funkcji charakterystycznej <xr id="eq:84">(%i)</xr>
<math>
\phi^{(n)}(0)=
i^{n}E(z^{n})
</math>
wynika, że

<math>\phi_{y_i}^{(0)}(0)= i^0 E(x^0) = 1</math>,

<math>\phi_{y_i}^{(1)}(0) = i^1 E(x^1) = i E(x) = 0</math> (wartość oczekiwana <math> y_i</math>),

<math>\phi_{y_i}^{(2)}(0)= i^2 E(x^2) = -1</math> (<math>i^2</math> * wariancja),

czyli funkcja charakterystyczna zmiennej <math>y_i</math> rozwinięta w szereg Taylora <xr id="eq:86">(%i)</xr> do wyrazów drugiego rzędu będzie miała postać
<equation id="eq:87">
<center><math>
\phi_{y_i}(z)=1-\frac{z^{2}}{2}+\cdots .
</math></center>
</equation>

Wrócmy do występującej w twierdzeniu sumy <math>S</math>

<math>
S=\dfrac{ \sum\limits_{i=1}^{n}x_{i}\; -\; n\mu}{\sigma \sqrt{n}} =
\dfrac{1}{\sigma \sqrt{n}} \sum\limits_{i=1}^{n}(x_{i} -\mu) =
\dfrac{1}{\sqrt{n}} \sum\limits_{i=1}^{n}\dfrac{x_{i} -\mu}{\sigma}
= \dfrac{1}{\sqrt{n}} \sum\limits_{i=1}^{n} y_i
</math>

Jej funkcja charakterystyczna

<math>\phi_S(z) = E(e^{izS}) = E\left(e^{iz \frac{1}{\sqrt{n}} \sum\limits_{i=1}^{n} y_i} \right)
</math>
<math>
= E\left(\prod_{i=1}^{n} e^{iz \frac{1}{\sqrt{n}} y_i} \right)
</math>

ponieważ zmienne <math>y_i</math> są wzajemnie niezależne,

<math>\phi_S(z)= \prod_{i=1}^{n} E\left( e^{i\frac{z}{\sqrt{n}} y_i } \right)
= \prod_{i=1}^{n} \phi_{y_i}\left(\frac{z}{\sqrt{n}}\right)
</math>

ponieważ zmienne <math>y_i</math> pochodzą z tego samego rozkładu prawdopodobieństwa,

<math>\phi_S(z)=
\prod_{i=1}^{n} \phi_{y_i}\left(\frac{z}{\sqrt{n}}\right) =
\left( \phi_{y_i}\left(\frac{z}{\sqrt{n}}\right) \right)^n =
\left( 1-\frac{(z/\sqrt{n})^{2}}{2}+\cdots \right)^n =
\left( 1-\frac{z^2}{2n}+\cdots \right)^n
</math>

Przy przejściu z <math>n</math> do nieskończoności (i pomijaniu wyrazów rzędu wyższego niż drugi) dostajemy
<center><math>
\phi_y(z)\rightarrow
\underset{n\rightarrow \infty }{\lim }\left(1-\frac{z^2}{2n}\right)^n=
e^{\frac{-z^{2}}{2}}
</math></center>

bo
<math>e^x=\lim_{n\rightarrow\infty} (1+x/n)^n</math>

Pozostaje pokazać, że jest to postać funkcji charakterystycznej rozkładu Gaussa.

====Transformata Fouriera funkcji Gaussa====
Funkcja charakterystyczna rozkładu normalnego o wartości oczekiwanej 0 i jednostkowej wariancji będzie miała postać

<math>
\phi _{x}(t)=
\int\limits_{-\infty}^\infty e^{itx}\frac{1}{\sqrt{2\pi }} e^{\frac{-x^{2}}{2}} dx =
</math>

<math>
\dfrac{1}{\sqrt{2\pi}} \int\limits_{-\infty}^\infty \left( \cos(tx) + i \sin(tx) \right) e^{\frac{-x^2}{2}} dx =
</math>

<math>
\dfrac{1}{\sqrt{2\pi}} \int\limits_{-\infty}^\infty \cos(tx) e^{\frac{-x^2}{2}} dx +
\dfrac{1}{\sqrt{2\pi}} \int\limits_{-\infty}^\infty i \sin(tx) e^{\frac{-x^2}{2}} dx
</math>

ponieważ funkcja <math>\sin(x)</math> jest antysymetryczna, druga całka znika. Dostajemy

<math>
\int\limits_{-\infty}^\infty e^{itx}\frac{1}{\sqrt{2\pi }} e^{\frac{-x^2}{2}} dx =
\dfrac{1}{\sqrt{2\pi}} \int\limits_{-\infty}^\infty \cos(tx) e^{\frac{-x^2}{2}} dx
</math>

Dla części symetrycznej znajdujemy w tablicach całkę oznaczoną

<math>
\int\limits_{0}^{\infty} e^{-a^2 x^2} \cos(b x) dx
=
\frac{ \sqrt{\pi} e^{-\tfrac{b^2}{4a^2}} } {2 a}
</math>

po wymnożeniu przez 2 i podstawieniu <math> b=t</math> i <math>a^2=\frac{1}{2}</math> dostajemy

<math>
\int\limits_{-\infty}^{\infty} e^{-\frac{1}{2} x^2} \cos(t x) dx
=
\frac{ \sqrt{\pi} e^{ -\frac{t^2} { 4 \frac{1}{2} } } } {\frac{1}{\sqrt{2}}}
=
\sqrt{2\pi} e^{-\frac{t^2}{2}}
</math> , czyli

<center><math>
\phi _{x}(t) =
\int\limits_{-\infty}^\infty e^{itx}\frac{1}{\sqrt{2\pi }} e^{\frac{-x^{2}}{2}} dx =
e^{-t^2 / 2}
</math></center>

W analizie sygnałów wynik ten będzie oznaczał, że transformacja Fouriera funkcji Gaussa jest funkcją Gaussa. W tym konkretnym przypadku otrzymaliśmy funkcję tożsamą z funkcją charakterystyczną rozkładu rozważanej sumy zmiennych, czyli rozkład ten będzie (w przypadku granicznym) miał postać funkcji Gaussa.

[[Plik:Ctg.png|300px|thumb|left|<figure id="fig:ctg"></figure>Ilustracja działania Centralnego Twierdzenia Granicznego. Zmienną
<math>x_i</math> bierzemy z rozkładu równomiernego, kolejne histogramy przedstawiają sumę 2, 3 i 4
zmiennych <math>x_i</math> dla 10 000 losowań. Widać dużą zgodność z dopasowanym rozkładem
normalnym (ciągła linia) już dla niewielu sumowanych zmiennych.
]]

<xr id="fig:ctg">Rysunek %i</xr> ilustruje powyższe twierdzenie dla
przypadku sumy zmiennych pochodzących z rozkładu równomiernego. Jak
widać, już dla sumy 3 zmiennych rozkład wydaje się bardzo podobny do
normalnego. Niestety, często istotne bywają różnice dla wartości bardzo dużych lub bardzo małych. Otóż według
[[WnioskowanieStatystyczne/Rozklady-przyklady#label-eq:78|wzoru]] wartości gęstości
prawdopodobieństwa rozkładu normalnego dążą do zera dla dużych
wartości bezwzględnych zmiennej asymptotycznie, lecz zera faktycznie
nie osiągają. Inaczej mówiąc, prawdopodobieństwo wylosowania dowolnie
dużej wartości z rozkładu Gaussa będzie małe, ale nie zerowe. Za to
suma np. czterech zmiennych z rozkładu równomiernego od zera do
jedynki (prawy dolny wykres <xr id="fig:ctg">rys. %i</xr>) nie
przekroczy nigdy wartości 4, czyli prawdopodobieństwo dla
<math>x>4</math> będzie dokładnie zerem. I choć w skali <xr
id="fig:ctg">rysunku %i</xr> efekt ten jest prawie niewidoczny, warto
pamiętać, że testy oparte na założeniu normalności rozkładów często
operują właśnie w okolicach tych "ogonów", gdzie przybliżenie
rozkładu normalnego, uzyskane za pomocą tej prostej procedury,
zawodzi.

-----------------------
<references />

WnioskowanieStatystyczne/CLT

2026-03-05T17:14:01Z

Durka: /* Funkcja charakterystyczna rozkładu prawdopodobieństwa */

[[Wnioskowanie_Statystyczne_-_wykład]]

==Rozkład Gaussa==

Rozkład Gaussa (zwany też rozkładem normalnym lub krzywą dzwonową) zależy od
parametrów <math>\mu</math> i <math>\sigma</math>. Jego gęstość prawdopodobieństwa określona jest wzorem:

<center><math display="block">
p(x)=N(\mu, \sigma)= \frac{1}{\sqrt{2\pi }\sigma }e^{\frac{-(x-\mu )^{2}}{2\sigma ^{2}}}.
</math></center>

Parametry te są tak dobrane, że wartość oczekiwana wynosi
<math>\mu</math>, a wariancja <math>\sigma^2</math>.

[[Plik:Rozklad_gaussa.png|600px|thumb|left|<math>N(0,1)</math>, czyli
standardowy rozkład Gaussa o zerowej średniej (<math>\mu=0</math>) i
jednostkowej wariancji (<math>\sigma=1</math>).]]

Rozkład Gaussa dla zerowej wartości oczekiwanej i jednostkowej
wariancji (<math>\mu=0, \sigma^2=1</math>) zwiemy
''standardowym rozkładem Gaussa''
i oznaczamy zwykle <math>N(0,1)</math>.
Na wykresie zaznaczono na nim m. in. wartość całki od <math>-\infty</math> do
<math>-1</math>, czyli prawdopodobieństwo, że wylosowana z tego
rozkładu liczba będzie mniejsza niż <math>-1</math>. Jak widać, wynosi
ono ok. 16%, a jeśli weźmiemy pod uwagę również wartości większe od 1,
będzie to aż 32%! Oznacza to, że przy losowaniu wielu liczb z tego
rozkładu niemal 1/3 wyników może znaleźć się w odległości
większej niż <math>\sigma</math> od wartości oczekiwanej.

<equation id="eq:80">
<math>
x\in N(\mu,\sigma)\quad \Rightarrow \quad
\begin{cases}
P(\left| x-\mu \right| \geq \sigma )\approx 0,\!317,\\
P(\left| x-\mu \right| \geq 2\sigma )\ \approx 0,\!046,\\
\ P(\left| x-\mu \right| \geq 3\sigma )\approx 0,\!003.
\end{cases}
</math>
</equation>



Rozkład Gaussa pełni w statystyce bardzo znaczącą rolę ze względu na ''Centralne Twierdzenie Graniczne'', mówiące o asysmptotycznym rozkładzie sumy dużej liczby niezależnych zmiennych losowych, których rozkłady spełniają pewne warunki. Udowodnimy je w najprostszym przypadku, kiedy wszystkie te zmienne pochodzą z tego samego rozkładu gęstości prawdopodobieństwa. Na potrzeby tego dowodu musimy najpierw wprowadzić pojęcie funkcji charakterystycznej.



==Funkcja charakterystyczna rozkładu prawdopodobieństwa==

Dla zmiennej losowej <math>z</math> jest to wartość oczekiwana wyrażenia <math>e^{itz}</math>, gdzie <math>i=\sqrt{-1}</math>. Dla rozkładów ciągłych jest to [[Przekształcenie_Fouriera|transformata Fouriera]] funkcji gęstości prawdopodobieństwa <math>f(z)</math>:
<center><math>\displaystyle
\phi_z (t)=E(e^{itz})=\underset{-\infty }{\overset{\infty }{\int }}
e^{itz}f\left( z\right) dz
</math></center>
Użyteczne będą poniższe związki, które wyprowadzić można bezpośrednio z definicji:

====Funkcja charakterystyczna rozkładu sumy zmiennych niezależnych====
Dla ''niezależnych'' zmiennych <math>x</math> i <math>y</math>:
<equation id="eq:85">
<center>
<math>
z=x+y\Rightarrow \phi_{z}(t)
=\phi_{x}\left( t\right) \cdot \phi_{y}(t).
</math>
</center>
</equation>

Dowód:

<math>
\phi _{z}(t)
= E(e^{it(x+y)})=E(e^{itx}\cdot e^{ity})
= E(e^{itx})\cdot E(e^{ity})=\phi _{x}\left( t\right) \cdot \phi_{y}(t).
</math>

====Pochodna funkcji charakterystycznej====
Bezpośrednio z definicji — różniczkujemy po <math>dt</math>, więc przy każdym różniczkowaniu spada nam z wykładnika <math>i z</math>, <math>z</math> zostaje pod całką a <math>i</math> jako stała wychodzi przed całkę — widać, że:
<equation id="eq:pochodna_funkcji_tworzacej">
<center><math>\displaystyle
\frac{d^{n}\phi (t)}{dt^{n}}=i^{n}\underset{}{\underset{-\infty }{\overset{
\infty }{\int }}z^{n}}\ e^{itz}f(z) dz
</math></center>
</equation>

====Związek pochodnej funkcji charakterystycznej z momentami zmiennej losowej====
<math>n</math>-ta pochodna funkcji charakterystycznej w zerze (czyli dla <math>t=0</math>) wynosi
<equation id="eq:84">
<center><math>\displaystyle
\phi^{(n)}(0)=
i^{n}\underset{}{\underset{-\infty }{\overset{\infty }{\int }}z^{n}}\ e^{i 0 x} f(z) dz =
i^{n}\underset{}{\underset{-\infty }{\overset{\infty }{\int }}z^{n}} f(z) dz =
i^{n}E(z^{n})
</math></center>
</equation>

==Twierdzenie Lindeberga–Lévy'ego==
Zakładamy, że <math>x_{i}</math> są niezależnymi zmiennymi podlegającymi (dowolnemu) rozkładowi o skończonej wartości oczekiwanej <math>\mu</math> i wariancji <math>\sigma^{2}</math>, czyli wszystkie sumowane zmienne <math>x_i</math> pochodzą z tego samego rozkładu prawdopodobieństwa, o którym nie zakładamy nic ponad to, że ma skończone <math>\mu</math> i <math>\sigma</math>.
Wielkość

<center>
<equation id="eq:82"> <math>
S=\dfrac{ \sum\limits_{i=1}^{n}x_{i}\; -\; n\mu}{\sigma \sqrt{n}}
</math> </equation>
</center>

dla <math>n\rightarrow \infty</math> zbiega do rozkładu normalnego o zerowej wartości średniej i jednostkowej wariancji.

===Dowód twierdzenia Lindeberga–Lévy'ego===
Rozważmy zmienną <math>y_i</math> o zerowej wartości oczekiwanej i jednostkowej wariancji
<center><math>
y_{i} = \dfrac{x_{i}-\mu}{\sigma} .
</math></center>

Funkcję charakterystyczną rozkładu zmiennej <math>y_i</math>
<center><math>\phi_{y_i}(z) = E(e^{i z y_i}) </math></center>
możemy rozwinąć w szereg Taylora wokół <math>z=0</math>
<equation id="eq:86">
<center><math>
\phi_{y_i}(z)=\underset{n=0}{\overset{\infty }{\sum }}\frac{\phi^{(n)}(0)}{n!}z^n
</math></center>
</equation>
Z wyprowadzonej wcześniej własności funkcji charakterystycznej <xr id="eq:84">(%i)</xr>
<math>
\phi^{(n)}(0)=
i^{n}E(z^{n})
</math>
wynika, że

<math>\phi_{y_i}^{(0)}(0)= i^0 E(x^0) = 1</math>,

<math>\phi_{y_i}^{(1)}(0) = i^1 E(x^1) = i E(x) = 0</math> (wartość oczekiwana <math> y_i</math>),

<math>\phi_{y_i}^{(2)}(0)= i^2 E(x^2) = -1</math> (<math>i^2</math> * wariancja),

czyli funkcja charakterystyczna zmiennej <math>y_i</math> rozwinięta w szereg Taylora <xr id="eq:86">(%i)</xr> do wyrazów drugiego rzędu będzie miała postać
<equation id="eq:87">
<center><math>
\phi_{y_i}(z)=1-\frac{z^{2}}{2}+\cdots .
</math></center>
</equation>

Wrócmy do występującej w twierdzeniu sumy <math>S</math>

<math>
S=\dfrac{ \sum\limits_{i=1}^{n}x_{i}\; -\; n\mu}{\sigma \sqrt{n}} =
\dfrac{1}{\sigma \sqrt{n}} \sum\limits_{i=1}^{n}(x_{i} -\mu) =
\dfrac{1}{\sqrt{n}} \sum\limits_{i=1}^{n}\dfrac{x_{i} -\mu}{\sigma}
= \dfrac{1}{\sqrt{n}} \sum\limits_{i=1}^{n} y_i
</math>

Jej funkcja charakterystyczna

<math>\phi_S(z) = E(e^{izS}) = E\left(e^{iz \frac{1}{\sqrt{n}} \sum\limits_{i=1}^{n} y_i} \right)
</math>
<math>
= E\left(\prod_{i=1}^{n} e^{iz \frac{1}{\sqrt{n}} y_i} \right)
</math>

ponieważ zmienne <math>y_i</math> są wzajemnie niezależne,

<math>\phi_S(z)= \prod_{i=1}^{n} E\left( e^{i\frac{z}{\sqrt{n}} y_i } \right)
= \prod_{i=1}^{n} \phi_{y_i}\left(\frac{z}{\sqrt{n}}\right)
</math>

ponieważ zmienne <math>y_i</math> pochodzą z tego samego rozkładu prawdopodobieństwa,

<math>\phi_S(z)=
\prod_{i=1}^{n} \phi_{y_i}\left(\frac{z}{\sqrt{n}}\right) =
\left( \phi_{y_i}\left(\frac{z}{\sqrt{n}}\right) \right)^n =
\left( 1-\frac{(z/\sqrt{n})^{2}}{2}+\cdots \right)^n =
\left( 1-\frac{z^2}{2n}+\cdots \right)^n
</math>

Przy przejściu z <math>n</math> do nieskończoności (i pomijaniu wyrazów rzędu wyższego niż drugi) dostajemy
<center><math>
\phi_y(z)\rightarrow
\underset{n\rightarrow \infty }{\lim }\left(1-\frac{z^2}{2n}\right)^n=
e^{\frac{-z^{2}}{2}}
</math></center>

bo
<math>e^x=\lim_{n\rightarrow\infty} (1+x/n)^n</math>

Pozostaje pokazać, że jest to postać funkcji charakterystycznej rozkładu Gaussa.

====Transformata Fouriera funkcji Gaussa====
Funkcja charakterystyczna rozkładu normalnego o wartości oczekiwanej 0 i jednostkowej wariancji będzie miała postać

<math>
\phi _{x}(t)=
\int\limits_{-\infty}^\infty e^{itx}\frac{1}{\sqrt{2\pi }} e^{\frac{-x^{2}}{2}} dx =
</math>

<math>
\dfrac{1}{\sqrt{2\pi}} \int\limits_{-\infty}^\infty \left( \cos(tx) + i \sin(tx) \right) e^{\frac{-x^2}{2}} dx =
</math>

<math>
\dfrac{1}{\sqrt{2\pi}} \int\limits_{-\infty}^\infty \cos(tx) e^{\frac{-x^2}{2}} dx +
\dfrac{1}{\sqrt{2\pi}} \int\limits_{-\infty}^\infty i \sin(tx) e^{\frac{-x^2}{2}} dx
</math>

ponieważ funkcja <math>\sin(x)</math> jest antysymetryczna, druga całka znika. Dostajemy

<math>
\int\limits_{-\infty}^\infty e^{itx}\frac{1}{\sqrt{2\pi }} e^{\frac{-x^2}{2}} dx =
\dfrac{1}{\sqrt{2\pi}} \int\limits_{-\infty}^\infty \cos(tx) e^{\frac{-x^2}{2}} dx
</math>

Dla części symetrycznej znajdujemy w tablicach całkę oznaczoną

<math>
\int\limits_{0}^{\infty} e^{-a^2 x^2} \cos(b x) dx
=
\frac{ \sqrt{\pi} e^{-\tfrac{b^2}{4a^2}} } {2 a}
</math>

po wymnożeniu przez 2 i podstawieniu <math> b=t</math> i <math>a^2=\frac{1}{2}</math> dostajemy

<math>
\int\limits_{-\infty}^{\infty} e^{-\frac{1}{2} x^2} \cos(t x) dx
=
\frac{ \sqrt{\pi} e^{ -\frac{t^2} { 4 \frac{1}{2} } } } {\frac{1}{\sqrt{2}}}
=
\sqrt{2\pi} e^{-\frac{t^2}{2}}
</math> , czyli

<center><math>
\phi _{x}(t) =
\int\limits_{-\infty}^\infty e^{itx}\frac{1}{\sqrt{2\pi }} e^{\frac{-x^{2}}{2}} dx =
e^{-t^2 / 2}
</math></center>

W analizie sygnałów wynik ten będzie oznaczał, że transformacja Fouriera funkcji Gaussa jest funkcją Gaussa. W tym konkretnym przypadku otrzymaliśmy funkcję tożsamą z funkcją charakterystyczną rozkładu rozważanej sumy zmiennych, czyli rozkład ten będzie (w przypadku granicznym) miał postać funkcji Gaussa.

[[Plik:Ctg.png|300px|thumb|left|<figure id="fig:ctg"></figure>Ilustracja działania Centralnego Twierdzenia Granicznego. Zmienną
<math>x_i</math> bierzemy z rozkładu równomiernego, kolejne histogramy przedstawiają sumę 2, 3 i 4
zmiennych <math>x_i</math> dla 10 000 losowań. Widać dużą zgodność z dopasowanym rozkładem
normalnym (ciągła linia) już dla niewielu sumowanych zmiennych.
]]

<xr id="fig:ctg">Rysunek %i</xr> ilustruje powyższe twierdzenie dla
przypadku sumy zmiennych pochodzących z rozkładu równomiernego. Jak
widać, już dla sumy 3 zmiennych rozkład wydaje się bardzo podobny do
normalnego. Niestety, często istotne bywają różnice dla wartości bardzo dużych lub bardzo małych. Otóż według
[[WnioskowanieStatystyczne/Rozklady-przyklady#label-eq:78|wzoru]] wartości gęstości
prawdopodobieństwa rozkładu normalnego dążą do zera dla dużych
wartości bezwzględnych zmiennej asymptotycznie, lecz zera faktycznie
nie osiągają. Inaczej mówiąc, prawdopodobieństwo wylosowania dowolnie
dużej wartości z rozkładu Gaussa będzie małe, ale nie zerowe. Za to
suma np. czterech zmiennych z rozkładu równomiernego od zera do
jedynki (prawy dolny wykres <xr id="fig:ctg">rys. %i</xr>) nie
przekroczy nigdy wartości 4, czyli prawdopodobieństwo dla
<math>x>4</math> będzie dokładnie zerem. I choć w skali <xr
id="fig:ctg">rysunku %i</xr> efekt ten jest prawie niewidoczny, warto
pamiętać, że testy oparte na założeniu normalności rozkładów często
operują właśnie w okolicach tych "ogonów", gdzie przybliżenie
rozkładu normalnego, uzyskane za pomocą tej prostej procedury,
zawodzi.

-----------------------
<references />

WnioskowanieStatystyczne/CLT

2026-03-05T17:13:42Z

Durka: /* Związek pochodnej funkcji charakterystycznej z momentami zmiennej losowej */

[[Wnioskowanie_Statystyczne_-_wykład]]

==Rozkład Gaussa==

Rozkład Gaussa (zwany też rozkładem normalnym lub krzywą dzwonową) zależy od
parametrów <math>\mu</math> i <math>\sigma</math>. Jego gęstość prawdopodobieństwa określona jest wzorem:

<center><math display="block">
p(x)=N(\mu, \sigma)= \frac{1}{\sqrt{2\pi }\sigma }e^{\frac{-(x-\mu )^{2}}{2\sigma ^{2}}}.
</math></center>

Parametry te są tak dobrane, że wartość oczekiwana wynosi
<math>\mu</math>, a wariancja <math>\sigma^2</math>.

[[Plik:Rozklad_gaussa.png|600px|thumb|left|<math>N(0,1)</math>, czyli
standardowy rozkład Gaussa o zerowej średniej (<math>\mu=0</math>) i
jednostkowej wariancji (<math>\sigma=1</math>).]]

Rozkład Gaussa dla zerowej wartości oczekiwanej i jednostkowej
wariancji (<math>\mu=0, \sigma^2=1</math>) zwiemy
''standardowym rozkładem Gaussa''
i oznaczamy zwykle <math>N(0,1)</math>.
Na wykresie zaznaczono na nim m. in. wartość całki od <math>-\infty</math> do
<math>-1</math>, czyli prawdopodobieństwo, że wylosowana z tego
rozkładu liczba będzie mniejsza niż <math>-1</math>. Jak widać, wynosi
ono ok. 16%, a jeśli weźmiemy pod uwagę również wartości większe od 1,
będzie to aż 32%! Oznacza to, że przy losowaniu wielu liczb z tego
rozkładu niemal 1/3 wyników może znaleźć się w odległości
większej niż <math>\sigma</math> od wartości oczekiwanej.

<equation id="eq:80">
<math>
x\in N(\mu,\sigma)\quad \Rightarrow \quad
\begin{cases}
P(\left| x-\mu \right| \geq \sigma )\approx 0,\!317,\\
P(\left| x-\mu \right| \geq 2\sigma )\ \approx 0,\!046,\\
\ P(\left| x-\mu \right| \geq 3\sigma )\approx 0,\!003.
\end{cases}
</math>
</equation>



Rozkład Gaussa pełni w statystyce bardzo znaczącą rolę ze względu na ''Centralne Twierdzenie Graniczne'', mówiące o asysmptotycznym rozkładzie sumy dużej liczby niezależnych zmiennych losowych, których rozkłady spełniają pewne warunki. Udowodnimy je w najprostszym przypadku, kiedy wszystkie te zmienne pochodzą z tego samego rozkładu gęstości prawdopodobieństwa. Na potrzeby tego dowodu musimy najpierw wprowadzić pojęcie funkcji charakterystycznej.



==Funkcja charakterystyczna rozkładu prawdopodobieństwa==

Dla zmiennej losowej <math>z</math> jest to wartość oczekiwana wyrażenia <math>e^{itz}</math>, gdzie <math>i=\sqrt{-1}</math>. Dla rozkładów ciągłych jest to [[Przekształcenie_Fouriera|transformata Fouriera]] funkcji gęstości prawdopodobieństwa <math>f(z)</math>:
<center><math>
\phi_z (t)=E(e^{itz})=\underset{-\infty }{\overset{\infty }{\int }}
e^{itz}f\left( z\right) dz
</math></center>
Użyteczne będą poniższe związki, które wyprowadzić można bezpośrednio z definicji:

====Funkcja charakterystyczna rozkładu sumy zmiennych niezależnych====
Dla ''niezależnych'' zmiennych <math>x</math> i <math>y</math>:
<equation id="eq:85">
<center>
<math>
z=x+y\Rightarrow \phi_{z}(t)
=\phi_{x}\left( t\right) \cdot \phi_{y}(t).
</math>
</center>
</equation>

Dowód:

<math>
\phi _{z}(t)
= E(e^{it(x+y)})=E(e^{itx}\cdot e^{ity})
= E(e^{itx})\cdot E(e^{ity})=\phi _{x}\left( t\right) \cdot \phi_{y}(t).
</math>

====Pochodna funkcji charakterystycznej====
Bezpośrednio z definicji — różniczkujemy po <math>dt</math>, więc przy każdym różniczkowaniu spada nam z wykładnika <math>i z</math>, <math>z</math> zostaje pod całką a <math>i</math> jako stała wychodzi przed całkę — widać, że:
<equation id="eq:pochodna_funkcji_tworzacej">
<center><math>\displaystyle
\frac{d^{n}\phi (t)}{dt^{n}}=i^{n}\underset{}{\underset{-\infty }{\overset{
\infty }{\int }}z^{n}}\ e^{itz}f(z) dz
</math></center>
</equation>

====Związek pochodnej funkcji charakterystycznej z momentami zmiennej losowej====
<math>n</math>-ta pochodna funkcji charakterystycznej w zerze (czyli dla <math>t=0</math>) wynosi
<equation id="eq:84">
<center><math>\displaystyle
\phi^{(n)}(0)=
i^{n}\underset{}{\underset{-\infty }{\overset{\infty }{\int }}z^{n}}\ e^{i 0 x} f(z) dz =
i^{n}\underset{}{\underset{-\infty }{\overset{\infty }{\int }}z^{n}} f(z) dz =
i^{n}E(z^{n})
</math></center>
</equation>

==Twierdzenie Lindeberga–Lévy'ego==
Zakładamy, że <math>x_{i}</math> są niezależnymi zmiennymi podlegającymi (dowolnemu) rozkładowi o skończonej wartości oczekiwanej <math>\mu</math> i wariancji <math>\sigma^{2}</math>, czyli wszystkie sumowane zmienne <math>x_i</math> pochodzą z tego samego rozkładu prawdopodobieństwa, o którym nie zakładamy nic ponad to, że ma skończone <math>\mu</math> i <math>\sigma</math>.
Wielkość

<center>
<equation id="eq:82"> <math>
S=\dfrac{ \sum\limits_{i=1}^{n}x_{i}\; -\; n\mu}{\sigma \sqrt{n}}
</math> </equation>
</center>

dla <math>n\rightarrow \infty</math> zbiega do rozkładu normalnego o zerowej wartości średniej i jednostkowej wariancji.

===Dowód twierdzenia Lindeberga–Lévy'ego===
Rozważmy zmienną <math>y_i</math> o zerowej wartości oczekiwanej i jednostkowej wariancji
<center><math>
y_{i} = \dfrac{x_{i}-\mu}{\sigma} .
</math></center>

Funkcję charakterystyczną rozkładu zmiennej <math>y_i</math>
<center><math>\phi_{y_i}(z) = E(e^{i z y_i}) </math></center>
możemy rozwinąć w szereg Taylora wokół <math>z=0</math>
<equation id="eq:86">
<center><math>
\phi_{y_i}(z)=\underset{n=0}{\overset{\infty }{\sum }}\frac{\phi^{(n)}(0)}{n!}z^n
</math></center>
</equation>
Z wyprowadzonej wcześniej własności funkcji charakterystycznej <xr id="eq:84">(%i)</xr>
<math>
\phi^{(n)}(0)=
i^{n}E(z^{n})
</math>
wynika, że

<math>\phi_{y_i}^{(0)}(0)= i^0 E(x^0) = 1</math>,

<math>\phi_{y_i}^{(1)}(0) = i^1 E(x^1) = i E(x) = 0</math> (wartość oczekiwana <math> y_i</math>),

<math>\phi_{y_i}^{(2)}(0)= i^2 E(x^2) = -1</math> (<math>i^2</math> * wariancja),

czyli funkcja charakterystyczna zmiennej <math>y_i</math> rozwinięta w szereg Taylora <xr id="eq:86">(%i)</xr> do wyrazów drugiego rzędu będzie miała postać
<equation id="eq:87">
<center><math>
\phi_{y_i}(z)=1-\frac{z^{2}}{2}+\cdots .
</math></center>
</equation>

Wrócmy do występującej w twierdzeniu sumy <math>S</math>

<math>
S=\dfrac{ \sum\limits_{i=1}^{n}x_{i}\; -\; n\mu}{\sigma \sqrt{n}} =
\dfrac{1}{\sigma \sqrt{n}} \sum\limits_{i=1}^{n}(x_{i} -\mu) =
\dfrac{1}{\sqrt{n}} \sum\limits_{i=1}^{n}\dfrac{x_{i} -\mu}{\sigma}
= \dfrac{1}{\sqrt{n}} \sum\limits_{i=1}^{n} y_i
</math>

Jej funkcja charakterystyczna

<math>\phi_S(z) = E(e^{izS}) = E\left(e^{iz \frac{1}{\sqrt{n}} \sum\limits_{i=1}^{n} y_i} \right)
</math>
<math>
= E\left(\prod_{i=1}^{n} e^{iz \frac{1}{\sqrt{n}} y_i} \right)
</math>

ponieważ zmienne <math>y_i</math> są wzajemnie niezależne,

<math>\phi_S(z)= \prod_{i=1}^{n} E\left( e^{i\frac{z}{\sqrt{n}} y_i } \right)
= \prod_{i=1}^{n} \phi_{y_i}\left(\frac{z}{\sqrt{n}}\right)
</math>

ponieważ zmienne <math>y_i</math> pochodzą z tego samego rozkładu prawdopodobieństwa,

<math>\phi_S(z)=
\prod_{i=1}^{n} \phi_{y_i}\left(\frac{z}{\sqrt{n}}\right) =
\left( \phi_{y_i}\left(\frac{z}{\sqrt{n}}\right) \right)^n =
\left( 1-\frac{(z/\sqrt{n})^{2}}{2}+\cdots \right)^n =
\left( 1-\frac{z^2}{2n}+\cdots \right)^n
</math>

Przy przejściu z <math>n</math> do nieskończoności (i pomijaniu wyrazów rzędu wyższego niż drugi) dostajemy
<center><math>
\phi_y(z)\rightarrow
\underset{n\rightarrow \infty }{\lim }\left(1-\frac{z^2}{2n}\right)^n=
e^{\frac{-z^{2}}{2}}
</math></center>

bo
<math>e^x=\lim_{n\rightarrow\infty} (1+x/n)^n</math>

Pozostaje pokazać, że jest to postać funkcji charakterystycznej rozkładu Gaussa.

====Transformata Fouriera funkcji Gaussa====
Funkcja charakterystyczna rozkładu normalnego o wartości oczekiwanej 0 i jednostkowej wariancji będzie miała postać

<math>
\phi _{x}(t)=
\int\limits_{-\infty}^\infty e^{itx}\frac{1}{\sqrt{2\pi }} e^{\frac{-x^{2}}{2}} dx =
</math>

<math>
\dfrac{1}{\sqrt{2\pi}} \int\limits_{-\infty}^\infty \left( \cos(tx) + i \sin(tx) \right) e^{\frac{-x^2}{2}} dx =
</math>

<math>
\dfrac{1}{\sqrt{2\pi}} \int\limits_{-\infty}^\infty \cos(tx) e^{\frac{-x^2}{2}} dx +
\dfrac{1}{\sqrt{2\pi}} \int\limits_{-\infty}^\infty i \sin(tx) e^{\frac{-x^2}{2}} dx
</math>

ponieważ funkcja <math>\sin(x)</math> jest antysymetryczna, druga całka znika. Dostajemy

<math>
\int\limits_{-\infty}^\infty e^{itx}\frac{1}{\sqrt{2\pi }} e^{\frac{-x^2}{2}} dx =
\dfrac{1}{\sqrt{2\pi}} \int\limits_{-\infty}^\infty \cos(tx) e^{\frac{-x^2}{2}} dx
</math>

Dla części symetrycznej znajdujemy w tablicach całkę oznaczoną

<math>
\int\limits_{0}^{\infty} e^{-a^2 x^2} \cos(b x) dx
=
\frac{ \sqrt{\pi} e^{-\tfrac{b^2}{4a^2}} } {2 a}
</math>

po wymnożeniu przez 2 i podstawieniu <math> b=t</math> i <math>a^2=\frac{1}{2}</math> dostajemy

<math>
\int\limits_{-\infty}^{\infty} e^{-\frac{1}{2} x^2} \cos(t x) dx
=
\frac{ \sqrt{\pi} e^{ -\frac{t^2} { 4 \frac{1}{2} } } } {\frac{1}{\sqrt{2}}}
=
\sqrt{2\pi} e^{-\frac{t^2}{2}}
</math> , czyli

<center><math>
\phi _{x}(t) =
\int\limits_{-\infty}^\infty e^{itx}\frac{1}{\sqrt{2\pi }} e^{\frac{-x^{2}}{2}} dx =
e^{-t^2 / 2}
</math></center>

W analizie sygnałów wynik ten będzie oznaczał, że transformacja Fouriera funkcji Gaussa jest funkcją Gaussa. W tym konkretnym przypadku otrzymaliśmy funkcję tożsamą z funkcją charakterystyczną rozkładu rozważanej sumy zmiennych, czyli rozkład ten będzie (w przypadku granicznym) miał postać funkcji Gaussa.

[[Plik:Ctg.png|300px|thumb|left|<figure id="fig:ctg"></figure>Ilustracja działania Centralnego Twierdzenia Granicznego. Zmienną
<math>x_i</math> bierzemy z rozkładu równomiernego, kolejne histogramy przedstawiają sumę 2, 3 i 4
zmiennych <math>x_i</math> dla 10 000 losowań. Widać dużą zgodność z dopasowanym rozkładem
normalnym (ciągła linia) już dla niewielu sumowanych zmiennych.
]]

<xr id="fig:ctg">Rysunek %i</xr> ilustruje powyższe twierdzenie dla
przypadku sumy zmiennych pochodzących z rozkładu równomiernego. Jak
widać, już dla sumy 3 zmiennych rozkład wydaje się bardzo podobny do
normalnego. Niestety, często istotne bywają różnice dla wartości bardzo dużych lub bardzo małych. Otóż według
[[WnioskowanieStatystyczne/Rozklady-przyklady#label-eq:78|wzoru]] wartości gęstości
prawdopodobieństwa rozkładu normalnego dążą do zera dla dużych
wartości bezwzględnych zmiennej asymptotycznie, lecz zera faktycznie
nie osiągają. Inaczej mówiąc, prawdopodobieństwo wylosowania dowolnie
dużej wartości z rozkładu Gaussa będzie małe, ale nie zerowe. Za to
suma np. czterech zmiennych z rozkładu równomiernego od zera do
jedynki (prawy dolny wykres <xr id="fig:ctg">rys. %i</xr>) nie
przekroczy nigdy wartości 4, czyli prawdopodobieństwo dla
<math>x>4</math> będzie dokładnie zerem. I choć w skali <xr
id="fig:ctg">rysunku %i</xr> efekt ten jest prawie niewidoczny, warto
pamiętać, że testy oparte na założeniu normalności rozkładów często
operują właśnie w okolicach tych "ogonów", gdzie przybliżenie
rozkładu normalnego, uzyskane za pomocą tej prostej procedury,
zawodzi.

-----------------------
<references />

WnioskowanieStatystyczne/CLT

2026-03-05T17:13:22Z

Durka: /* Pochodna funkcji charakterystycznej */

[[Wnioskowanie_Statystyczne_-_wykład]]

==Rozkład Gaussa==

Rozkład Gaussa (zwany też rozkładem normalnym lub krzywą dzwonową) zależy od
parametrów <math>\mu</math> i <math>\sigma</math>. Jego gęstość prawdopodobieństwa określona jest wzorem:

<center><math display="block">
p(x)=N(\mu, \sigma)= \frac{1}{\sqrt{2\pi }\sigma }e^{\frac{-(x-\mu )^{2}}{2\sigma ^{2}}}.
</math></center>

Parametry te są tak dobrane, że wartość oczekiwana wynosi
<math>\mu</math>, a wariancja <math>\sigma^2</math>.

[[Plik:Rozklad_gaussa.png|600px|thumb|left|<math>N(0,1)</math>, czyli
standardowy rozkład Gaussa o zerowej średniej (<math>\mu=0</math>) i
jednostkowej wariancji (<math>\sigma=1</math>).]]

Rozkład Gaussa dla zerowej wartości oczekiwanej i jednostkowej
wariancji (<math>\mu=0, \sigma^2=1</math>) zwiemy
''standardowym rozkładem Gaussa''
i oznaczamy zwykle <math>N(0,1)</math>.
Na wykresie zaznaczono na nim m. in. wartość całki od <math>-\infty</math> do
<math>-1</math>, czyli prawdopodobieństwo, że wylosowana z tego
rozkładu liczba będzie mniejsza niż <math>-1</math>. Jak widać, wynosi
ono ok. 16%, a jeśli weźmiemy pod uwagę również wartości większe od 1,
będzie to aż 32%! Oznacza to, że przy losowaniu wielu liczb z tego
rozkładu niemal 1/3 wyników może znaleźć się w odległości
większej niż <math>\sigma</math> od wartości oczekiwanej.

<equation id="eq:80">
<math>
x\in N(\mu,\sigma)\quad \Rightarrow \quad
\begin{cases}
P(\left| x-\mu \right| \geq \sigma )\approx 0,\!317,\\
P(\left| x-\mu \right| \geq 2\sigma )\ \approx 0,\!046,\\
\ P(\left| x-\mu \right| \geq 3\sigma )\approx 0,\!003.
\end{cases}
</math>
</equation>



Rozkład Gaussa pełni w statystyce bardzo znaczącą rolę ze względu na ''Centralne Twierdzenie Graniczne'', mówiące o asysmptotycznym rozkładzie sumy dużej liczby niezależnych zmiennych losowych, których rozkłady spełniają pewne warunki. Udowodnimy je w najprostszym przypadku, kiedy wszystkie te zmienne pochodzą z tego samego rozkładu gęstości prawdopodobieństwa. Na potrzeby tego dowodu musimy najpierw wprowadzić pojęcie funkcji charakterystycznej.



==Funkcja charakterystyczna rozkładu prawdopodobieństwa==

Dla zmiennej losowej <math>z</math> jest to wartość oczekiwana wyrażenia <math>e^{itz}</math>, gdzie <math>i=\sqrt{-1}</math>. Dla rozkładów ciągłych jest to [[Przekształcenie_Fouriera|transformata Fouriera]] funkcji gęstości prawdopodobieństwa <math>f(z)</math>:
<center><math>
\phi_z (t)=E(e^{itz})=\underset{-\infty }{\overset{\infty }{\int }}
e^{itz}f\left( z\right) dz
</math></center>
Użyteczne będą poniższe związki, które wyprowadzić można bezpośrednio z definicji:

====Funkcja charakterystyczna rozkładu sumy zmiennych niezależnych====
Dla ''niezależnych'' zmiennych <math>x</math> i <math>y</math>:
<equation id="eq:85">
<center>
<math>
z=x+y\Rightarrow \phi_{z}(t)
=\phi_{x}\left( t\right) \cdot \phi_{y}(t).
</math>
</center>
</equation>

Dowód:

<math>
\phi _{z}(t)
= E(e^{it(x+y)})=E(e^{itx}\cdot e^{ity})
= E(e^{itx})\cdot E(e^{ity})=\phi _{x}\left( t\right) \cdot \phi_{y}(t).
</math>

====Pochodna funkcji charakterystycznej====
Bezpośrednio z definicji — różniczkujemy po <math>dt</math>, więc przy każdym różniczkowaniu spada nam z wykładnika <math>i z</math>, <math>z</math> zostaje pod całką a <math>i</math> jako stała wychodzi przed całkę — widać, że:
<equation id="eq:pochodna_funkcji_tworzacej">
<center><math>\displaystyle
\frac{d^{n}\phi (t)}{dt^{n}}=i^{n}\underset{}{\underset{-\infty }{\overset{
\infty }{\int }}z^{n}}\ e^{itz}f(z) dz
</math></center>
</equation>

====Związek pochodnej funkcji charakterystycznej z momentami zmiennej losowej====
<math>n</math>-ta pochodna funkcji charakterystycznej w zerze (czyli dla <math>t=0</math>) wynosi
<equation id="eq:84">
<center><math>
\phi^{(n)}(0)=
i^{n}\underset{}{\underset{-\infty }{\overset{\infty }{\int }}z^{n}}\ e^{i 0 x} f(z) dz =
i^{n}\underset{}{\underset{-\infty }{\overset{\infty }{\int }}z^{n}} f(z) dz =
i^{n}E(z^{n})
</math></center>
</equation>

==Twierdzenie Lindeberga–Lévy'ego==
Zakładamy, że <math>x_{i}</math> są niezależnymi zmiennymi podlegającymi (dowolnemu) rozkładowi o skończonej wartości oczekiwanej <math>\mu</math> i wariancji <math>\sigma^{2}</math>, czyli wszystkie sumowane zmienne <math>x_i</math> pochodzą z tego samego rozkładu prawdopodobieństwa, o którym nie zakładamy nic ponad to, że ma skończone <math>\mu</math> i <math>\sigma</math>.
Wielkość

<center>
<equation id="eq:82"> <math>
S=\dfrac{ \sum\limits_{i=1}^{n}x_{i}\; -\; n\mu}{\sigma \sqrt{n}}
</math> </equation>
</center>

dla <math>n\rightarrow \infty</math> zbiega do rozkładu normalnego o zerowej wartości średniej i jednostkowej wariancji.

===Dowód twierdzenia Lindeberga–Lévy'ego===
Rozważmy zmienną <math>y_i</math> o zerowej wartości oczekiwanej i jednostkowej wariancji
<center><math>
y_{i} = \dfrac{x_{i}-\mu}{\sigma} .
</math></center>

Funkcję charakterystyczną rozkładu zmiennej <math>y_i</math>
<center><math>\phi_{y_i}(z) = E(e^{i z y_i}) </math></center>
możemy rozwinąć w szereg Taylora wokół <math>z=0</math>
<equation id="eq:86">
<center><math>
\phi_{y_i}(z)=\underset{n=0}{\overset{\infty }{\sum }}\frac{\phi^{(n)}(0)}{n!}z^n
</math></center>
</equation>
Z wyprowadzonej wcześniej własności funkcji charakterystycznej <xr id="eq:84">(%i)</xr>
<math>
\phi^{(n)}(0)=
i^{n}E(z^{n})
</math>
wynika, że

<math>\phi_{y_i}^{(0)}(0)= i^0 E(x^0) = 1</math>,

<math>\phi_{y_i}^{(1)}(0) = i^1 E(x^1) = i E(x) = 0</math> (wartość oczekiwana <math> y_i</math>),

<math>\phi_{y_i}^{(2)}(0)= i^2 E(x^2) = -1</math> (<math>i^2</math> * wariancja),

czyli funkcja charakterystyczna zmiennej <math>y_i</math> rozwinięta w szereg Taylora <xr id="eq:86">(%i)</xr> do wyrazów drugiego rzędu będzie miała postać
<equation id="eq:87">
<center><math>
\phi_{y_i}(z)=1-\frac{z^{2}}{2}+\cdots .
</math></center>
</equation>

Wrócmy do występującej w twierdzeniu sumy <math>S</math>

<math>
S=\dfrac{ \sum\limits_{i=1}^{n}x_{i}\; -\; n\mu}{\sigma \sqrt{n}} =
\dfrac{1}{\sigma \sqrt{n}} \sum\limits_{i=1}^{n}(x_{i} -\mu) =
\dfrac{1}{\sqrt{n}} \sum\limits_{i=1}^{n}\dfrac{x_{i} -\mu}{\sigma}
= \dfrac{1}{\sqrt{n}} \sum\limits_{i=1}^{n} y_i
</math>

Jej funkcja charakterystyczna

<math>\phi_S(z) = E(e^{izS}) = E\left(e^{iz \frac{1}{\sqrt{n}} \sum\limits_{i=1}^{n} y_i} \right)
</math>
<math>
= E\left(\prod_{i=1}^{n} e^{iz \frac{1}{\sqrt{n}} y_i} \right)
</math>

ponieważ zmienne <math>y_i</math> są wzajemnie niezależne,

<math>\phi_S(z)= \prod_{i=1}^{n} E\left( e^{i\frac{z}{\sqrt{n}} y_i } \right)
= \prod_{i=1}^{n} \phi_{y_i}\left(\frac{z}{\sqrt{n}}\right)
</math>

ponieważ zmienne <math>y_i</math> pochodzą z tego samego rozkładu prawdopodobieństwa,

<math>\phi_S(z)=
\prod_{i=1}^{n} \phi_{y_i}\left(\frac{z}{\sqrt{n}}\right) =
\left( \phi_{y_i}\left(\frac{z}{\sqrt{n}}\right) \right)^n =
\left( 1-\frac{(z/\sqrt{n})^{2}}{2}+\cdots \right)^n =
\left( 1-\frac{z^2}{2n}+\cdots \right)^n
</math>

Przy przejściu z <math>n</math> do nieskończoności (i pomijaniu wyrazów rzędu wyższego niż drugi) dostajemy
<center><math>
\phi_y(z)\rightarrow
\underset{n\rightarrow \infty }{\lim }\left(1-\frac{z^2}{2n}\right)^n=
e^{\frac{-z^{2}}{2}}
</math></center>

bo
<math>e^x=\lim_{n\rightarrow\infty} (1+x/n)^n</math>

Pozostaje pokazać, że jest to postać funkcji charakterystycznej rozkładu Gaussa.

====Transformata Fouriera funkcji Gaussa====
Funkcja charakterystyczna rozkładu normalnego o wartości oczekiwanej 0 i jednostkowej wariancji będzie miała postać

<math>
\phi _{x}(t)=
\int\limits_{-\infty}^\infty e^{itx}\frac{1}{\sqrt{2\pi }} e^{\frac{-x^{2}}{2}} dx =
</math>

<math>
\dfrac{1}{\sqrt{2\pi}} \int\limits_{-\infty}^\infty \left( \cos(tx) + i \sin(tx) \right) e^{\frac{-x^2}{2}} dx =
</math>

<math>
\dfrac{1}{\sqrt{2\pi}} \int\limits_{-\infty}^\infty \cos(tx) e^{\frac{-x^2}{2}} dx +
\dfrac{1}{\sqrt{2\pi}} \int\limits_{-\infty}^\infty i \sin(tx) e^{\frac{-x^2}{2}} dx
</math>

ponieważ funkcja <math>\sin(x)</math> jest antysymetryczna, druga całka znika. Dostajemy

<math>
\int\limits_{-\infty}^\infty e^{itx}\frac{1}{\sqrt{2\pi }} e^{\frac{-x^2}{2}} dx =
\dfrac{1}{\sqrt{2\pi}} \int\limits_{-\infty}^\infty \cos(tx) e^{\frac{-x^2}{2}} dx
</math>

Dla części symetrycznej znajdujemy w tablicach całkę oznaczoną

<math>
\int\limits_{0}^{\infty} e^{-a^2 x^2} \cos(b x) dx
=
\frac{ \sqrt{\pi} e^{-\tfrac{b^2}{4a^2}} } {2 a}
</math>

po wymnożeniu przez 2 i podstawieniu <math> b=t</math> i <math>a^2=\frac{1}{2}</math> dostajemy

<math>
\int\limits_{-\infty}^{\infty} e^{-\frac{1}{2} x^2} \cos(t x) dx
=
\frac{ \sqrt{\pi} e^{ -\frac{t^2} { 4 \frac{1}{2} } } } {\frac{1}{\sqrt{2}}}
=
\sqrt{2\pi} e^{-\frac{t^2}{2}}
</math> , czyli

<center><math>
\phi _{x}(t) =
\int\limits_{-\infty}^\infty e^{itx}\frac{1}{\sqrt{2\pi }} e^{\frac{-x^{2}}{2}} dx =
e^{-t^2 / 2}
</math></center>

W analizie sygnałów wynik ten będzie oznaczał, że transformacja Fouriera funkcji Gaussa jest funkcją Gaussa. W tym konkretnym przypadku otrzymaliśmy funkcję tożsamą z funkcją charakterystyczną rozkładu rozważanej sumy zmiennych, czyli rozkład ten będzie (w przypadku granicznym) miał postać funkcji Gaussa.

[[Plik:Ctg.png|300px|thumb|left|<figure id="fig:ctg"></figure>Ilustracja działania Centralnego Twierdzenia Granicznego. Zmienną
<math>x_i</math> bierzemy z rozkładu równomiernego, kolejne histogramy przedstawiają sumę 2, 3 i 4
zmiennych <math>x_i</math> dla 10 000 losowań. Widać dużą zgodność z dopasowanym rozkładem
normalnym (ciągła linia) już dla niewielu sumowanych zmiennych.
]]

<xr id="fig:ctg">Rysunek %i</xr> ilustruje powyższe twierdzenie dla
przypadku sumy zmiennych pochodzących z rozkładu równomiernego. Jak
widać, już dla sumy 3 zmiennych rozkład wydaje się bardzo podobny do
normalnego. Niestety, często istotne bywają różnice dla wartości bardzo dużych lub bardzo małych. Otóż według
[[WnioskowanieStatystyczne/Rozklady-przyklady#label-eq:78|wzoru]] wartości gęstości
prawdopodobieństwa rozkładu normalnego dążą do zera dla dużych
wartości bezwzględnych zmiennej asymptotycznie, lecz zera faktycznie
nie osiągają. Inaczej mówiąc, prawdopodobieństwo wylosowania dowolnie
dużej wartości z rozkładu Gaussa będzie małe, ale nie zerowe. Za to
suma np. czterech zmiennych z rozkładu równomiernego od zera do
jedynki (prawy dolny wykres <xr id="fig:ctg">rys. %i</xr>) nie
przekroczy nigdy wartości 4, czyli prawdopodobieństwo dla
<math>x>4</math> będzie dokładnie zerem. I choć w skali <xr
id="fig:ctg">rysunku %i</xr> efekt ten jest prawie niewidoczny, warto
pamiętać, że testy oparte na założeniu normalności rozkładów często
operują właśnie w okolicach tych "ogonów", gdzie przybliżenie
rozkładu normalnego, uzyskane za pomocą tej prostej procedury,
zawodzi.

-----------------------
<references />