MathePrisma Logo

Konfidenzintervalle und Hypothesentests

Konfidenzintervalle und Hypothesentests

Herleitung

Auf diesem Nebenpfad sollen die hergeleiteten Formeln

\[ \sum_{k=h}^n B(n;p_u;k) = \frac{\alpha}{2}\;,\;\;\sum_{k=0}^h B(n;p_o;k) = \frac{\alpha}{2} \]


zur Bestimmung der Intervallgrenzen \(p_u\) und \(p_o\) approximiert werden.

Approximation der Binomialverteilung

Nach dem Satz von Moivre-Laplace kann die Binomialverteilung für \(\sigma\) > 3 durch die Normalverteilung approximiert werden:
\(B(n;p;k) \approx \frac{1}{\sqrt{2 \pi} \sigma} \cdot e^{-\frac{1}{2}(\frac{k-\mu}{\sigma})^2}\), mit \(\mu = np, \; \sigma=\sqrt{np(1-p)}\)

Für die Verteilungsfunktion folgt dann:

\(\sum \limits_{k=0}^{b}B(n;p;k) \approx \int_{-\infty}^{b + \frac{1}{2}} \frac{1}{\sqrt{2 \pi} \sigma} \cdot e^{-\frac{1}{2}(\frac{k-\mu}{\sigma})^2}dk\)
Die Erhöhung der Variablen b um 0,5 ergibt sich durch den Übergang von der Summe zum Integral. Bei der Approximation der diskreten Verteilung durch eine stetige Verteilung bezeichnet man die Transformation von b zu b+0,5 als Stetigkeitskorrektur. Durch Bewegen des Mauszeigers auf das folgende Bild kannst du diesen Übergang erkennen.

Stetigkeitskorrektur

Ein wenig Analysis

Die obige Formel

\[ \sum_{k=0}^{b}B(n;p;k) \approx \int_{-\infty}^{b + \frac{1}{2}} \frac{1}{\sqrt{2 \pi} \sigma} \cdot e^{-\frac{1}{2}(\frac{k-\mu}{\sigma})^2}dk \]


kann noch vereinfacht werden. Führe dazu die Substitution

\[ t:= \frac{k-\mu}{\sigma} \]


in einer Nebenrechnung durch und klicke dann mit der Maus auf die richtige Lösung:

En bekanntes Integral

Das Integral sollte dir bekannt vorkommen. Es handelt sich dabei um das Gauß-Integral \(\Phi(x)\) - die Verteilungsfunktion der Standardnormalverteilung (Gauß'sche Glockenkurve).

Wir fassen die Ergebnisse zusammen:

Die Verteilungsfunktion der Binomialverteilung lässt sich gemäß
\(\sum \limits_{k=0}^b B(n;p;k) \approx \Phi(\frac{b+\frac{1}{2} - \mu}{\sigma})\), mit \(\Phi(x)\;=\; \int_{-\infty}^x \frac{1}{\sqrt{2 \pi}} e^{-\frac{1}{2} t^2}dt\)
durch die Normalverteilung approximieren.

Wir benötigen auch die folgende Binomialsumme:

Eine weitere Binomialsumme

Fazit

Zur Approximation der Binomialverteilung wird also nur noch \(\Phi(x)\) benötigt.

Anwendung auf Konfidenzintervalle

Unter Verwendung der gerade hergeleiteten Approximationsformeln
\(\sum \limits_{k=0}^a B(n;p;k) \approx \Phi(\frac{a+\frac{1}{2} - \mu}{\sigma})\)
\(\sum \limits_{k=b}^n B(n;p;k) \approx 1 - \Phi(\frac{b - \frac{1}{2} - \mu}{\sigma})\)
mit \(\mu = np\) sollen nun die Intervallgrenzen von

\([n \cdot p_u; \; n \cdot p_o ]\)
bestimmt werden. Die Standardabweichung der Binomialverteilung
\(\sigma = \sqrt{np(1-p)}\)
wird geschätzt, indem man für den unbekannten Wert p die relative Trefferanzahl der Stichprobe \(\frac{h}{n}\) einsetzt. Durch die Symmetrie der Normalverteilung ist folgende Definition naheliegend:
\(d:= h - n \cdot p_u = n \cdot p_o - h\)
Damit hat das Konfidenzintervall also eine Länge von 2d und lautet
\([h-d ; \; h+d]\).
Da beide Intervallgrenzen voneinander abhängig sind, kann man die beiden Formeln zur Bestimmung der Intervallgrenzen zusammenfassen. Dann ist die folgende Gleichung zu approximieren:
\(1 - \sum \limits_{k=h}^n B(n;p_u;k) - \sum \limits_{k=0}^h B(n;p_o;k) = 1 - \alpha\)

Ein wenig Analysis ...

Setze nun in die obigen Approximationsformeln für a und b die Intervallgrenzen sowie für \(\mu\) den Erwartungswert ein und führe die Approximation in einer Nebenrechnung durch. Klicke dann mit der Maus auf die richtigen Gleichungen für \(1-\alpha\):

Ein kleiner Tipp

Eine gute Näherung

Oft ist der Stichprobenumfang n ausreichend groß, so dass man die Stetigkeitskorrektur vernachlässigen kann.

Das Konfidenzintevall

Das Konfidenzintervall [h-d ; h+d] für \(\mu = np\) besitzt die Konfidenzwahrscheinlichkeit
\(1 - \alpha = P(\mu \in [h-d;\; h+d]) \approx 2 \Phi(\frac{d}{\sigma}) - 1\)

slideshow6herleitung1
slideshow6herleitung2
slideshow6herleitung3
slideshow6herleitung4
slideshow6herleitung5