MathePrisma Logo

Konfidenzintervalle und Hypothesentests

Konfidenzintervalle und Hypothesentests

Stichprobenerhebungen

Betätigen wir uns also nochmal als Wahlforscher:

Wahlforschung

Um die folgenden Überlegungen zu vereinfachen, betrachten wir nur den Anteil einer Partei, zum Beispiel der SPD.

  • Von den n = 1000 befragten Personen haben h = angegeben, die SPD bei der bevorstehenden Bundestagswahl zu wählen.
  • Der tatsächliche SPD-Wähleranteil der wahlberechtigten Bevölkerung wird mit p (hier p=38,5%) bezeichnet.
  • Dann ist n·p (hier 385) das Stichprobenergebnis, das man im Mittel erwartet.
Wie oft die durch die Simulation gebildeten Werte dem tatsächlichen Wert n·p=385 entsprechen, werden wir jetzt in einer "Langzeitstudie" untersuchen, indem wir 100 mal die obige Testreihe mit jeweils 1000 Einzeluntersuchungen durchführen.



Achtung: Diese Simulation rechnet ein paar Sekunden

Ergebnisse der 100 Stichproben mit Länge 1000: 

Beobachtungen

In den einzelnen Testreihen liegen die Ergebnisse besonders häufig in der Nähe des Erwartungswertes n·p.
Allerdings kommt der exakte Wert n·p fast nie als Stichprobenergebnis vor.

Eine sogenannte Punktschätzung, d.h. die Prognose, dass ein exakter Wert als Ergebnis einer Stichprobe erreicht wird, stellt sich also nur äußerst selten als richtig heraus.

Man löst dieses Problem durch die Angabe einer Intervallschätzung.



Achtung: Diese Simulation rechnet ein paar Sekunden

Anzahl der Stichprobenergebnisse, die in dem jeweiligen Intervall um den Erwartungswert n·p=385 liegen: 

  • [385;385]:
  • [380;390]:
  • [375;395]:
  • [360;410]:

Beobachtung

ACHTUNG: Das sind KEINE Konfidenzintervalle.

Bei mehrfacher Anwendung der Simulation erkennst du, dass (bei n·p=385)

  • etwa 25% der Stichprobenergebnisse im Intervall [n·p-5 ; n·p+5] liegen.
  • etwa 50% der Stichprobenergebnisse im Intervall [n·p-10 ; n·p+10] liegen.
  • etwa 90% der Stichprobenergebnisse im Intervall [n·p-25 ; n·p+25] liegen.

Der Übergang zu einem statistischen Modell

Die obige Stichprobe entspricht dann dem folgenden Urnenversuch:
  • In einer Urne befinden sich 100 Kugeln, von denen 100·p markiert sind.
  • Damit ist der prozentuale Wert von p leicht realisiert.
  • Man zieht nun n Kugeln mit anschließendem Zurücklegen, und bezeichnet die Anzahl der markierten Kugeln mit h.
  

Ein solcher Zufallsversuch (nach dem Treffer/Fehlschlag-Prinzip) wird durch die Binomialverteilung beschrieben. Er lässt sich auf alle Stichproben beziehen, die die Wahrscheinlichkeit eines Ereignisses untersuchen. Die Wahrscheinlichkeit, h = k mal eine markierte Kugel zu ziehen bzw. einen SPD-Wähler zu befragen, ist dann durch
      \(P(X=k) = B(n;p;k) = \begin{pmatrix} n \\ k \end{pmatrix} p^k (1-p)^{n-k}\)
gegeben. Der Typ der zu Grunde liegenden Verteilung ist zwar bekannt, da aber p ein unbekannter Parameter ist, kann man über die tatsächliche Verteilungskurve nur spekulieren.

Wir testen nun mit weiteren Stichproben, wie sehr die einzelnen Stichproben variieren können. Es wird also untersucht, wie gut man Erkenntnisse über eine zufällig ausgewählte Teilmenge auf andere Teilmengen bzw. auf die Gesamtmenge übertragen kann.



Achtung: Diese Simulation rechnet ein paar Sekunden

Binomialverteilung bei Stichprobenlänge 1000

Du kannst dich nun wieder als Berater der Blauen Partei betätigen, Umfragen durchführen und Prognosen stellen:

  • Führe mehrere (1, 10, 1000, ...) Stichproben der Länge 100 durch.
  • Stelle mit dem Schieberegler den Erwartungswert ein, der dem Ergebnis deiner Meinung nach zu Grunde liegt.


In welchem Intervall variieren die einzelnen Stichprobenergebnisse? Wie gut nähern sich die Ergebnisse der Binomialverteilung an?

Beobachtungen

Eine grobe Näherung für den Erwartungswert bekommt man schnell, aber eine genauere Näherung bedarf vieler Tests.