Statistik - Intervallschätzung

Die Intervallschätzung ist die Verwendung von Probendaten zur Berechnung eines Intervalls möglicher (oder wahrscheinlicher) Werte eines unbekannten Populationsparameters im Gegensatz zur Punktschätzung, bei der es sich um eine einzelne Zahl handelt.

Formel

$ {\ mu = \ bar x \ pm Z _ {\ frac {\ alpha} {2}} \ frac {\ sigma} {\ sqrt n}} $

Wo -

  • $ {\ bar x} $ = Mittelwert

  • $ {Z _ {\ frac {\ alpha} {2}}} $ = der Konfidenzkoeffizient

  • $ {\ alpha} $ = Konfidenzniveau

  • $ {\ sigma} $ = Standardabweichung

  • $ {n} $ = Stichprobengröße

Beispiel

Problemstellung:

Angenommen, ein Schüler, der die Siedetemperatur einer bestimmten Flüssigkeit misst, beobachtet die Messwerte (in Grad Celsius) 102,5, 101,7, 103,1, 100,9, 100,5 und 102,2 an 6 verschiedenen Proben der Flüssigkeit. Er berechnet den Stichprobenmittelwert auf 101,82. Wenn er weiß, dass die Standardabweichung für dieses Verfahren 1,2 Grad beträgt, was bedeutet die Intervallschätzung für die Grundgesamtheit bei einem Konfidenzniveau von 95%?

Lösung:

Der Student berechnete den Stichprobenmittelwert der Siedetemperaturen zu 101,82 mit einer Standardabweichung von $ {\ sigma = 0,49} $. Der kritische Wert für ein 95% -Konfidenzintervall ist 1,96, wobei $ {\ frac {1-0,95} {2} = 0,025} $. Ein 95% -Konfidenzintervall für den unbekannten Mittelwert.

$ {= ((101,82 - (1,96 × 0,49)), (101,82 + (1,96 × 0,49))) \\ [7pt] \ = (101,82 - 0,96, 101,82 + 0,96) \\ [7pt] \ = ( 100,86, 102,78)} $

Mit abnehmendem Konfidenzniveau nimmt die Größe des entsprechenden Intervalls ab. Angenommen, der Student war an einem 90% -Konfidenzintervall für die Siedetemperatur interessiert. In diesem Fall ist $ {\ sigma = 0.90} $ und $ {\ frac {1-0.90} {2} = 0.05} $. Der kritische Wert für dieses Level beträgt 1,645, das 90% -Konfidenzintervall also

$ {= ((101,82 - (1,645 × 0,49)), (101,82 + (1,645 × 0,49))) \\ [7pt] \ = (101,82 - 0,81, 101,82 + 0,81) \\ [7pt] \ = ( 101,01, 102,63)} $

Eine Erhöhung der Stichprobengröße verringert die Länge des Konfidenzintervalls, ohne das Konfidenzniveau zu verringern. Dies liegt daran, dass die Standardabweichung abnimmt, wenn n zunimmt.

Fehlermarge

Die Fehlerspanne $ {m} $ der Intervallschätzung ist definiert als der Wert, der zum Stichprobenmittelwert addiert oder subtrahiert wird, der die Länge des Intervalls bestimmt:

$ {Z _ {\ frac {\ alpha} {2}} \ frac {\ sigma} {\ sqrt n}} $

Angenommen, der Student möchte im obigen Beispiel eine Fehlertoleranz von 0,5 mit einer Sicherheit von 95% haben. Das Einsetzen der entsprechenden Werte in den Ausdruck für $ {m} $ und das Auflösen nach n ergibt die Berechnung.

$ {n = {(1,96 \ times \ frac {1,2} {0,5})} ^ 2 \\ [7pt] \ = {\ frac {2,35} {0,5} ^ 2} \\ [7pt] \ = {(4,7 )} ^ 2 \ = 22.09} $

Um eine 95% -Intervallschätzung für den mittleren Siedepunkt mit einer Gesamtlänge von weniger als 1 Grad zu erreichen, muss der Schüler 23 Messungen durchführen.