Statistik - Geschichtete Stichprobe

Diese Untersuchungsstrategie wird als Teil eines Umstands verwendet, in dem die Bevölkerung mühelos in Gruppen oder Schichten unterteilt werden kann, die sich besonders stark voneinander unterscheiden, die Bestandteile einer Gruppe jedoch hinsichtlich einiger Attribute, z. B. der Schulunterschiede, homogen sind kann nach sexueller Orientierung, Kursen, Alter usw. in Schichten unterteilt werden. Dabei wird die Population zunächst in Schichten aufgeteilt und anschließend aus jeder Schicht eine unregelmäßige Grundprobe entnommen. Es gibt zwei Arten von Schichtprüfungen: eine verhältnismäßig geschichtete Prüfung und eine unverhältnismäßig geschichtete Prüfung.

  • Proportionale geschichtete Stichprobe - Die Anzahl der aus jeder Schicht ausgewählten Einheiten ist proportional zum Anteil der Schicht an der Bevölkerung, z. B. an einem College gibt es insgesamt 2500 Studenten, von denen 1500 Studenten an Graduiertenkursen und 1000 an Postgraduiertenkursen eingeschrieben sind Kurse. Wenn eine Stichprobe von 100 anhand einer anteiligen geschichteten Stichprobe ausgewählt werden soll, sind 60 Studenten und 40 Postgraduiertenstudenten in der Stichprobe. Somit sind die beiden Schichten in der Stichprobe im gleichen Verhältnis vertreten wie in der Bevölkerung.

    Diese Methode ist am besten geeignet, wenn der Zweck der Stichprobe darin besteht, den Populationswert eines Merkmals zu schätzen, und es keinen Unterschied bei den Abweichungen zwischen den Schichten gibt.

  • Überproportionale geschichtete Stichprobe - Wenn der Zweck der Studie darin besteht, die Unterschiede zwischen den Schichten zu vergleichen, muss aus allen Schichten unabhängig von ihrem Bevölkerungsanteil die gleiche Einheit gezogen werden. Manchmal sind einige Schichten in Bezug auf ein Merkmal variabler als andere Schichten, in einem solchen Fall kann eine größere Anzahl von Einheiten aus den variableren Schichten gezogen werden. In beiden Fällen handelt es sich bei der gezogenen Stichprobe um eine unverhältnismäßig geschichtete Stichprobe.

    Der Unterschied zwischen Schichtgröße und Schichtvariabilität kann mit der folgenden Formel zur Bestimmung der Stichprobengröße aus verschiedenen Schichten optimal zugeordnet werden

    Formel

    $ {n_i = \ frac {n.n_i \ sigma_i} {n_1 \ sigma_1 + n_2 \ sigma_2 + ... + n_k \ sigma_k} \ for \ i = 1,2 ... k} $

    Wo -

    • $ {n_i} $ = die Stichprobengröße von i Schichten.

    • $ {n} $ = die Größe der Schichten.

    • $ {\ sigma_1} $ = die Standardabweichung von i Schichten.

    Darüber hinaus kann es vorkommen, dass die Kosten für das Sammeln einer Stichprobe in einer Schicht höher sind als in einer anderen. Die optimale unverhältnismäßige Probenahme sollte so erfolgen, dass

    $ {\ frac {n_1} {n_1 \ sigma_1 \ sqrt {c_1}} = \ frac {n_2} {n_2 \ sigma_1 \ sqrt {c_2}} = ... = \ frac {n_k} {n_k \ sigma_k \ sqrt { c_k}}} $

    Dabei beziehen sich $ {c_1, c_2, ..., c_k} $ auf die Kosten der Stichprobe in k Schichten. Der Stichprobenumfang aus verschiedenen Schichten kann mit folgender Formel ermittelt werden:

    $ {n_i = \ frac {\ frac {n.n_i \ sigma_i} {\ sqrt {c_i}} {\ frac {n_1 \ sigma_1} {\ sqrt {c_i}} + \ frac {n_2 \ sigma_2} {\ sqrt {c_2}} + ... + \ frac {n_k \ sigma_k} {\ sqrt {c_k}} \ for \ i = 1,2 ... k} $

Beispiel

Problemstellung:

Eine Organisation hat 5000 Mitarbeiter, die in drei Ebenen unterteilt sind.

  • Schicht A: 50 Führungskräfte mit Standardabweichung = 9

  • Schicht B: 1250 Angestellte mit Standardabweichung = 4

  • Schicht C: 3700 Arbeiter mit Standardabweichung = 1

Wie wird eine Stichprobe von 300 Mitarbeitern mit optimaler Zuordnung überproportional gezogen?

Lösung:

Verwendung der Formel der unverhältnismäßigen Probenahme für eine optimale Zuordnung.

$ {n_i = \ frac {n.n_i \ sigma_i} {n_1 \ sigma_1 + n_2 \ sigma_2 + n_3 \ sigma_3}} \\ [7pt] \, für Stream A {n_1 = \ frac {300 (50) (9 )} {(50) (9) + (1250) (4) + (3700) (1)} \\ [7pt] \, = {\ frac {135000} {1950} = {14,75} \ oder \ say \ {15}} \\ [7pt] \, für Stream B: {n_1 = \ frac {300 (1250) (4)} {(50) (9) + (1250) (4) + (3700) (1 )}} \\ [7pt] \, = {\ frac {150000} {1950} = {163,93} \ oder \ say \ {167}} \\ [7pt] \, für Stream C {n_1 = \ frac { 300 (3700) (1)} {(50) (9) + (1250) (4) + (3700) (1)} \\ [7pt] \, = {\ frac {110000} {1950} = { 121.3} \ oder \ say \ {121}} $