Bevölkerung vs. Stichprobenstandardabweichung
In der Statistik werden mehrere Indizes verwendet, um einen Datensatz zu beschreiben, der seiner zentralen Tendenz, Streuung und Schiefe entspricht. Die Standardabweichung ist eine der häufigsten Messungen der Streuung von Daten vom Mittelpunkt des Datensatzes.
Aufgrund praktischer Schwierigkeiten wird es nicht möglich sein, Daten aus der Gesamtbevölkerung zu verwenden, wenn eine Hypothese getestet wird. Daher verwenden wir Datenwerte aus Stichproben, um Rückschlüsse auf die Bevölkerung zu ziehen. In einer solchen Situation werden diese Schätzer genannt, da sie die Bevölkerungsparameterwerte schätzen.
Es ist äußerst wichtig, unverzerrte Schätzer für die Inferenz zu verwenden. Ein Schätzer wird als unvoreingenommen bezeichnet, wenn der erwartete Wert dieses Schätzers gleich dem Populationsparameter ist. Zum Beispiel verwenden wir den Stichprobenmittelwert als unverzerrten Schätzer für den Bevölkerungsmittelwert. (Mathematisch kann gezeigt werden, dass der erwartete Wert des Stichprobenmittelwerts gleich dem Populationsmittelwert ist). Bei der Schätzung der Populationsstandardabweichung ist auch die Stichprobenstandardabweichung ein unvoreingenommener Schätzer.
Was ist die Standardabweichung der Bevölkerung??
Wenn Daten aus der Gesamtbevölkerung berücksichtigt werden können (z. B. bei einer Volkszählung), kann die Populationsstandardabweichung berechnet werden. Zur Berechnung der Standardabweichung der Grundgesamtheit werden zunächst die Abweichungen der Datenwerte vom Mittelwert der Grundgesamtheit berechnet. Der quadratische Mittelwert (quadratischer Mittelwert) der Abweichungen wird als Populationsstandardabweichung bezeichnet.
In einer Klasse von 10 Schülern können leicht Daten über die Schüler gesammelt werden. Wenn eine Hypothese für diese Schülergruppe getestet wird, müssen keine Stichprobenwerte verwendet werden. Die Gewichte der zehn Schüler (in Kilogramm) werden beispielsweise mit 70, 62, 65, 72, 80, 70, 63, 72, 77 und 79 gemessen. Dann beträgt das Durchschnittsgewicht der zehn Personen (in Kilogramm) (70 + 62 + 65 + 72 + 80 + 70 + 63 + 72 + 77 + 79) / 10, was 71 (in Kilogramm) ist. Dies ist der Bevölkerungsdurchschnitt.
Zur Berechnung der Populationsstandardabweichung berechnen wir nun Abweichungen vom Mittelwert. Die jeweiligen Abweichungen vom Mittelwert sind (70 - 71) = -1, (62 - 71) = -9, (65 - 71) = -6, (72 - 71) = 1, (80 - 71) = 9, (70 - 71) = -1, (63 - 71) = -8, (72 - 71) = 1, (77 - 71) = 6 und (79 - 71) = 8. Die Summe der Quadrate der Abweichung ist ( -1)2 + (-9)2 + (-6)2 + 12 + 92 + (-1)2 + (-8)2 + 12 + 62 + 82 = 366. Die Standardabweichung der Bevölkerung beträgt √ (366/10) = 6,05 (in Kilogramm). 71 ist das genaue Durchschnittsgewicht der Schüler der Klasse und 6,05 ist die exakte Standardabweichung des Gewichts von 71.
Was ist die Standardabweichung??
Wenn Daten aus einer Stichprobe (der Größe n) zur Abschätzung von Populationsparametern verwendet werden, wird die Standardabweichung der Stichprobe berechnet. Zuerst werden die Abweichungen der Datenwerte vom Mittelwert der Stichprobe berechnet. Da der Stichprobenmittelwert anstelle des Populationsmittelwerts (der unbekannt ist) verwendet wird, ist die Verwendung des quadratischen Mittelwerts nicht angemessen. Um die Verwendung des Stichprobenmittelwerts zu kompensieren, wird die Summe der Abweichungsquadrate durch (n-1) anstelle von n geteilt. Die Musterstandardabweichung ist die Quadratwurzel davon. In mathematischen Symbolen gilt S = √ ∑ (xich-ẍ)2 / (n-1), wobei S die Standardabweichung der Stichprobe ist, ẍ der Mittelwert der Stichprobe und x istichsind die Datenpunkte.
Nehmen Sie jetzt an, dass im vorherigen Beispiel die Bevölkerung die Schüler der gesamten Schule sind. Dann wird die Klasse nur eine Probe sein. Wenn diese Probe für die Schätzung verwendet wird, beträgt die Standardabweichung der Probe √ (366/9) = 6,38 (in Kilogramm), da 366 anstelle von 10 (die Stichprobengröße) durch 9 geteilt wurde. Zu beachten ist, dass dies nicht der genaue Standardabweichungswert der Population ist. Es ist lediglich eine Schätzung dafür.
Was ist der Unterschied zwischen Populationsstandardabweichung und Stichprobenstandardabweichung?? • Die Bevölkerungsstandardabweichung ist der genaue Parameterwert, der zur Messung der Streuung von der Mitte aus verwendet wird, während die Standardabweichung der Stichprobe ein neutraler Schätzer dafür ist. • Die Standardabweichung der Bevölkerung wird berechnet, wenn alle Daten zu jeder einzelnen Bevölkerung bekannt sind. Andernfalls wird die Standardabweichung der Probe berechnet. • Die Standardabweichung der Bevölkerung wird durch σ = √ ∑ (xi-µ) angegeben.2/ n wobei µ der Populationsmittelwert und n die Populationsgröße ist, die Standardabweichung der Stichprobe jedoch gegeben ist durch S = √ ∑ (xi-ẍ)2 / (n-1) wobei ẍ der Stichprobenmittelwert und n die Stichprobengröße ist.
|