Einführung
Standard Deviation (SD) und SStandard ERror (SE) scheinbar ähnliche Terminologien; Sie sind jedoch konzeptionell so vielfältig, dass sie in der Statistikliteratur fast austauschbar verwendet werden. Vor beiden Begriffen steht normalerweise ein Plus-Minus-Symbol (+/-), das darauf hinweist, dass sie einen symmetrischen Wert definieren oder einen Wertebereich darstellen. Beide Ausdrücke werden immer mit einem Durchschnitt (Mittelwert) einer Gruppe von Messwerten angezeigt.
Interessanterweise hat eine SE nichts mit Standards, Fehlern oder der Übermittlung wissenschaftlicher Daten zu tun.
Ein detaillierter Blick auf den Ursprung und die Erklärung von SD und SE wird zeigen, warum professionelle Statistiker und diejenigen, die sie flüchtig benutzen, beide irren.
Standardabweichung (SD)
Eine SD ist eine beschreibend Statistik, die die Verbreitung einer Verteilung beschreibt. Als Metrik ist es nützlich, wenn die Daten normal verteilt sind. Es ist jedoch weniger nützlich, wenn Daten stark verzerrt oder bimodal sind, da sie die Form der Verteilung nicht sehr gut beschreiben. Normalerweise verwenden wir SD, wenn wir die Merkmale der Stichprobe melden, weil wir dies beabsichtigen beschreiben wie stark die Daten um den Mittelwert variieren. Andere nützliche Statistiken zur Beschreibung der Streuung der Daten sind der Bereich zwischen den Quartilen, das 25. und 75. Perzentil und der Bereich der Daten.
Abbildung 1. SD ist ein Maß für die Streuung der Daten. Wenn Daten eine Stichprobe aus einer normalverteilten Verteilung sind, erwartet man, dass zwei Drittel der Daten innerhalb einer Standardabweichung von 1 liegen.
Abweichung ist a beschreibend Statistik auch, und es ist definiert als das Quadrat der Standardabweichung. Es wird normalerweise nicht bei der Beschreibung der Ergebnisse angegeben, aber es handelt sich um eine mathematisch nachvollziehbare Formel (auch als Summe der Abweichungen des Quadrats), die bei der Berechnung der Statistiken eine Rolle spielt.
Zum Beispiel, wenn wir zwei Statistiken haben P & Q mit bekannten Abweichungen var(P) & var(Q), dann die Varianz der Summe P + Q ist gleich der Summe der Abweichungen: var(P) +var(Q). Es ist jetzt offensichtlich, warum Statistiker gerne über Abweichungen sprechen.
Standardabweichungen haben jedoch eine wichtige Bedeutung für die Streuung, insbesondere wenn die Daten normal verteilt sind: Das Intervallmittel +/ - 1 SD kann erwartet werden, um 2/3 der Probe und das Intervallmittel zu erfassen +- 2 SD kann erwartet werden, um 95% der Probe zu erfassen.
SD gibt an, inwieweit die einzelnen Antworten auf eine Frage vom Mittelwert abweichen oder "abweichen". SD sagt dem Forscher, wie weit die Antworten verteilt sind - konzentrieren sie sich auf den Mittelwert oder sind sie weit und breit verstreut? Haben alle Ihre Befragten Ihr Produkt in der Mitte Ihrer Waage bewertet, oder haben einige es genehmigt und andere missbilligen es?
Stellen Sie sich ein Experiment vor, bei dem die Befragten gebeten werden, ein Produkt anhand einer Reihe von Attributen auf einer 5-Punkte-Skala zu bewerten. Der Mittelwert für eine Gruppe von zehn Befragten (bezeichnet als „A“ bis „J“ unten) für „gutes Preis-Leistungs-Verhältnis“ betrug 3,2 mit einem SD von 0,4 und der Mittelwert für „Produktzuverlässigkeit“ betrug 3,4 mit einem SD von 2,1.
Auf den ersten Blick (nur bei den Mitteln) scheint die Zuverlässigkeit höher als der Wert zu sein. Der höhere SD für Zuverlässigkeit könnte (wie in der nachstehenden Verteilung gezeigt) zeigen, dass die Antworten sehr polarisiert waren, wobei die meisten Befragten keine Zuverlässigkeitsprobleme hatten (das Attribut wurde mit „5“ bewertet), aber ein kleineres, aber wichtiges Segment der Befragten hatte ein Zuverlässigkeitsproblem und bewertet das Attribut „1“. Ein Blick auf den Mittelwert allein sagt nur einen Teil der Geschichte aus, jedoch konzentrieren sich die Forscher in den meisten Fällen darauf. Die Verteilung der Antworten ist wichtig und der SD bietet eine wertvolle beschreibende Maßnahme.
Befragter | Guter Wert für das Geld | Produktzuverlässigkeit |
EIN | 3 | 1 |
B | 3 | 1 |
C | 3 | 1 |
D | 3 | 1 |
E | 4 | 5 |
F | 4 | 5 |
G | 3 | 5 |
H | 3 | 5 |
ich | 3 | 5 |
J | 3 | 5 |
Bedeuten | 3.2 | 3.4 |
Std. Dev. | 0,4 | 2.1 |
Erste Umfrage: Die Befragten bewerten ein Produkt auf einer 5-Punkte-Skala
Zwei sehr unterschiedliche Verteilungen der Antworten auf eine 5-Punkte-Bewertungsskala können denselben Mittelwert ergeben. Betrachten Sie das folgende Beispiel mit Antwortwerten für zwei verschiedene Bewertungen.
Im ersten Beispiel (Rating „A“) ist SD Null, da ALLE Antworten genau der Mittelwert waren. Die einzelnen Antworten unterschieden sich nicht vom Mittelwert.
In der Bewertung "B" ist die Standardabweichung höher, obwohl der Gruppenmittelwert der gleichen Verteilung (3,0) entspricht wie die erste Verteilung. Die Standardabweichung von 1,15 zeigt, dass die einzelnen Antworten im Durchschnitt * etwas mehr als 1 Punkt vom Mittelwert entfernt waren.
Befragter | Bewertung "A" | Bewertung "B" |
EIN | 3 | 1 |
B | 3 | 2 |
C | 3 | 2 |
D | 3 | 3 |
E | 3 | 3 |
F | 3 | 3 |
G | 3 | 3 |
H | 3 | 4 |
ich | 3 | 4 |
J | 3 | 5 |
Bedeuten | 3,0 | 3,0 |
Std. Dev. | 0,00 | 1,15 |
Zweite Umfrage: Die Befragten bewerten ein Produkt auf einer 5-Punkte-Skala
Eine andere Sichtweise von SD besteht darin, die Verteilung als Histogramm der Antworten aufzuzeichnen. Eine Verteilung mit niedrigem SD würde als große schmale Form angezeigt, während ein großer SD durch eine breitere Form angezeigt wird.
SD zeigt im Allgemeinen nicht „richtig oder falsch“ oder „besser oder schlechter“ an - ein niedrigerer SD ist nicht unbedingt wünschenswert. Sie wird nur als beschreibende Statistik verwendet. Es beschreibt die Verteilung in Bezug auf den Mittelwert.
Technischer Haftungsausschluss in Bezug auf SD
SD als eine „durchschnittliche Abweichung“ zu verstehen, ist eine hervorragende Möglichkeit, seine Bedeutung konzeptionell zu verstehen. Es wird jedoch nicht als Durchschnitt berechnet (wenn dies der Fall wäre, würden wir es als "durchschnittliche Abweichung" bezeichnen). Stattdessen handelt es sich um eine „standardisierte“ Methode, um den Wert anhand der Summe der Quadrate zu berechnen.
Aus praktischen Gründen ist die Berechnung nicht wichtig. Die meisten Tabellenprogramme, Tabellenkalkulationen oder andere Datenverwaltungstools berechnen den SD für Sie. Wichtiger ist es zu verstehen, was die Statistiken vermitteln.
Standart Fehler
Ein Standardfehler ist ein Folgerung Statistik, die verwendet wird, wenn Stichprobenmittelwerte (Durchschnittswerte) zwischen Populationen verglichen werden. Es ist ein Maß für Präzision der Stichprobenmittelwert. Der Stichprobenmittelwert ist eine Statistik, die von Daten abgeleitet wird, denen eine zugrunde liegende Verteilung zugrunde liegt. Wir können es nicht auf dieselbe Weise wie die Daten visualisieren, da wir ein einzelnes Experiment durchgeführt haben und nur einen einzigen Wert haben. Die statistische Theorie sagt uns, dass der Stichprobenmittelwert (für eine große Stichprobe und unter einigen Regularitätsbedingungen) annähernd normalverteilt ist. Die Standardabweichung dieser Normalverteilung nennen wir den Standardfehler.
Figur 2. Die Verteilung im unteren BereichSendet die Verteilung der Daten, während die Verteilung oben die theoretische Verteilung des Stichprobenmittelwerts ist. Der SD von 20 ist ein Maß für die Streuung der Daten, während der SE von 5 ein Maß für die Unsicherheit um den Stichprobenmittelwert ist.
Wenn wir die Mittelwerte der Ergebnisse eines Zwei-Proben-Experiments von Behandlung A mit Behandlung B vergleichen möchten, müssen wir abschätzen, wie genau wir die Mittel gemessen haben.
Eigentlich interessiert uns, wie genau wir den Unterschied zwischen den beiden Mitteln gemessen haben. Wir nennen dieses Maß den Standardfehler der Differenz. Sie sind vielleicht nicht überrascht zu erfahren, dass der Standardfehler der Differenz in den Stichprobenmitteln von den Standardfehlern der Mittelwerte abhängt:
Nun, da Sie verstanden haben, dass der Standardfehler des Mittelwerts (SE) und die Standardabweichung der Verteilung (SD) zwei verschiedene Bestien sind, fragen Sie sich vielleicht, wie sie überhaupt verwirrt wurden. Während sie sich konzeptionell unterscheiden, haben sie mathematisch eine einfache Beziehung:
,Dabei ist n die Anzahl der Datenpunkte.
Beachten Sie, dass der Standardfehler von zwei Komponenten abhängt: der Standardabweichung der Probe und der Größe der Probe n. Dies ist intuitiv sinnvoll: Je größer die Standardabweichung der Stichprobe ist, desto ungenauer können wir uns über die Schätzung des wahren Durchschnitts entscheiden.
Je größer die Stichprobengröße, desto mehr Informationen haben wir über die Grundgesamtheit und desto genauer können wir den wahren Mittelwert schätzen.
SE ist ein Hinweis auf die Zuverlässigkeit des Mittelwerts. Ein kleines SE zeigt an, dass das Stichprobenmittel eine genauere Abbildung des tatsächlichen Bevölkerungsmittels darstellt. Eine größere Stichprobengröße führt normalerweise zu einer kleineren SE (während SD nicht direkt durch die Stichprobengröße beeinflusst wird)..
Die meisten Umfragen beinhalten die Entnahme einer Stichprobe aus einer Population. Aus den Ergebnissen dieser Stichprobe lassen sich dann Rückschlüsse auf die Bevölkerung ziehen. Wenn eine zweite Probe gezogen wurde, stimmen die Ergebnisse wahrscheinlich nicht genau mit der ersten Probe überein. Wenn der Mittelwert für ein Bewertungsattribut für eine Stichprobe 3,2 betrug, könnte er für eine zweite Stichprobe derselben Größe 3,4 sein. Wenn wir eine unendliche Anzahl von Proben (von gleicher Größe) aus unserer Population ziehen würden, könnten wir die beobachteten Mittelwerte als Verteilung darstellen. Wir könnten dann einen Durchschnitt aller Stichprobenmittel berechnen. Dieses Mittel würde dem wahren Bevölkerungsmittelwert entsprechen. Wir können auch den SD der Verteilung der Stichprobenmittel berechnen. Der SD dieser Verteilung der Probenmittelwerte ist der SE jedes einzelnen Probenmittelwertes.
Wir haben also unsere wichtigste Beobachtung: SE ist der SD des Bevölkerungsmittels.
Probe | Bedeuten |
1 | 3.2 |
2. | 3.4 |
3. | 3.3 |
4. | 3.2 |
5. | 3.1 |
… . | … . |
… . | … . |
… . | … . |
… . | … . |
… . | … . |
Bedeuten | 3.3 |
Std. Dev. | 0,13 |
Tabelle zur Veranschaulichung der Beziehung zwischen SD und SE
Es ist nun klar, dass, wenn der SD dieser Verteilung uns hilft zu verstehen, wie weit ein Stichprobenmittelwert vom wahren Populationsmittelwert entfernt ist, wir dies verwenden können, um zu verstehen, wie genau ein einzelner Stichprobenmittelwert im Verhältnis zum wahren Mittelwert ist. Das ist das Wesen von SE.
Tatsächlich haben wir nur eine einzige Stichprobe aus unserer Grundgesamtheit gezogen, aber wir können dieses Ergebnis verwenden, um eine Schätzung der Zuverlässigkeit unseres beobachteten Stichprobenmittelwerts zu erhalten.
In der Tat sagt uns SE, dass wir zu 95% sicher sein können, dass unser beobachteter Mittelwert der Stichprobe plus oder minus etwa 2 (tatsächlich 1,96) Standardfehler aus dem Populationsmittelwert ist.
Die folgende Tabelle zeigt die Verteilung der Antworten aus unserer ersten (und einzigen) Probe, die für unsere Forschung verwendet wurde. Der SE von 0,13 ist relativ klein und lässt darauf schließen, dass unser Mittelwert dem wahren Durchschnitt unserer Gesamtbevölkerung nahe kommt. Die Fehlerquote (bei 95% Konfidenz) für unseren Mittelwert ist (ungefähr) das Doppelte dieses Wertes (+/- 0,26), was bedeutet, dass der wahre Mittelwert höchstwahrscheinlich zwischen 2,94 und 3,46 liegt.
Befragter | Bewertung |
EIN | 3 |
B | 3 |
C | 3 |
D | 3 |
E | 4 |
F | 4 |
G | 3 |
H | 3 |
ich | 3 |
J | 3 |
Bedeuten | 3.2 |
Std. Err | 0,13 |
Zusammenfassung
Viele Forscher verstehen den Unterschied zwischen Standardabweichung und Standardfehler nicht, obwohl sie häufig in die Datenanalyse einbezogen werden. Die tatsächlichen Berechnungen für Standardabweichung und Standardfehler sehen zwar sehr ähnlich aus, repräsentieren jedoch zwei sehr unterschiedliche, jedoch einander ergänzende Maße. SD sagt uns über die Form unserer Verteilung, wie nahe die einzelnen Datenwerte vom Mittelwert sind. SE sagt uns, wie nahe unser Stichprobenmittelwert dem wahren Durchschnittswert der Gesamtbevölkerung liegt. Zusammen tragen sie dazu bei, ein vollständigeres Bild zu liefern, als es der Mittelwert allein vermag.