Varianz vs. Kovarianz
Varianz und Kovarianz sind zwei in der Statistik verwendete Messgrößen. Die Varianz ist ein Maß für die Streuung der Daten, und die Kovarianz gibt den Änderungsgrad zweier Zufallsvariablen zusammen an. Varianz ist eher ein intuitives Konzept, aber Kovarianz wird mathematisch zunächst nicht so intuitiv definiert.
Mehr über die Varianz
Die Varianz ist ein Maß für die Streuung der Daten vom Mittelwert der Verteilung. Es gibt an, wie weit die Datenpunkte vom Mittelwert der Verteilung entfernt sind. Es ist einer der primären Deskriptoren der Wahrscheinlichkeitsverteilung und einer der Momente der Verteilung. Die Varianz ist auch ein Parameter der Population, und die Varianz einer Stichprobe aus der Population dient als Schätzer für die Varianz der Population. Aus einer Perspektive wird es als das Quadrat der Standardabweichung definiert.
Im Klartext kann es als Durchschnitt der Quadrate der Entfernung zwischen jedem Datenpunkt und dem Mittel der Verteilung beschrieben werden. Die folgende Formel wird zur Berechnung der Varianz verwendet.
Var (X) = E [(X-µ)2 ] für eine Bevölkerung und
Var (X) = E [(X-‾x)2 ] für eine Probe
Es kann weiter vereinfacht werden, um Var (X) = E [X2 ]-(EX])2.
Variance hat einige Signatureigenschaften und wird häufig in Statistiken verwendet, um die Verwendung zu vereinfachen. Die Varianz ist nicht negativ, da sie das Quadrat der Abstände ist. Der Bereich der Varianz ist jedoch nicht beschränkt und hängt von der jeweiligen Verteilung ab. Die Varianz einer konstanten Zufallsvariablen ist Null und die Varianz ändert sich nicht in Bezug auf einen Standortparameter.
Mehr über Kovarianz
In der statistischen Theorie ist die Kovarianz ein Maß dafür, wie stark sich zwei Zufallsvariablen zusammen ändern. Mit anderen Worten, die Kovarianz ist ein Maß für die Stärke der Korrelation zwischen zwei Zufallsvariablen. Es kann auch als Verallgemeinerung des Varianzbegriffs zweier Zufallsvariablen betrachtet werden.
Die Kovarianz zweier Zufallsvariablen X und Y, die gemeinsam mit einem endlichen zweiten Impuls verteilt werden, wird als σ bezeichnetXY= E [(X-E [X]) (Y-E [Y])]. Varianz kann daher als Sonderfall der Kovarianz angesehen werden, bei der zwei Variablen gleich sind. Cov (X, X) = Var (X)
Durch Normalisieren der Kovarianz kann der lineare Korrelationskoeffizient oder der Pearson-Korrelationskoeffizient erhalten werden, der definiert ist als = E [(X-E [X]) (Y-E [Y])] / (σX σY ) = (Cov (X, Y)) / (σX σY)
Die Kovarianz zwischen einem Paar von Datenpunkten kann grafisch als der Bereich des Rechtecks mit den Datenpunkten an den gegenüberliegenden Scheitelpunkten betrachtet werden. Sie kann als Maß für die Größe der Trennung zwischen den beiden Datenpunkten interpretiert werden. In Anbetracht der Rechtecke für die gesamte Grundgesamtheit kann die Überlappung der allen Datenpunkten entsprechenden Rechtecke als Stärke der Trennung betrachtet werden. Varianz der beiden Variablen. Kovarianz ist wegen zweier Variablen zweidimensional, aber die Vereinfachung auf eine Variable ergibt die Varianz eines einzelnen als Trennung in einer Dimension.
Was ist der Unterschied zwischen Varianz und Kovarianz??
• Varianz ist das Maß für die Ausbreitung / Streuung in einer Population, während Kovarianz als Maß für die Variation zweier Zufallsvariablen oder der Stärke der Korrelation betrachtet wird.
• Varianz kann als Sonderfall der Kovarianz betrachtet werden.
• Varianz und Kovarianz hängen von der Größe der Datenwerte ab und können nicht verglichen werden. Daher sind sie normalisiert. Die Kovarianz wird in den Korrelationskoeffizienten normiert (durch das Produkt der Standardabweichungen der beiden Zufallsvariablen dividiert) und die Varianz in die Standardabweichung (durch die Quadratwurzel).