Varianz und Standardabweichung – Erklärung und Beispiele

Erfahre, wie Varianz und Standardabweichung Abweichungen von Messwerten berechnen und die Streuung um den Mittelwert messen.

Inhaltsverzeichnis zum Thema Varianz

Varianz im Überblick

  • Die Varianz \text{Var}(x) ist ein Maß für die Abweichung der einzelnen Werte x_i einer Messung oder Datenerhebung von ihrem Mittelwert \bar x.
  • Varianz und Standardabweichung sind sogenannte Streumaße. Das bedeutet: Sie messen, wie weit die einzelnen Werte x_i um den Mittelwert \bar x streuen.
  • Je größer Varianz und Standardabweichung sind, desto weniger eng liegen die einzelnen Werte beisammen.

  • Die Formel für die Varianz von n Messwerten lautet:
    \text{Var}(x) = \dfrac{1}{n} \displaystyle \sum_{i=1}^n (\bar x-x_i)^2
Varianz: Lernvideo

Quelle sofatutor.com

Varianz und Standardabweichung – Definition und Eigenschaften

Im Folgenden werden die Standardabweichung und Varianz einfach erklärt. Beide Größen messen die Abweichung der einzelnen Werte x_i einer Messreihe oder Datenerhebung von ihrem Mittelwert \bar x. Je größer die Varianz oder die Standardabweichung ist, desto stärker schwanken die einzelnen Werte. Statt schwanken können wir auch streuen sagen. Daher werden Varianz und Standardabweichung als Streumaße oder Streuungsparameter bezeichnet. Die Varianz wird mit dem Symbol \text{Var} abgekürzt. Gebräuchlich sind auch die Bezeichnungen S^2 oder \sigma^2. Die Standardabweichung wird mit \sigma oder mit \text{SD} (engl. standard deviation) bezeichnet.

Standardabweichung und Varianz – Definition

Hast du eine Messreihe oder Datenerhebung mit n Werten x_1, \ldots, x_n, kannst du in mehreren Schritten die Varianz und die Standardabweichung berechnen:
Als Erstes berechnest du den Mittelwert \bar x. Du addierst alle Werte und dividierst die Summe durch die Anzahl der Werte:
\bar x = \dfrac{x_1 + x_2 \ldots + x_n}{n}
Dieser Mittelwert wird auch als arithmetisches Mittel der Werte bezeichnet.
Als Nächstes berechnest du für jeden einzelnen Wert x_i die quadratische Abweichung vom Mittelwert \bar x. Du berechnest also die Differenz und quadrierst sie:
(\bar x-x_i)^2
Hinweis: Da die Differenz quadriert wird, ist es egal, ob du \bar x-x_i oder x_i-\bar x berechnest. Beide Formeln führen zum richtigen Ergebnis.
Nun addierst du alle diese quadrierten Differenzen und dividierst die Summe durch die Anzahl n der Werte.
Das Ergebnis dieser Berechnung ist die Varianz \text{Var}(x).
Wir fassen die Rechnung in der Formel für die Varianz zusammen:
\text{Var}(x) = \displaystyle \frac{1}{n} \sum_{i=1}^n (\bar x-x_i)^2 = \dfrac{(\bar x-x_1)^2+\ldots+(\bar x-x_n)^2}{n}

Die Standardabweichung \sigma ist die Wurzel aus der Varianz. Für die Standardabweichung haben wir daher die Formel:
\sigma = \sqrt{\text{Var}(x)} = \displaystyle \sqrt{\frac{1}{n} \sum_{i=1}^n (\bar x-x_i)^2} = \sqrt{\dfrac{(\bar x-x_1)^2+\ldots+(\bar x-x_n)^2}{n}}

Varianz – Interpretation

Je weniger die einzelnen Werte x_i vom Mittelwert \bar x abweichen, desto kleiner ist die Varianz. Umgekehrt ist die Varianz umso größer, je stärker die einzelnen Werte x_i um den Mittelwert streuen. Diese Abweichung lässt sich gut grafisch darstellen. In dem Bild siehst du die einzelnen Messwerte als Punkte aufgetragen. Der Mittelwert ist dargestellt durch eine gestrichelte Linie. Der Betrag der Differenz eines Messwerts x_i vom Mittelwert \bar x ist das Gleiche wie der horizontale Abstand des Punkts von der gestrichelten Linie. Je näher die einzelnen Punkte der Linie des Mittelpunkts liegen, desto kleiner ist die Streuung, also der Wert der Varianz \text{Var}(x) und der Standardabweichung \sigma.

Kleine und große Streuung

Varianz und Standardabweichung – Beispiel

Ein Spieler erzielt in fünf aufeinanderfolgenden Spielen verschiedene Punktzahlen. Die Spiele werden mit den Zahlen 1 bis 5 durchnummeriert. Wir schreiben dafür: i=1,\ldots,5. Die Zahl i bezeichnet also die Nummer des Spiels. Der Wert x_i ist die im Spiel i erreichte Punktzahl. Die Werte sind in folgender Tabelle dargestellt:

Spielnummer i Punktzahl
1 21
2 16
3 18
4 24
5 21

Wir berechnen die Varianz dieser Werte:
Zuerst bestimmen wir den Mittelwert \bar x, indem wir alle Werte addieren und die Summe durch die Anzahl der Werte dividieren:
\bar x = \dfrac{21+16+18+24+21}{5} = \dfrac{100}{5} =20
Als Nächstes bestimmen wir die Differenzen der einzelnen Werte x_i vom Mittelwert und quadrieren diese Differenzen:
\begin{array}{rcrcrcrcrcr} \bar x-x_1 &=& 20-21 &=& -1 &\quad\implies\quad& (\bar x-x_1)^2 &=& (-1)^2 &=& 1 \\ \bar x-x_2 &=& 20-16 &=& 4 &\quad\implies\quad& (\bar x-x_2)^2 &=& 4^2 &=& 16 \\ \bar x-x_3 &=& 20-18 &=& 2 &\quad\implies\quad& (\bar x-x_3)^2 &=& 2^2 &=& 4 \\ \bar x-x_4 &=& 20-24 &=& -4 &\quad\implies\quad& (\bar x-x_4)^2 &=& (-4)^2 &=& 16 \\ \bar x-x_5 &=& 20-21 &=& -1 &\quad\implies\quad& (\bar x-x_5)^2 &=& (-1)^2 &=& 1 \end{array}

Als Letztes summieren wir diese quadrierten Differenzen und dividieren die Summe durch die Anzahl der Werte (n=5). Das Ergebnis ist die Varianz \text{Var}(x):
\text{Var}(x) = \dfrac{1+16+4+16+1}{5} = \dfrac{38}{5} = 7,\!6
Die Standardabweichung \sigma erhalten wir, indem wir die Wurzel aus der Varianz ziehen:

\sigma = \sqrt{\text{Var}(x)} = \sqrt{7,\!6} \approx 2,\!76

Varianz in der Wahrscheinlichkeitstheorie und Statistik

In der Wahrscheinlichkeitstheorie bezeichnet die Varianz \text{var}(X) ein Maß für die Abweichungen der Werte einer Zufallsvariablen X von ihrem Erwartungswert E(X). In der Statistik entspricht der Erwartungswert einer Zufallsvariablen dem Mittelwert von Messwerten.

In der Statistik wird neben der Varianz \text{var}(x) auch die sogenannte Stichprobenvarianz S^2_n einer Stichprobe verwendet. Die Stichprobenvarianz trägt den unteren Index n, da sie vom Stichprobenumfang n abhängt. Der Stichprobenumfang n ist die Anzahl der Werte der Stichprobe. Die Stichprobenvarianz S^2_n unterscheidet sich von der Varianz S^2 = \text{var}(x) nur durch den Nenner:
S^2_n = \dfrac{(\bar x-x_1)^2+\ldots+(\bar x-x_n)^2}{n-1} = \frac{n}{n-1} \cdot \text{var}(x)
Die Stichprobenvarianz wird verwendet, um die unbekannte Varianz einer Größe in einem statistischen Modell durch eine Stichprobe vom Umfang n zu schätzen. Der Grund für den Nenner n-1 in der Formel der Stichprobenvarianz S^2_n (anstelle von n im Nenner der Varianz) ist die Tatsache, dass S^2_n ein erwartungstreuer Schätzer für die Varianz des statistischen Modells ist. Die Größe \text{var}(x) als Schätzer ist dagegen nicht erwartungstreu.

Häufig gestellte Fragen zum Thema Varianz

  • Die Varianz ist ein sogenanntes Streumaß. Sie gibt an, wie stark die einzelnen Werte x_i einer Messreihe oder Datenerhebung voneinander abweichen.
  • Je größer die Varianz ist, desto stärker weichen die einzelnen Werte voneinander und von ihrem Mittelwert ab.
  • Die Standardabweichung \sigma ist die Wurzel aus der Varianz \text{Var}(x). Deswegen wird die Varianz auch mit dem Symbol \sigma^2 bezeichnet.
  • Du berechnest immer zuerst die Varianz aus der Summe der Quadrate der Abweichungen der Werte x_i vom Mittelwert \bar x, dividiert durch die Anzahl der Werte.
  • Aus der Varianz \text{Var}(x) ziehst du die Wurzel und erhältst so die Standardabweichung \sigma.
  • Multiplizierst du alle Werte deiner Messung oder deines Datensatzes mit der gleichen Zahl, wird auch die Standardabweichung mit dieser Zahl multipliziert. Die Varianz wird aber mit dem Quadrat dieser Zahl multipliziert.
    Beispiel: Multiplizierst du alle Werte mit 2, ist die Standardabweichung der neuen Werte das Doppelte der Standardabweichung der alten Werte: \sigma(2\cdot x) = 2 \cdot \sigma(x). Die Varianz der neuen Werte ist aber das Vierfache der Varianz der alten Werte: \text{Var}(2\cdot x) = 2^2 \cdot \text{Var}(x) = 4 \cdot \text{Var}(x).
  • Die Kovarianz misst die Abhängigkeit der Werte zweier Größen voneinander.
  • In die Varianz setzt du die Werte x_i einer Größe ein.
  • In die Kovarianz setzt du immer die Wertepaare (x_i,y_i) für zwei Größen ein.
  • Die Formel für die Kovarianz lautet:
    \text{Cov}(x,y) = \dfrac{ \sqrt{(\bar x-x_1) \cdot (\bar y-y_1)+\ldots(\bar x-x_n) \cdot (\bar y-y_n)} }{ n }
    Setzt du in die Kovarianz anstelle der Wertepaare zweier verschiedener Größen x und y Paare der gleichen Werte einer Größe ein, erhältst du die Varianz:
    \text{Cov}(x,x) = \text{Var}(x) = \Sigma^2

Die Varianz \text{Var}(x) einer Größe x wird mit der Formel
\text{Var}(x) = \dfrac{ \sqrt{(\bar x-x_1)^2 +\ldots(\bar x-x_n)^2} }{ n }
berechnet. Hierbei ist \bar x = \frac{x_1~+~\ldots~+~ x_n}{n} das arithmetische Mittel der Werte x_1, \ldots, x_n.

Die Stichprobenvarianz S^2_k einer Stichprobe mit Stichprobenumfang k wird mit der Formel
S^2_k = \dfrac{ \sqrt{(\bar x-x_1)^2 +\ldots(\bar x-x_k)^2} }{ k-1 }
berechnet. Hierbei ist \bar x = \frac{x_1~+~\ldots~+~ x_n}{k} das arithmetische Mittel der Werte x_1, \ldots, x_k der Stichprobe.
Beachte: Die Stichprobenvarianz ist nicht genau das Gleiche wie die Varianz der Stichprobe. Die beiden Werte unterscheiden sich um einen Faktor der Form \frac{n}{n-1} bzw. \frac{n-1}{n}. Für große Stichprobenumfänge ist dieser Faktor nahezu 1.

In der Wahrscheinlichkeitstheorie wird die Varianz benutzt, um die Abweichung der Werte einer Zufallsvariablen von ihrem Erwartungswert zu messen. Je kleiner die Varianz ist, desto weniger zufällig sind die Werte der Zufallsgröße. Bei einer deterministischen Größe ist die Varianz 0.
Die Varianz in der Statistik misst die Abweichung der Werte eines Datensatzes vom Mittelwert dieser Werte. Je kleiner die Varianz ist, desto weniger weichen die Werte von ihrem Mittelwert und voneinander ab.

Die Varianz ist ein Maß für die Abweichung der Werte einer Messreihe oder einer Datenerhebung vom Mittelwert dieser Werte. Je kleiner die Varianz ist, desto einheitlicher sind die Werte. Je stärker die Werte schwanken, desto größer ist die Varianz. Statt schwanken sagt man auch streuen, daher wird die Varianz als Streumaß bezeichnet.

In der Datenanalyse wird die Varianz verwendet, um die Qualität der Werte einer Größe zu beurteilen. Je kleiner die Varianz ist, desto einheitlicher sind die Werte. Je stärker die Werte von ihrem Mittelwert und voneinander abweichen, desto größer ist die Varianz. Je kleiner die Varianz und damit die Schwankung der Messwerte ist, desto zuverlässiger sind Aussagen über die Messgröße.

Die Varianz wird auch benutzt, um unbekannte Parameter einer Größe zu schätzen. In einem statistischen Modell kommt die Varianz einer Größe vor, der Wert der Varianz ist aber unbekannt. Um den Wert der Varianz zu schätzen, wird eine Stichprobe gezogen und die Stichprobenvarianz berechnet. Die Stichprobenvarianz unterscheidet sich von der Varianz nur durch einen Faktor, der aber vom Stichprobenumfang abhängt.

Super! Das Thema: kannst du schon! Teile deine Learnings und Fragen mit der Community!