Varianz und Standardabweichung – Erklärung und Beispiele

Erfahre, wie Varianz und Standardabweichung Abweichungen von Messwerten berechnen und die Streuung um den Mittelwert messen.

Inhaltsverzeichnis zum Thema Varianz

Varianz und Standardabweichung – Definition und Eigenschaften
Standardabweichung und Varianz – Definition
Varianz – Interpretation
Varianz und Standardabweichung – Beispiel
Varianz in der Wahrscheinlichkeitstheorie und Statistik
Häufig gestellte Fragen zum Thema Varianz

Varianz im Überblick

Die Varianz $\text{Var}(x)$ ist ein Maß für die Abweichung der einzelnen Werte $x_i$ einer Messung oder Datenerhebung von ihrem Mittelwert $\bar x$ .
Varianz und Standardabweichung sind sogenannte Streumaße. Das bedeutet: Sie messen, wie weit die einzelnen Werte $x_i$ um den Mittelwert $\bar x$ streuen.
Je größer Varianz und Standardabweichung sind, desto weniger eng liegen die einzelnen Werte beisammen.
Die Formel für die Varianz von $n$ Messwerten lautet:
$\text{Var}(x) = \dfrac{1}{n} \displaystyle \sum_{i=1}^n (\bar x-x_i)^2$

Quelle sofatutor.com

Varianz und Standardabweichung – Definition und Eigenschaften

Im Folgenden werden die Standardabweichung und Varianz einfach erklärt. Beide Größen messen die Abweichung der einzelnen Werte $x_i$ einer Messreihe oder Datenerhebung von ihrem Mittelwert $\bar x$ . Je größer die Varianz oder die Standardabweichung ist, desto stärker schwanken die einzelnen Werte. Statt schwanken können wir auch streuen sagen. Daher werden Varianz und Standardabweichung als Streumaße oder Streuungsparameter bezeichnet. Die Varianz wird mit dem Symbol $\text{Var}$ abgekürzt. Gebräuchlich sind auch die Bezeichnungen $S^2$ oder $\sigma^2$ . Die Standardabweichung wird mit $\sigma$ oder mit $\text{SD}$ (engl. standard deviation) bezeichnet.

Standardabweichung und Varianz – Definition

Hast du eine Messreihe oder Datenerhebung mit $n$ Werten $x_1$ , $\ldots$ , $x_n$ , kannst du in mehreren Schritten die Varianz und die Standardabweichung berechnen:
Als Erstes berechnest du den Mittelwert $\bar x$ . Du addierst alle Werte und dividierst die Summe durch die Anzahl der Werte:
$\bar x = \dfrac{x_1 + x_2 \ldots + x_n}{n}$
Dieser Mittelwert wird auch als arithmetisches Mittel der Werte bezeichnet.
Als Nächstes berechnest du für jeden einzelnen Wert $x_i$ die quadratische Abweichung vom Mittelwert $\bar x$ . Du berechnest also die Differenz und quadrierst sie:
$(\bar x-x_i)^2$
Hinweis: Da die Differenz quadriert wird, ist es egal, ob du $\bar x-x_i$ oder $x_i-\bar x$ berechnest. Beide Formeln führen zum richtigen Ergebnis.
Nun addierst du alle diese quadrierten Differenzen und dividierst die Summe durch die Anzahl $n$ der Werte.
Das Ergebnis dieser Berechnung ist die Varianz $\text{Var}(x)$ .
Wir fassen die Rechnung in der Formel für die Varianz zusammen:
$\text{Var}(x) = \displaystyle \frac{1}{n} \sum_{i=1}^n (\bar x-x_i)^2 = \dfrac{(\bar x-x_1)^2+\ldots+(\bar x-x_n)^2}{n}$

Die Standardabweichung $\sigma$ ist die Wurzel aus der Varianz. Für die Standardabweichung haben wir daher die Formel:
$\sigma = \sqrt{\text{Var}(x)} = \displaystyle \sqrt{\frac{1}{n} \sum_{i=1}^n (\bar x-x_i)^2} = \sqrt{\dfrac{(\bar x-x_1)^2+\ldots+(\bar x-x_n)^2}{n}}$

Varianz – Interpretation

Je weniger die einzelnen Werte $x_i$ vom Mittelwert $\bar x$ abweichen, desto kleiner ist die Varianz. Umgekehrt ist die Varianz umso größer, je stärker die einzelnen Werte $x_i$ um den Mittelwert streuen. Diese Abweichung lässt sich gut grafisch darstellen. In dem Bild siehst du die einzelnen Messwerte als Punkte aufgetragen. Der Mittelwert ist dargestellt durch eine gestrichelte Linie. Der Betrag der Differenz eines Messwerts $x_i$ vom Mittelwert $\bar x$ ist das Gleiche wie der horizontale Abstand des Punkts von der gestrichelten Linie. Je näher die einzelnen Punkte der Linie des Mittelpunkts liegen, desto kleiner ist die Streuung, also der Wert der Varianz $\text{Var}(x)$ und der Standardabweichung $\sigma$ .

Varianz und Standardabweichung – Beispiel

Ein Spieler erzielt in fünf aufeinanderfolgenden Spielen verschiedene Punktzahlen. Die Spiele werden mit den Zahlen $1$ bis $5$ durchnummeriert. Wir schreiben dafür: $i=1,\ldots,5$ . Die Zahl $i$ bezeichnet also die Nummer des Spiels. Der Wert $x_i$ ist die im Spiel $i$ erreichte Punktzahl. Die Werte sind in folgender Tabelle dargestellt:

Spielnummer $i$	Punktzahl
$1$	$21$
$2$	$16$
$3$	$18$
$4$	$24$
$5$	$21$

Wir berechnen die Varianz dieser Werte:
Zuerst bestimmen wir den Mittelwert $\bar x$ , indem wir alle Werte addieren und die Summe durch die Anzahl der Werte dividieren:
$\bar x = \dfrac{21+16+18+24+21}{5} = \dfrac{100}{5} =20$
Als Nächstes bestimmen wir die Differenzen der einzelnen Werte $x_i$ vom Mittelwert und quadrieren diese Differenzen:
$\begin{array}{rcrcrcrcrcr} \bar x-x_1 &=& 20-21 &=& -1 &\quad\implies\quad& (\bar x-x_1)^2 &=& (-1)^2 &=& 1 \\ \bar x-x_2 &=& 20-16 &=& 4 &\quad\implies\quad& (\bar x-x_2)^2 &=& 4^2 &=& 16 \\ \bar x-x_3 &=& 20-18 &=& 2 &\quad\implies\quad& (\bar x-x_3)^2 &=& 2^2 &=& 4 \\ \bar x-x_4 &=& 20-24 &=& -4 &\quad\implies\quad& (\bar x-x_4)^2 &=& (-4)^2 &=& 16 \\ \bar x-x_5 &=& 20-21 &=& -1 &\quad\implies\quad& (\bar x-x_5)^2 &=& (-1)^2 &=& 1 \end{array}$

Als Letztes summieren wir diese quadrierten Differenzen und dividieren die Summe durch die Anzahl der Werte ( $n=5$ ). Das Ergebnis ist die Varianz $\text{Var}(x)$ :
$\text{Var}(x) = \dfrac{1+16+4+16+1}{5} = \dfrac{38}{5} = 7,\!6$
Die Standardabweichung $\sigma$ erhalten wir, indem wir die Wurzel aus der Varianz ziehen:

$\sigma = \sqrt{\text{Var}(x)} = \sqrt{7,\!6} \approx 2,\!76$

Varianz in der Wahrscheinlichkeitstheorie und Statistik

In der Wahrscheinlichkeitstheorie bezeichnet die Varianz $\text{var}(X)$ ein Maß für die Abweichungen der Werte einer Zufallsvariablen $X$ von ihrem Erwartungswert $E(X)$ . In der Statistik entspricht der Erwartungswert einer Zufallsvariablen dem Mittelwert von Messwerten.

In der Statistik wird neben der Varianz $\text{var}(x)$ auch die sogenannte Stichprobenvarianz $S^2_n$ einer Stichprobe verwendet. Die Stichprobenvarianz trägt den unteren Index $n$ , da sie vom Stichprobenumfang $n$ abhängt. Der Stichprobenumfang $n$ ist die Anzahl der Werte der Stichprobe. Die Stichprobenvarianz $S^2_n$ unterscheidet sich von der Varianz $S^2 = \text{var}(x)$ nur durch den Nenner:
$S^2_n = \dfrac{(\bar x-x_1)^2+\ldots+(\bar x-x_n)^2}{n-1} = \frac{n}{n-1} \cdot \text{var}(x)$
Die Stichprobenvarianz wird verwendet, um die unbekannte Varianz einer Größe in einem statistischen Modell durch eine Stichprobe vom Umfang $n$ zu schätzen. Der Grund für den Nenner $n-1$ in der Formel der Stichprobenvarianz $S^2_n$ (anstelle von $n$ im Nenner der Varianz) ist die Tatsache, dass $S^2_n$ ein erwartungstreuer Schätzer für die Varianz des statistischen Modells ist. Die Größe $\text{var}(x)$ als Schätzer ist dagegen nicht erwartungstreu.

Häufig gestellte Fragen zum Thema Varianz

Was ist Varianz?

Die Varianz ist ein sogenanntes Streumaß. Sie gibt an, wie stark die einzelnen Werte $x_i$ einer Messreihe oder Datenerhebung voneinander abweichen.
Je größer die Varianz ist, desto stärker weichen die einzelnen Werte voneinander und von ihrem Mittelwert ab.

Was ist der Unterschied zwischen Varianz und Standardabweichung?

Die Standardabweichung $\sigma$ ist die Wurzel aus der Varianz $\text{Var}(x)$ . Deswegen wird die Varianz auch mit dem Symbol $\sigma^2$ bezeichnet.
Du berechnest immer zuerst die Varianz aus der Summe der Quadrate der Abweichungen der Werte $x_i$ vom Mittelwert $\bar x$ , dividiert durch die Anzahl der Werte.
Aus der Varianz $\text{Var}(x)$ ziehst du die Wurzel und erhältst so die Standardabweichung $\sigma$ .
Multiplizierst du alle Werte deiner Messung oder deines Datensatzes mit der gleichen Zahl, wird auch die Standardabweichung mit dieser Zahl multipliziert. Die Varianz wird aber mit dem Quadrat dieser Zahl multipliziert.
Beispiel: Multiplizierst du alle Werte mit $2$ , ist die Standardabweichung der neuen Werte das Doppelte der Standardabweichung der alten Werte: $\sigma(2\cdot x) = 2 \cdot \sigma(x)$ . Die Varianz der neuen Werte ist aber das Vierfache der Varianz der alten Werte: $\text{Var}(2\cdot x) = 2^2 \cdot \text{Var}(x) = 4 \cdot \text{Var}(x)$ .

Wie hängen Varianz und Kovarianz zusammen?

Die Kovarianz misst die Abhängigkeit der Werte zweier Größen voneinander.
In die Varianz setzt du die Werte $x_i$ einer Größe ein.
In die Kovarianz setzt du immer die Wertepaare $(x_i,y_i)$ für zwei Größen ein.
Die Formel für die Kovarianz lautet:
$\text{Cov}(x,y) = \dfrac{ \sqrt{(\bar x-x_1) \cdot (\bar y-y_1)+\ldots(\bar x-x_n) \cdot (\bar y-y_n)} }{ n }$
Setzt du in die Kovarianz anstelle der Wertepaare zweier verschiedener Größen $x$ und $y$ Paare der gleichen Werte einer Größe ein, erhältst du die Varianz:
$\text{Cov}(x,x) = \text{Var}(x) = \Sigma^2$

Wie wird die Varianz in der Statistik berechnet?

Die Varianz $\text{Var}(x)$ einer Größe $x$ wird mit der Formel
$\text{Var}(x) = \dfrac{ \sqrt{(\bar x-x_1)^2 +\ldots(\bar x-x_n)^2} }{ n }$
berechnet. Hierbei ist $\bar x = \frac{x_1~+~\ldots~+~ x_n}{n}$ das arithmetische Mittel der Werte $x_1$ , $\ldots$ , $x_n$ .

Wie kann man die Varianz in einer Stichprobe berechnen?

Die Stichprobenvarianz $S^2_k$ einer Stichprobe mit Stichprobenumfang $k$ wird mit der Formel
$S^2_k = \dfrac{ \sqrt{(\bar x-x_1)^2 +\ldots(\bar x-x_k)^2} }{ k-1 }$
berechnet. Hierbei ist $\bar x = \frac{x_1~+~\ldots~+~ x_n}{k}$ das arithmetische Mittel der Werte $x_1$ , $\ldots$ , $x_k$ der Stichprobe.
Beachte: Die Stichprobenvarianz ist nicht genau das Gleiche wie die Varianz der Stichprobe. Die beiden Werte unterscheiden sich um einen Faktor der Form $\frac{n}{n-1}$ bzw. $\frac{n-1}{n}$ . Für große Stichprobenumfänge ist dieser Faktor nahezu $1$ .

Wie kann man die Varianz in der Wahrscheinlichkeitstheorie nutzen?

In der Wahrscheinlichkeitstheorie wird die Varianz benutzt, um die Abweichung der Werte einer Zufallsvariablen von ihrem Erwartungswert zu messen. Je kleiner die Varianz ist, desto weniger zufällig sind die Werte der Zufallsgröße. Bei einer deterministischen Größe ist die Varianz $0$ .
Die Varianz in der Statistik misst die Abweichung der Werte eines Datensatzes vom Mittelwert dieser Werte. Je kleiner die Varianz ist, desto weniger weichen die Werte von ihrem Mittelwert und voneinander ab.

Wie interpretiert man die Varianz in der Statistik?

Die Varianz ist ein Maß für die Abweichung der Werte einer Messreihe oder einer Datenerhebung vom Mittelwert dieser Werte. Je kleiner die Varianz ist, desto einheitlicher sind die Werte. Je stärker die Werte schwanken, desto größer ist die Varianz. Statt schwanken sagt man auch streuen, daher wird die Varianz als Streumaß bezeichnet.

Wie kann man die Varianz in der Datenanalyse nutzen?

In der Datenanalyse wird die Varianz verwendet, um die Qualität der Werte einer Größe zu beurteilen. Je kleiner die Varianz ist, desto einheitlicher sind die Werte. Je stärker die Werte von ihrem Mittelwert und voneinander abweichen, desto größer ist die Varianz. Je kleiner die Varianz und damit die Schwankung der Messwerte ist, desto zuverlässiger sind Aussagen über die Messgröße.

Die Varianz wird auch benutzt, um unbekannte Parameter einer Größe zu schätzen. In einem statistischen Modell kommt die Varianz einer Größe vor, der Wert der Varianz ist aber unbekannt. Um den Wert der Varianz zu schätzen, wird eine Stichprobe gezogen und die Stichprobenvarianz berechnet. Die Stichprobenvarianz unterscheidet sich von der Varianz nur durch einen Faktor, der aber vom Stichprobenumfang abhängt.

Super! Das Thema: kannst du schon! Teile deine Learnings und Fragen mit der Community! Antworten abbrechen

Alle Artikel aus dem Fach Mathematik

Varianz und Standardabweichung – Erklärung und Beispiele

Inhaltsverzeichnis zum Thema Varianz

Varianz im Überblick

Wie willst du heute lernen?

Super! Das Thema: kannst du schon! Teile deine Learnings und Fragen mit der Community! Antworten abbrechen