Normalverteilung – einfach erklärt

Die Normalverteilung ist eine wichtige stetige Wahrscheinlichkeitsverteilung mit Mittelwert und Standardabweichung als entscheidenden Kenngrößen. Entdecke die gaußsche Glockenkurve und wie sie Daten darstellt. Dies und mehr findest du im Text!

Inhaltsverzeichnis zum Thema Normalverteilung

Normalverteilung im Überblick

  • Bei der Normalverteilung handelt es sich um eine spezielle Wahrscheinlichkeitsverteilung, die durch eine Dichte- und Verteilungsfunktion beschrieben werden kann.
  • Sie ist eine der wichtigsten Verteilungen der Wahrscheinlichkeitsrechnung.
  • Die Normalverteilung hängt vom Erwartungswert \mu, der Standardabweichung \sigma und der Varianz \sigma^2 ab.
  • Der Graph der Dichtefunktion der Normalverteilung ist die sogenannte gaußsche Glockenkurve mit Maximum bei y = \mu.

Normalverteilung: Lernvideo

Quelle sofatutor.com

Normalverteilung – Erklärung und Eigenschaften

Die Normalverteilung wird zur Darstellung und Untersuchung von Daten und Beobachtungen genutzt. Sie wird auch Gaußverteilung genannt.

Normalverteilung – Definition: Die Normalverteilung ist eine der wichtigsten Wahrscheinlichkeitsverteilungen in der Stochastik. Bei der Normalverteilung handelt es sich um eine stetige Wahrscheinlichkeitsverteilung. Die betrachteten Zufallsgrößen können also nicht nur diskrete Werte annehmen.

Darin liegt der entscheidende Unterschied zwischen der Normalverteilung und der Binomialverteilung. Die Binomialverteilung existiert nur für ganzzahlige Werte, während die Normalverteilung auch für beliebige reelle Zahlen existiert.

Die Wahrscheinlichkeitsverteilung einer normalverteilten Zufallsgröße x kann anhand der Kenngrößen Mittelwert \mu und Standardabweichung \sigma durch eine Dichtefunktion beschrieben werden:
f(x) = \dfrac{1}{\sqrt{2\pi\sigma^2}}e^{-\frac{1}{2}\left(\frac{x-\mu}{\sigma}\right)^2}

Normalverteilung – Beispiel: Die Verteilung von Körpergrößen der über 18-jährigen Personen in Deutschland (differenziert nach dem biologischen Geschlecht) ließe sich folgendermaßen darstellen:

Normalverteilung Körpergröße

Sie folgen in etwa einer Normalverteilung. Dabei kann die Körpergröße nicht nur diskrete Werte wie 170~\text{cm} oder 180~\text{cm} annehmen, sondern auch Werte wie 173,\!5~\text{cm} oder 181,\!2~\text{cm}.
An der typischen Form der Kurve ist erkennbar, warum die Normalverteilung auch als (gaußsche) Glockenkurve bezeichnet wird.

Normalverteilung – Merkmale:

  • Graph der Dichtefunktion der Normalverteilung folgt einem symmetrischen Kurvenverlauf.
  • Median und Mittelwert sind identisch.

Normalverteilung – Formel

Die Normalverteilung hängt von dem Mittelwert \mu, der Varianz \sigma^2 und der Standardabweichung \sigma ab. Dabei gilt:

  • \mu \in \mathbb{R}
  • \sigma^2 > 0
  • \sigma > 0

Die Normalverteilung wird kurz auch als N(\mu; \sigma^2) bezeichnet.

Normalverteilung – Erwartungswert

Der Erwartungswert entspricht bei einer normalverteilten Zufallsgröße dem Mittelwert \mu, bei dem das Maximum der Normalverteilung liegt. Wird \mu größer, verschiebt sich die Kurve nach rechts. Wird \mu kleiner, verschiebt sich die Kurve nach links.

Normalverteilung

Normalverteilung – Varianz und Stadardabweichung

Die Varianz \sigma^2 und die Standardabweichung \sigma beeinflussen die Form der Kurve. Sie beschreiben die Streuung der Daten um den Mittelwert: Je größer die Werte, desto stärker streuen die Daten um den Mittelwert.
Das bedeutet für den Kurvenverlauf: Wird \sigma bzw. \sigma^2 größer, wird die Kurve gestaucht (breiter). Wird \sigma^2 kleiner, wird die Kurve gestreckt (schmaler).

Varianz und Standardabweichung bei der Normalverteilung

Normalverteilung – Dichtefunktion, Verteilungsfunktion und Verteilungstabelle

Die Dichtefunktion der allgemeinen Normalverteilung lautet:

f(x) = \dfrac{1}{\sigma \cdot \sqrt{2\pi}} \cdot e^{- \frac{1}{2} \cdot \left(\frac{x - \mu}{\sigma}\right)^2}

Eigenschaften der Dichtefunktion der Normalverteilung:

  • Sie ist symmetrisch zu y = \mu.
  • f(x) ist nie 0.
  • Maximum liegt beim Erwartungswert \mu.
  • stetig \Rightarrow definiert von -\infty bis +\infty
  • Sie hat zwei Wendepunkte, die genau eine Standardabweichung vom Erwartungswert entfernt liegen (x_1 = \mu - \sigma ; x_2 = \mu + \sigma).

Die Fläche unter der Dichtefunktion wird durch die Verteilungsfunktion der Normalverteilung angegeben und wird daher als bestimmtes Integral im Intervall von -\infty bis x berechnet.
Die Formel für die Verteilungsfunktion lautet:

F(x) = \displaystyle \int \limits_{-\infty}^{x} \dfrac{1}{\sigma \sqrt{2\pi}}\cdot e^{-\frac{1}{2}\cdot \left(\dfrac{t - \mu}{\sigma} \right)^2} ~ \text{d}t

Mit der Verteilungsfunktion lässt sich die sogenannte Intervallwahrscheinlichkeit berechnen. Das bedeutet die Wahrscheinlichkeit, dass ein Wert in einem bestimmten Intervall liegt. Es gilt:

P(x_1 \leq X \leq x_2) = F(x_2) - F(x_1)

Diese Verteilungsfunktion muss jedoch nicht berechnet werden. Es existieren sogenannte Verteilungstabellen, aus denen sich die Ergebnisse einfach ablesen lassen. In der ersten Spalte lesen wir den Wert bis zur ersten Nachkommastelle ab. Alle weiteren Nachkommastellen werden in der ersten Zeile abgelesen. An der Schnittstelle der entsprechenden Zeile und Spalte findet sich die gesuchte Wahrscheinlichkeit.

Standardnormalverteilung

Es existieren unendlich viele verschiedene Normalverteilungen mit verschiedenen Erwartungswerten und Varianzen. Für jede bräuchten wir zur Berechnung eine eigene Verteilungstabelle, was nicht möglich ist. Daher gibt es die Standardnormalverteilung.

Standardnormalverteilung: X \sim N(0;1)
Dichtefunktion: \phi(x) = \dfrac{1}{\sqrt{2\pi}}e^{-\frac{1}{2}x^2

Jede Normalverteilung kann in die Standardnormalverteilung transformiert werden. Es wird somit nur noch eine Verteilungstabelle benötigt, aus der alle Wahrscheinlichkeiten abgelesen werden können.
Eine Normalverteilung kann in die Standardnormalverteilung transformiert werden, indem zuerst der Erwartungswert abgezogen und dann durch die Standardabweichung \sigma geteilt wird. Die Gleichung, um eine Normalverteilung in eine Standardnormalverteilung zu transformieren, lautet:

z = \dfrac{X - \mu}{\sigma}

Somit gilt: F(x) = \Phi \left(\dfrac{X - \mu}{\sigma}\right)

Die standardisierte Form wird dabei als \Phi(z) statt F(x) bezeichnet, um Verwechslungen zu vermeiden.
Somit kann die Intervallwahrscheinlichkeit auch mit der Standardnormalverteilung berechnet werden:

P(x_1 \leq X \leq x_2) = F(x_2) - F(x_1) = \Phi \left(\dfrac{x_2 - \mu}{\sigma}\right) - \Phi \left(\dfrac{x_1 - \mu}{\sigma}\right)

In der Tabelle sind nur positive Werte gelistet. Bei negativen Werten muss eine kurze Umrechnung durchgeführt werden:

\Phi(-z) = 1 - \Phi(z)

Aufgrund der heutzutage in der Schule verwendeten Taschenrechner ist eine Transformation nicht unbedingt notwendig.

Standardnormalverteilung

Beispiel
Die Wahrscheinlichkeit, dass z kleiner als -5 ist, berechnen wir als:

\Phi(z \leq -5) = 1 - \Phi(z \leq 5)

Normalverteilung interpretieren

Aus einer Normalverteilung kann abgelesen werden, mit welcher Wahrscheinlichkeit ein bestimmter Wert oder ein bestimmter Bereich an Werten auftritt. Am Maximum lässt sich der Mittelwert \mu bzw. der Erwartungswert der Daten ablesen. Im Bereich innerhalb einer Standardabweichung um den Erwartungswert liegen ungefähr 68\,\% aller Werte. Im Bereich innerhalb von zwei Standardabweichungen um den Mittelwert liegen um 95\,\% aller Werte und im Bereich innerhalb von drei Standardabweichungen um den Mittelwert liegen ca. 99,7\,\% aller Werte.

Normalverteilung Sigmaumgebung

Betrachten wir dafür noch einmal die Normalverteilung der Körpergrößen von Frauen. Angenommen es gelten die folgenden Werte:

\mu = 165~\text{cm}
\sigma = 5~\text{cm}

Dann können wir Folgendes interpretieren:

Wert Erklärung Beispiel
\mu Mittelwert Die durchschnittliche Körpergröße beträgt 165~\text{cm}.
\sigma Standardabweichung Die Standardabweichung der Körpergröße beträgt 5~\text{cm}.
Intervall von \mu - \sigma bis \mu + \sigma 68\,\% der Werte liegen im Bereich von einer Standardabweichung um den Erwartungswert. 68\,\% der Frauen sind zwischen 160~\text{cm} und 170~\text{cm} groß.
\mu - \sigma 34\,\% der Werte liegen im Bereich einer Standardabweichung unterhalb des Erwartungswerts. 34\,\% der Frauen sind zwischen 160~\text{cm} und 165~\text{cm} groß.
\mu + \sigma 34\,\% der Werte liegen im Bereich einer Standardabweichung oberhalb des Erwartungswerts. 34\,\% der Frauen sind zwischen 165~\text{cm} und 170~\text{cm} groß.
Intervall von \mu - 2\sigma bis \mu + 2\sigma 95\,\% der Werte liegen im Bereich von zwei Standardabweichungen um den Erwartungswert. 95\,\% der Frauen sind zwischen 155~\text{cm} und 175~\text{cm} groß.
\mu - 2\sigma 47,\!5\,\% der Werte liegen im Bereich zweier Standardabweichungen unterhalb des Erwartungswerts. 47,\!5\,\% der Frauen sind zwischen 155~\text{cm} und 165~\text{cm} groß.
\mu + 2\sigma 47,\!5\,\% der Werte liegen im Bereich zweier Standardabweichungen oberhalb des Erwartungswerts. 47,\!5\,\% der Frauen sind zwischen 165~\text{cm} und 175~\text{cm} groß.
Intervall von \mu - 3\sigma bis \mu + 3\sigma 99,\!7\,\% der Werte liegen im Bereich von drei Standardabweichungen um den Erwartungswert. 99,\!7\,\% der Frauen sind zwischen 150~\text{cm} und 180~\text{cm} groß.
\mu - 3\sigma 49,\!85\,\% der Werte liegen im Bereich dreier Standardabweichungen unterhalb des Erwartungswerts. 49,\!85\,\% der Frauen sind zwischen 150~\text{cm} und 165~\text{cm} groß.
\mu + 3\sigma 49,\!85\,\% der Werte liegen im Bereich dreier Standardabweichungen oberhalb des Erwartungswerts. 49,\!85\,\% der Frauen sind zwischen 165~\text{cm} und 180~\text{cm} groß.

Normalverteilung – Wahrscheinlichkeit berechnen

Betrachten wir die Normalverteilung am Beispiel der Brenndauer einer Kerze in Minuten. Gegeben sind die Werte:

\mu = 50
\sigma = 6
Wir nehmen an, dass die Brenndauer der Kerze normalverteilt ist.
Frage
Mit welcher Wahrscheinlichkeit brennt die Kerze zwischen 45 und 55 Minuten?

Lösung
Gesucht ist: P(45 \leq X \leq 55) = F(55) - F(45)

Zunächst standardisieren und vereinfachen wir die Normalverteilung:

z_1 = \dfrac{55 - 50}{6} \approx 0,\!83
z_2 = \dfrac{45 - 50}{6} \approx -0,\!83

\begin{array}{rcl} P(45 < X < 55) & = & F(55) - F(45) \\ & = & \Phi(z_1) - \Phi(z_2) \\ & = & \Phi(0,\!83) - \Phi(-0,\!83) \\ & = & \Phi(0,\!83) - (1 - \Phi(0,\!83)) \\ \end{array}

Nun muss der Wert für z = 0,\!83 aus der Verteilungstabelle abgelesen werden:
\Phi(0,\!83) = 0,\!79673

Die vorangegangenen Schritte können einfach mithilfe des Taschenrechners gelöst werden.

Diesen Wert können wir nun in die Gleichung einsetzen und erhalten:

\begin{array}{rcl} P(45 < X < 55) & = & \Phi(0,\!83) - (1 - \Phi(0,\!83)) \\ & = & 0,\!79673 - (1 - 0,\!79673) \\ & = & 0,\!59346 \\ & \approx & 59,\!35\,\% \\ \end{array}

Antwortsatz
Die Wahrscheinlichkeit, dass die Kerze zwischen 45 und 55 Minuten brennt, beträgt rund 59,\!35\,\%.

Normalverteilung – Anwendung

Die Normalverteilung wird meist dann verwendet, wenn eine große Stichprobe vorliegt. Wenn die eigentliche Verteilung der Stichproben unbekannt ist, dient die Normalverteilung als Hilfsmittel zur Darstellung der Daten. Sie wird in vielen verschiedenen naturwissenschaftlichen, gesellschaftswissenschaftlichen und wirtschaftswissenschaftlichen Bereichen angewandt. Ein paar Beispiele sind:

  • Biologie: Körpergrößen einer Personengruppe
  • Meteorologie: Regenmenge
  • Physik: Messfehler
  • Gesellschaftswissenschaften: Einkommen
  • Finanzmarkt: Preisänderung von Aktien

Auch ein typisches Beispiel aus dem Mathematikunterricht, die Summe der Augenzahlen beim Würfeln mit mehr als einem Würfel, kann mit einer Normalverteilung angenähert werden.

Häufig gestellte Fragen zum Thema Normalverteilung

Bei der Normalverteilung handelt es sich um eine stetige Wahrscheinlichkeitsverteilung.

Die Normalverteilung verläuft als Kurve, die achsensymmetrisch zur Symmetrieachse y=\mu, wobei \mu der Erwartungswert der Normalverteilung ist, und glockenförmig verläuft. Aus diesem Grund wird die Normalverteilung auch Glockenkurve genannt.

Der Graph der Normalverteilung ist erkennbar, da er symmetrisch zur Symmetrieachse y = \mu ist und glockenförmig verläuft. Zudem nähert er sich der x-Achse an, berührt diese jedoch nie.

Die Normalverteilung sagt etwas über die Verteilung von Wahrscheinlichkeiten. Dabei gilt, dass die gemessenen Werte symmetrisch um den Mittelwert verteilt sind und 68\,\% der Werte innerhalb der Entfernung von einer Standardabweichung um den Mittelwert liegen.

Die Normalverteilung wird in vielen wissenschaftlichen Bereichen benutzt. Besonders wenn eine große Stichprobe vorliegt, dient die Normalverteilung der Darstellung und Modellierung der Daten.

Ab einer Stichprobengröße von n > 30 kann von einer Normalverteilung ausgegangen werden, ohne die Daten darauf zu prüfen.

Die Dichtefunktion der Normalverteilung lautet:
f(x) = \dfrac{1}{\sigma \cdot \sqrt{2\pi}} \cdot e^{- \frac{1}{2} \cdot \left(\frac{x - \mu}{\sigma}\right)^2}
Die Formel für die Verteilungsfunktion ist:
F(x) = \displaystyle \int \limits_{-\infty}^{x} \dfrac{1}{\sigma \sqrt{2\pi}}\cdot e^{-\frac{1}{2}\cdot \left(\dfrac{t - \mu}{\sigma} \right)^2} ~ \text{d}t

Bei der Standardnormalverteilung beträgt \mu = 0 und die Standardabweichung \sigma liegt bei 1.

Die Normalverteilung ist die wichtigste Verteilung in der Statistik, da sie sich vielseitig anwenden lässt. Zudem ermöglicht sie durch die Sigma-Umgebungen einen anschaulichen Zusammenhang zwischen dem Mittelwert (Erwartungswert) und der Standardabweichung.

Leave A Comment