Boxplot – Erklärung und Analyse

Erfahre, wie ein Boxplot die Daten visualisiert, inklusive Minimum, Maximum, Median und Quartile. Lerne die Berechnung und Interpretation des Interquartilsabstands für die Datenspreizung. Detaillierte Anleitung zum Zeichnen eines Boxplots und häufig gestellte Fragen beantwortet.

Inhaltsverzeichnis zum Thema Boxplot

Boxplot im Überblick

  • Boxplots sind Diagramme aus dem Bereich der Statistik, die der strukturierten und übersichtlichen Darstellung von Daten dienen.
  • In einem Boxplot werden das Minimum, das Maximum, der Median, das untere und das obere Quartil eines Datensatzes gekennzeichnet.
  • Anhand eines Boxplots können auch Aussagen über die Spannweite und die Streuung des Datensatzes getroffen werden.
Boxplot: Lernvideo

Quelle sofatutor.com

Boxplot Mathe – Definition

Ein Boxplot ist ein Diagramm aus dem Bereich der Statistik. Der Boxplot dient der Darstellung von Daten und bildet diese strukturiert und übersichtlich ab. Dargestellt sind in einem Boxplot das Minimum, das Maximum, der Median (Zentralwert), das untere und das obere Quartil. Er wird auch als Box-Whisker-Plot oder Kastengrafik bezeichnet.

Boxplot – Begriffe

Für das Arbeiten mit einem Boxplot ist es wichtig, die folgenden Begriffe zu kennen:

  • Minimum: kleinster Wert der Datenreihe
  • Maximum: größter Wert der Datenreihe
  • Median: Er teilt die Datenreihe in zwei Abschnitte mit der gleichen Anzahl an Datenpunkten.
  • Quartile: mittlere Punkte (Mediane) der durch den Median geteilten Abschnitte

Der Median und die Quartile teilen die Datenreihe in vier Abschnitte. In jedem Abschnitt liegen gleich viele Datenpunkte.

Boxplot – Daten berechnen

Das Minimum und das Maximum können aus dem Datensatz abgelesen werden. Median und Quartile können bestimmt werden, indem wir den Datensatz als geordnete Liste notieren.

Median bestimmen
Um den Median eines Datensatzes zu bestimmen, müssen alle Daten der Größe nach sortiert werden. Der Wert, der genau in der Mitte liegt, ist der Median.
Betrachten wir den folgenden bereits nach der Größe sortierten Datensatz:

1, 1, 2, 4, 6, 8, 10, 17, 20

Dieser Datensatz umfasst neun Werte. Der fünfte Wert liegt genau in der Mitte und ist somit der Median.

\text{Median} = 6

Bei einer geraden Anzahl an Daten ist der Median das arithmetische Mittel aus den beiden mittleren Daten. Somit sind alle Werte in der unteren Hälfte kleiner und alle in der oberen Hälfte größer als der Median.
Wird der oben betrachtete Datensatz nun noch um eine Zahl ergänzt, enthält er eine gerade Anzahl an Daten.

1, 1, 2, 4, 6, 8, 10, 17, 20, 23

Der Median ist hier das arithmetische Mittel der beiden mittleren Werte, also hier der Werte an fünfter und sechster Stelle.

\text{Median} = \dfrac{6 + 8}{2} = 7

Quartile bestimmen
Zur Bestimmung der Quartile gehen wir genauso vor wie bei der Bestimmung des Medians. Das untere Quartil bildet dabei den Median der unteren Hälfte der Werte. Das obere Quartil bildet den Median der oberen Hälfte. Auch hier wird bei einer geraden Anzahl an Daten das arithmetische Mittel der beiden mittleren Werte berechnet.

Die untere Hälfte umfasst die Daten: 1, 1, 2, 4, 6 \Rightarrow \text{unteres Quartil} = 2
Die obere Hälfte umfasst die Daten: 8, 10, 17, 20, 23 \Rightarrow \text{oberes Quartil} = 17

Boxplot – Aufbau

Ein Boxplot besteht aus einem Rechteck, der Box, die vom unteren bis zum oberen Quartil geht. Die Box umfasst die mittleren 50\,\% der Daten. Die Enden der Box sind mit Linien, den sogenannten Whisker (Antennen), links mit dem Minimum und rechts mit dem Maximum verbunden. Im Inneren der Box ist der Median als vertikale Linie eingezeichnet.

Boxplot Beschriftung

Beachte: In manchen Fällen umfasst der Boxplot nicht alle Daten, sondern zum Beispiel nur die mittleren 95\,\%. So sind Ausreißer leichter erkennbar. Als Ausreißer werden dann die Daten bezeichnet, die links oder rechts vom Boxplot abweichen. Sie werden als einfache Datenpunkte eingezeichnet.

Boxplot interpretieren

Ein Boxplot bietet wenig Interpretationsspielraum, da die Daten lediglich strukturiert abgebildet sind. Es können Aussagen über alle im Boxplot abgebildeten Daten, ihre Verteilung sowie Dinge, die direkt aus den abzulesenden Größen folgen, getroffen werden. 

Boxplot – Streuung
Die Länge der dargestellten Box wird als Interquartilsabstand bezeichnet. Dies ist die Differenz zwischen dem oberen und dem unteren Quartil. So kann ein erster Eindruck über die Streuung der Daten gewonnen werden. Je breiter die Box, desto größer die Streuung. Ist die Box etwa halb so groß wie der gesamte Boxplot, deutet das auf eine gleichmäßige Verteilung der Daten hin. Ist die Box hingegen sehr klein, deutet das darauf hin, dass sich die meisten Datenpunkte um den Median herum konzentrieren und nur wenige Datenpunkte stark abweichen.
Aus der Lage der Box kann abgeleitet werden, ob die Daten symmetrisch streuen oder ihre Lage schief ist. Liegt die Box in der Mitte des Plots, sind die Datenpunkte symmetrisch angeordnet. Eine schiefe Verteilung bedeutet, dass die Box nicht mittig vom Boxplot liegt. Dabei wird zwischen einem linksschiefen und einem rechtsschiefen Boxplot unterschieden.

  • Boxplot ist linksschief: Die Box ist nach links verschoben.
  • Boxplot ist rechtsschief: Die Box ist nach rechts verschoben.

Boxplot – Spannweite
Die Spannweite der Daten berechnet sich als Differenz zwischen dem Maximum und dem Minimum und ist im Boxplot an den Whiskers ablesbar. Dabei muss beim Auswerten des Boxplots beachtet werden, dass nicht immer alle Daten von den Whiskers umfasst werden. In diesem Fall können auch Ausreißer im Boxplot abgelesen werden. 

Boxplot – vergleichen
Werden mehrere Boxplots nebeneinander dargestellt, lassen sich die abzulesenden Werte miteinander vergleichen. Das ist besonders interessant, wenn es um die Spannweite oder die Streuung von Daten geht.

Boxplot – Beispiel

Betrachten wir den folgenden bereits nach der Größe sortierten Datensatz:

1, 2, 2, 3, 4, 4, 6, 7, 8, 9

Boxplot zeichnen

Um einen Boxplot zeichnen zu können, müssen wir zunächst die wichtigsten Werte bestimmen.

Minimum: 1
Maximum: 9
Median: 4 (Mittelwert der 5. und 6. Zahl)
unteres Quartil: 2
oberes Quartil: 7

Nun können wir den Boxplot zeichnen. Dafür tragen wir zunächst das untere und das obere Quartil ab und zeichnen zwischen ihnen die Box. Diese verbinden wir links mit dem Minimum und rechts mit dem Maximum. Innerhalb der Box können wir den Median abtragen. Die Box umfasst die mittleren 50\,\% der Daten.

Den Interquartilsabstand IQA können wir als Differenz zwischen dem oberen Quartil und dem unteren Quartil bestimmen:

IQA = 7 - 2 = 5

In diesem Beispiel beträgt der Interquartilsabstand 5.

Boxplot Begriffe

Boxplot beschreiben

Am dargestellten Boxplot können wir erkennen, dass die Daten sich im Bereich zwischen 1 und 9 verteilen und der Datensatz somit eine Spannweite von 8 hat. Der Interquartilsabstand beträgt 5. Die Box liegt nicht genau mittig, was bedeutet, dass der Boxplot leicht linksschief ist. Das heißt, die oberen 25\,\% der Werte sind weiter gestreut als die unteren 25\,\%.

Häufig gestellte Fragen zum Thema Boxplot

Ein Boxplot ist ein Diagramm aus der Statistik.

Aus einem Boxplot lassen sich das Minimum, das Maximum, der Median, das untere und das obere Quartil der Daten direkt ablesen.

Ein Boxplot besteht aus einer Box, die die Daten zwischen dem unteren und dem oberen Quartil umfasst. Diese Box ist mit Linien (Whisker) links mit dem Minimum und rechts mit dem Maximum verbunden. Innerhalb der Box ist der Median mit einer senkrechten Linie markiert.

Um einen Boxplot zu erstellen, müssen fünf Werte des Datensatzes bekannt sein: das Minimum, das Maximum, der Median sowie das untere und das obere Quartil. Im Anschluss können diese Werte abgetragen und zum Boxplot verbunden werden.

Zunächst tragen wir das untere und das obere Quartil ab und verbinden sie zur Box. Das Minimum und das Maximum werden ebenfalls im Diagramm abgetragen und mit den Enden der Box verbunden. Innerhalb der Box wird noch der Median markiert.

Aus einem Boxplot können hauptsächlich Informationen abgelesen werden. So kann neben den fünf bekannten Werten die Streuung der Daten abgeleitet werden. Diese ergibt sich aus der Länge der Box. Der Abstand zwischen dem Minimum und dem Maximum zeigt uns an, wie groß die Spannweite der Daten ist.

Boxplots dienen nicht dazu, die Daten umfangreich zu interpretieren. Sie stellen diese lediglich strukturiert und übersichtlich dar. Sie eignen sich gut, um die Verteilung und Streuung von Daten aus einer Datenreihe zu untersuchen.

Die Normalverteilung und die Standardabweichung lassen sich nicht direkt aus einem Boxplot ablesen.

Aus einem Boxplot lässt sich der Median, jedoch nicht das arithmetische Mittel der Daten ablesen. Das arithmetische Mittel ist der Mittelwert eines Datensatzes. Der Median hingegen teilt die Daten in zwei gleich große Mengen. Dieser ist im Boxplot als senkrechte Linie innerhalb der Box eingezeichnet und kann somit direkt abgelesen werden.

Leave A Comment