Boxplot – Erklärung und Analyse
Erfahre, wie ein Boxplot die Daten visualisiert, inklusive Minimum, Maximum, Median und Quartile. Lerne die Berechnung und Interpretation des Interquartilsabstands für die Datenspreizung. Detaillierte Anleitung zum Zeichnen eines Boxplots und häufig gestellte Fragen beantwortet.
Inhaltsverzeichnis zum Thema Boxplot
Das Quiz zum Thema: Boxplot
Was ist ein Boxplot?
Frage 1 von 4
Wie ist ein Boxplot aufgebaut?
Frage 2 von 4
Wie interpretiert man einen Boxplot?
Frage 3 von 4
Wann ist es sinnvoll, einen Boxplot zu verwenden?
Frage 4 von 4
Wie willst du heute lernen?
Boxplot Mathe – Definition
Ein Boxplot ist ein Diagramm aus dem Bereich der Statistik. Der Boxplot dient der Darstellung von Daten und bildet diese strukturiert und übersichtlich ab. Dargestellt sind in einem Boxplot das Minimum, das Maximum, der Median (Zentralwert), das untere und das obere Quartil. Er wird auch als Box-Whisker-Plot oder Kastengrafik bezeichnet.
Boxplot – Begriffe
Für das Arbeiten mit einem Boxplot ist es wichtig, die folgenden Begriffe zu kennen:
- Minimum: kleinster Wert der Datenreihe
- Maximum: größter Wert der Datenreihe
- Median: Er teilt die Datenreihe in zwei Abschnitte mit der gleichen Anzahl an Datenpunkten.
- Quartile: mittlere Punkte (Mediane) der durch den Median geteilten Abschnitte
Der Median und die Quartile teilen die Datenreihe in vier Abschnitte. In jedem Abschnitt liegen gleich viele Datenpunkte.
Boxplot – Daten berechnen
Das Minimum und das Maximum können aus dem Datensatz abgelesen werden. Median und Quartile können bestimmt werden, indem wir den Datensatz als geordnete Liste notieren.
Median bestimmen
Um den Median eines Datensatzes zu bestimmen, müssen alle Daten der Größe nach sortiert werden. Der Wert, der genau in der Mitte liegt, ist der Median.
Betrachten wir den folgenden bereits nach der Größe sortierten Datensatz:
Dieser Datensatz umfasst neun Werte. Der fünfte Wert liegt genau in der Mitte und ist somit der Median.
Bei einer geraden Anzahl an Daten ist der Median das arithmetische Mittel aus den beiden mittleren Daten. Somit sind alle Werte in der unteren Hälfte kleiner und alle in der oberen Hälfte größer als der Median.
Wird der oben betrachtete Datensatz nun noch um eine Zahl ergänzt, enthält er eine gerade Anzahl an Daten.
Der Median ist hier das arithmetische Mittel der beiden mittleren Werte, also hier der Werte an fünfter und sechster Stelle.
Quartile bestimmen
Zur Bestimmung der Quartile gehen wir genauso vor wie bei der Bestimmung des Medians. Das untere Quartil bildet dabei den Median der unteren Hälfte der Werte. Das obere Quartil bildet den Median der oberen Hälfte. Auch hier wird bei einer geraden Anzahl an Daten das arithmetische Mittel der beiden mittleren Werte berechnet.
Die untere Hälfte umfasst die Daten:
Die obere Hälfte umfasst die Daten:
Boxplot – Aufbau
Ein Boxplot besteht aus einem Rechteck, der Box, die vom unteren bis zum oberen Quartil geht. Die Box umfasst die mittleren der Daten. Die Enden der Box sind mit Linien, den sogenannten Whisker (Antennen), links mit dem Minimum und rechts mit dem Maximum verbunden. Im Inneren der Box ist der Median als vertikale Linie eingezeichnet.
Beachte: In manchen Fällen umfasst der Boxplot nicht alle Daten, sondern zum Beispiel nur die mittleren . So sind Ausreißer leichter erkennbar. Als Ausreißer werden dann die Daten bezeichnet, die links oder rechts vom Boxplot abweichen. Sie werden als einfache Datenpunkte eingezeichnet.
Boxplot interpretieren
Ein Boxplot bietet wenig Interpretationsspielraum, da die Daten lediglich strukturiert abgebildet sind. Es können Aussagen über alle im Boxplot abgebildeten Daten, ihre Verteilung sowie Dinge, die direkt aus den abzulesenden Größen folgen, getroffen werden.
Boxplot – Streuung
Die Länge der dargestellten Box wird als Interquartilsabstand bezeichnet. Dies ist die Differenz zwischen dem oberen und dem unteren Quartil. So kann ein erster Eindruck über die Streuung der Daten gewonnen werden. Je breiter die Box, desto größer die Streuung. Ist die Box etwa halb so groß wie der gesamte Boxplot, deutet das auf eine gleichmäßige Verteilung der Daten hin. Ist die Box hingegen sehr klein, deutet das darauf hin, dass sich die meisten Datenpunkte um den Median herum konzentrieren und nur wenige Datenpunkte stark abweichen.
Aus der Lage der Box kann abgeleitet werden, ob die Daten symmetrisch streuen oder ihre Lage schief ist. Liegt die Box in der Mitte des Plots, sind die Datenpunkte symmetrisch angeordnet. Eine schiefe Verteilung bedeutet, dass die Box nicht mittig vom Boxplot liegt. Dabei wird zwischen einem linksschiefen und einem rechtsschiefen Boxplot unterschieden.
- Boxplot ist linksschief: Die Box ist nach links verschoben.
- Boxplot ist rechtsschief: Die Box ist nach rechts verschoben.
Boxplot – Spannweite
Die Spannweite der Daten berechnet sich als Differenz zwischen dem Maximum und dem Minimum und ist im Boxplot an den Whiskers ablesbar. Dabei muss beim Auswerten des Boxplots beachtet werden, dass nicht immer alle Daten von den Whiskers umfasst werden. In diesem Fall können auch Ausreißer im Boxplot abgelesen werden.
Boxplot – vergleichen
Werden mehrere Boxplots nebeneinander dargestellt, lassen sich die abzulesenden Werte miteinander vergleichen. Das ist besonders interessant, wenn es um die Spannweite oder die Streuung von Daten geht.
Boxplot – Beispiel
Betrachten wir den folgenden bereits nach der Größe sortierten Datensatz:
Boxplot zeichnen
Um einen Boxplot zeichnen zu können, müssen wir zunächst die wichtigsten Werte bestimmen.
Minimum:
Maximum:
Median: (Mittelwert der . und . Zahl)
unteres Quartil:
oberes Quartil:
Nun können wir den Boxplot zeichnen. Dafür tragen wir zunächst das untere und das obere Quartil ab und zeichnen zwischen ihnen die Box. Diese verbinden wir links mit dem Minimum und rechts mit dem Maximum. Innerhalb der Box können wir den Median abtragen. Die Box umfasst die mittleren der Daten.
Den Interquartilsabstand können wir als Differenz zwischen dem oberen Quartil und dem unteren Quartil bestimmen:
In diesem Beispiel beträgt der Interquartilsabstand .
Boxplot beschreiben
Am dargestellten Boxplot können wir erkennen, dass die Daten sich im Bereich zwischen und verteilen und der Datensatz somit eine Spannweite von hat. Der Interquartilsabstand beträgt . Die Box liegt nicht genau mittig, was bedeutet, dass der Boxplot leicht linksschief ist. Das heißt, die oberen der Werte sind weiter gestreut als die unteren .
Häufig gestellte Fragen zum Thema Boxplot
Alle Artikel aus dem Fach Mathematik