Korrelation & Scatter Plots

Zusammenhänge erkennen, den Korrelationskoeffizienten r verstehen und sehen, wann eine lineare Beziehung passt; und wann nicht.

Was ist Korrelation?

Korrelation misst, wie stark zwei Variablen linear zusammenhängen. Der Korrelationskoeffizient r (nach Pearson) liegt immer zwischen -1 und +1:

  • r = +1. Perfekter positiver Zusammenhang: wenn x steigt, steigt y proportional.
  • r = -1. Perfekter negativer Zusammenhang: wenn x steigt, sinkt y proportional.
  • r = 0. Kein linearer Zusammenhang. Aber Vorsicht: es kann trotzdem ein nicht-lineares Muster existieren!

Korrelation ≠ Kausalität

Ein hoher r-Wert bedeutet nicht, dass x die Ursache von y ist. Eisverkäufe und Sonnenbrand korrelieren stark, aber Eis verursacht keinen Sonnenbrand. Beide werden von der Temperatur beeinflusst.

Probieren Sie es aus:

  • Wechseln Sie zwischen Datensätzen und beobachten Sie, wie sich r und die Punktwolke verändern.
  • Ziehen Sie Datenpunkte, um zu sehen, wie ein einzelner Ausreißer r beeinflusst.
  • Klicken Sie ins Diagramm, um neue Punkte hinzuzufügen. Umschalt+Klick entfernt einen Punkt.
  • Schalten Sie die Regressionslinie ein, um zu sehen, ob eine Gerade Sinn macht.
y x
Datenpunkte Klicken: neu · Ziehen = verschieben · Umschalt+Klick = entfernen
Korrelationskoeffizient r
-1 0 +1
negativer Zusammenhang positiver Zusammenhang
Wählen Sie einen Datensatz, um zu starten.
Datensatz wählen
Pearson-Korrelation

$r = \frac{\sum(x_i - \bar{x})(y_i - \bar{y})}{\sqrt{\sum(x_i - \bar{x})^2 \cdot \sum(y_i - \bar{y})^2}}$

$\bar{x}$ (Mittelwert)
$\bar{y}$ (Mittelwert)
$r$
$r^2$

$r^2$ = Anteil der erklärten Varianz ( %)

Datenpunkte (n = 0)
# x y