Distanz- & Ähnlichkeitsmaße
Ziehe die Punkte und beobachte, wie sich Euklidische Distanz, Manhattan Distanz und Cosinus-Ähnlichkeit unterscheiden.
Koordinaten
v
(3, 5)
w
(7, 2)
Euklidische Distanz
$d_E = \sqrt{(v_1 - w_1)^2 + (v_2 - w_2)^2}$
–
–
Kürzeste Verbindung. "Luftlinie".
Manhattan Distanz
$d_M = |v_1 - w_1| + |v_2 - w_2|$
–
–
Nur horizontal/vertikal; wie Straßenblöcke.
Cosinus-Ähnlichkeit
$\cos(\theta) = \frac{\vec{v} \cdot \vec{w}}{|\vec{v}| \cdot |\vec{w}|}$
–
–
–
Misst den Winkel, nicht den Abstand. 1 = gleiche Richtung, 0 = rechtwinklig, −1 = entgegengesetzt.
Vergleich der drei Maße
| Euklidisch | Manhattan | Cosinus | |
|---|---|---|---|
| Misst | Luftlinie | Straßenblöcke | Winkel / Richtung |
| Wertebereich | 0 … ∞ | 0 … ∞ | −1 … 1 |
| Skalierung | Empfindlich | Empfindlich | Unempfindlich |
| Typischer Einsatz | kNN, Clustering | Grid-Daten, Bilder | Texte, Embeddings |
| Relation | ≤ Manhattan | ≥ Euklidisch | Unabhängig von Distanz |