Data Science & Machine Learning

Interaktive Visualisierungen zum Anfassen.

ML-Grundlagen

Klassische Machine-Learning-Konzepte

Lineare Regression

Gewicht und Bias per Slider anpassen und beobachten, wie sich die Regressionslinie und der MSE verändern.

Regressionslinie MSE Fehlerquadrate

Binäre Klassifikation

Schwellenwert per Drag verschieben und beobachten, wie sich Confusion Matrix und Metriken verändern.

Threshold Confusion Matrix Precision / Recall / F1

Entscheidungsbaum

Baumtiefe per Slider anpassen und beobachten, wie der Algorithmus den Datensatz Schritt für Schritt aufteilt.

Wetter-Datensatz Baumtiefe Klassifikation

k-Nächste-Nachbarn

Testpunkt per Klick setzen, k per Slider ändern und beobachten, wie der Mehrheitsentscheid die Klasse bestimmt.

Nachbarschaft Distanzberechnung Mehrheitsentscheid

Distanzmaße

Punkte per Drag verschieben und beobachten, wie sich Euklidische, Manhattan und Cosinus-Distanz unterscheiden.

Euklidisch Manhattan Cosinus

Gradient Descent

Lernrate und Startpunkt per Slider anpassen und Schritt für Schritt beobachten, wie das Minimum gefunden wird.

Lernrate Schrittweise Konvergenz

Natural Language Processing

Wie verarbeiten Computer Sprache?

Tokenisierung

Text in Tokens zerlegen. Whitespace, regelbasiert oder Byte Pair Encoding live ausprobieren.

Tokenizer Stopwörter BPE

Text-Repräsentation

One-Hot Encoding, Bag of Words und TF-IDF. So werden Texte zu Zahlenvektoren.

One-Hot Bag of Words TF-IDF

Word Embeddings

Semantische Vektoren erkunden. Wort-Arithmetik, Bias und kontextuelle Embeddings.

Embedding-Raum Bias Transformer