Sprachmodelle sind keine Wissensdatenbanken
21. Oktober 2023 by Dr. Frederik Bäumer
Modelle wie ChatGPT sorgen für erheblichen Diskussionsstoff, sowohl in Wissenschaft als auch bei Unternehmen. Verlockend erscheint die Idee, einen maschinellen Mitarbeiter zu haben, der Texte formulieren, E-Mails beantworten und programmieren kann. Und in der Tat ist ChatGPT als großes Sprachmodell hier oftmals eine echte Hilfe. Um jedoch zu verstehen, wie diese Technologien funktionieren und warum sie nicht die traditionellen Suchmaschinen ersetzen können, müssen wir uns zunächst die grundlegenden Technologien ansehen.
Was sind Transformer?
Transformer sind ein tiefes Lernmodell, das 2017 von Forschern bei Google vorgestellt wurde. Es wurde speziell für Aufgaben im Bereich der Verarbeitung natürlicher Sprache (NLP) entwickelt und hat die Art und Weise revolutioniert, wie Modelle menschliche Sprache verarbeiten. Das Transformer-Modell basiert auf Selbst-Aufmerksamkeitsmechanismen, die es ihm ermöglichen, verschiedene Aspekte eines Textes gleichzeitig zu berücksichtigen, anstatt nacheinander. Dadurch können sie den Kontext eines jeden Wortes in einem Satz viel besser erfassen. GPT baut darauf auf. Es steht für „Generative Pre-trained Transformer“. GPT wurde von OpenAI entwickelt und ist dafür bekannt, erstaunlich präzise Texte zu generieren. Das Wort „pre-trained“ signalisiert bereits, dass GPT auf einer enormen Datenmenge an Texten trainiert wurde, bevor es für spezielle Aufgaben weiter optimiert wird. Während dieses Trainingsprozesses erfasst das Modell sowohl die Nuancen unserer Sprachen als auch das globale Wissen, obwohl dies nicht ausdrücklich beabsichtigt ist.
Was ist ChatGPT?
ChatGPT ist eine spezifische Anwendung von GPT, die für Konversationen oder Chats optimiert wurde. Es ist darauf trainiert, menschenähnliche Antworten in einem Chat-Kontext zu geben. Der Hauptunterschied zu herkömmlichen Chatbots besteht darin, dass ChatGPT nicht auf festen Regeln oder Skripten basiert, sondern auf der Analyse von Milliarden von Wörtern und Sätzen aus dem Web. Obwohl ChatGPT auf einer umfangreichen Datenmenge trainiert wird, hat es einige Einschränkungen:
- Trainingsdaten-Begrenzung: ChatGPT ist nur so gut wie die Daten, mit denen es trainiert wurde. Es kann nichts über Ereignisse oder Entwicklungen wissen, die nach dem letzten Trainingsdatum passiert sind.
- Kein eigenes Verständnis: Das Modell kann Texte generieren und auf Anfragen antworten, versteht aber nicht wirklich den Inhalt. Es emuliert menschliche Kommunikation basierend auf statistischen Mustern und nicht auf echtem Verständnis.
Plugins erweitern ChatGPT
ChatGPT-Plugins sind Erweiterungen, die es dem ChatGPT-Modell ermöglichen, zusätzliche Funktionen und Dienstleistungen bereitzustellen, die über das reine Textausgeben hinausgehen. Plugins können als „Augen und Ohren“ für Sprachmodelle betrachtet werden. Sie ermöglichen es dem Modell, auf aktuelle, persönliche oder spezifische Informationen zuzugreifen, die nicht im Trainingsdatensatz enthalten sind. Beispielsweise ermöglicht ein spezielles Plugin ChatGPT, im Internet zu browsen. Dies erweitert den Informationszugriff des Modells, sodass es über sein Trainingskorpus hinausgehen und aktuelle Informationen abrufen kann.
Warum ersetzt ChatGPT nicht Google?
ChatGPT und Google Search sind zwei beeindruckende Technologien, aber sie dienen unterschiedlichen Zwecken und können daher nicht einfach 1:1 miteinander verglichen oder ausgetauscht werden. Google ist in erster Linie eine Suchmaschine, die darauf spezialisiert ist, das weitläufige Internet zu durchsuchen, um Benutzern relevante Ergebnisse basierend auf ihren Suchanfragen zu liefern. Es präsentiert Links zu echten Webseiten, die (heute noch vornehmlich) von Menschen erstellt wurden. Das bedeutet, dass man sowohl auf erstklassige Informationsquellen als auch auf weniger verlässliche Inhalte stoßen kann.
Im Gegensatz dazu ist ChatGPT ein System, das Antworten generiert, basierend auf den Daten, mit denen es ursprünglich trainiert wurde. Es bietet keine direkten Verlinkungen zu Quellen, weshalb die Antworten das Risiko bergen, ungenau oder irreführend zu sein. Nicht zu vernachlässigen ist die Tatsache, dass auch während des Trainings falsche, irreführende, fragliche Inhalte gelernt wurden.
Was macht wonk.ai Write?
Wonk.ai Write verbindet die Recherche auf generischem Wissen (Suchmaschinen) und spezifischem Unternehmenswissen. Durch den Zugriff auf Unternehmenswissen kann die Redaktion spezifische und für Ihr Unternehmen relevante Inhalte erstellen. Write unterstützt auch bei der Themenstrukturierung und der Themenfindung. Sobald alle relevanten Quellen gesammelt und durch die Redaktion gesichtet und ggf. angepasst wurden, generiert Write einen ersten Entwurf, den Redakteure dann als Startpunkt für die individuelle Arbeit nehmen können. Mehr zu Write.
Dr. Frederik Bäumer
Dr. Frederik Simon Bäumer ist ein Absolvent der Universität Paderborn, Fakultät für Wirtschaftswissenschaften. Er promovierte im Bereich Wirtschaftsinformatik mit "summa cum laude". Seine Dissertation konzentrierte sich auf die "Indikatorbasierte Erkennung und Kompensation von ungenauen und unvollständig beschriebenen Softwareanforderungen". Zuvor schloss er sein Masterstudium in Management Information Systems mit dem Schwerpunkt auf semantischer Informationsverarbeitung mit Auszeichnung ab. Dr. Bäumer lehrt heute an der Hochschule Bielefeld.
mehr erfahren
Trainierte Übersetzungsmodelle
in Unternehmenssprache. Mammutstark.
Translate jetzt 30 Tage kostenfrei ausprobieren!
Erhalte Deinen kostenfreien Zugang zu Echtzeit-Übersetzungen von Texten & Dokumenten.
Dein erster Schrittt für unternehmenseigene Übersetzungsmodelle
Maschinelle Übersetzung in bestmöglicher Qualität.