Zum Inhalt springen

KI Halluzinationen verstehen und mit besseren Prompts reduzieren

KI-Halluzinationen entstehen, weil große Sprachmodelle keine Fakten abrufen, sondern Wort für Wort die statistisch wahrscheinlichste Fortsetzung eines Textes berechnen. Fehlt der Kontext im Prompt, erfindet das Modell plausibel klingende Details. Strukturierte Prompts mit klaren Quellenreferenzen, expliziten Einschränkungen und konkretem Kontext reduzieren Halluzinationen deutlich.

Von Lennart Austen · v2.0 · Mai 2026

* * *

Warum LLM Halluzination ein ernstes Problem ist

Große Sprachmodelle erfinden Fakten häufiger, als viele Nutzende vermuten. Statt zu verstehen, berechnen sie Wort für Wort die wahrscheinlichste Fortsetzung eines Textes. Das Ergebnis klingt überzeugend, stimmt aber inhaltlich oft nicht. Besonders anfällig sind Bereiche mit wenig Trainingsdaten, ähnlich klingenden Namen oder eng beieinander liegenden Datumsangaben.

Für Teams, die täglich mit LLMs arbeiten, ist das folgenreich. Eine halluzinierte Quellenangabe im Kundenbericht oder ein erfundenes Zitat in der Pressemitteilung kann Vertrauen kosten, das sich nur schwer zurückgewinnen lässt. Wer Prompts systematisch vorstrukturiert statt spontan einzutippen, gibt dem Modell den Kontext, den es braucht, um verlässlichere Antworten zu erzeugen. Reproduzierbare Ergebnisse entstehen durch reproduzierbare Eingaben.

* * *

Was ist eine KI Halluzination?

Eine KI-Halluzination ist eine Ausgabe eines großen Sprachmodells (LLM), die faktisch falsch oder erfunden ist, sprachlich aber korrekt und plausibel wirkt. Ursache ist das Funktionsprinzip autoregressiver Modelle. Sie berechnen Wort für Wort die wahrscheinlichste Fortsetzung eines Textes, ohne Inhalte zu verstehen oder zu prüfen. Der Begriff umfasst verwandte Phänomene wie Konfabulation, Modell-Bias (systematische Verzerrung der Ausgaben durch ungleiche Trainingsdaten) und stochastische Dekodierungsfehler. Strukturiertes Prompt-Management adressiert dieses Problem, indem es konsistente, reproduzierbare Modellantworten fördert.

Verwandte Konzepte. Prompt Engineering, Retrieval Augmented Generation (RAG), Few-Shot-Prompting, Self-Consistency und Reinforcement Learning from Human Feedback (RLHF) bilden den technischen Rahmen, in dem Halluzinationen analysiert und reduziert werden.

* * *

Wie LLMs Halluzinationen erzeugen

Das Grundprinzip großer Sprachmodelle erklärt, warum sie halluzinieren. LLMs berechnen nicht, was wahr ist, sondern was als nächstes Wort statistisch am wahrscheinlichsten folgt. Das Modell arbeitet dabei technisch korrekt, wählt aber eine Wortfolge, die zwar kohärent klingt, faktisch jedoch nicht existiert. Eine Halluzination ist damit kein Bug, sondern ein Resultat der statistischen Natur dieser Architektur.

Datenlücken und Kohärenzdruck

Besonders anfällig wird das Modell, wenn Trainingsdaten zu einem Sachverhalt dünn sind oder der Prompt wenig Kontext liefert. LLMs sind nicht darauf ausgelegt zuzugeben, dass sie etwas nicht wissen. Statt eine Lücke offenzulassen, füllt das Modell sie mit dem, was plausibel klingt. Ähnlich klingende Namen, nahe beieinander liegende Datumsangaben oder vergleichbare numerische Werte erhöhen das Risiko zusätzlich, weil das Modell zwischen ihnen statistisch kaum unterscheidet.

Stochastische Dekodierung als Verstärker

Zu starke Randomisierung bei der Dekodierungsstrategie (Wortauswahl mit eingebauter Zufallskomponente statt fester Wahrscheinlichkeitsmaximierung), also bei der Auswahl des nächsten Tokens, kann Halluzinationen weiter verstärken. Modelle mit hoher Temperatureinstellung (Modell-Parameter, der die Zufälligkeit der Wortauswahl steuert; niedrig = deterministisch, hoch = streuend) produzieren kreativere, aber auch unzuverlässigere Ausgaben. Wer reproduzierbare, faktennahe Antworten braucht, sollte die Temperatur niedrig halten und dem Modell explizit erlauben, Wissenslücken zu benennen.

Technische Maßnahmen auf Modell-Ebene wie RLHF reduzieren Halluzinationen während des Trainings. Detection-Methoden (nachgelagerte Erkennung von Halluzinationen in der Ausgabe) wie Semantic Entropy (Farquhar et al., Nature 2024) machen Halluzinationen nachträglich messbar. Beide sind für Nutzende nicht direkt steuerbar. Was sich steuern lässt, ist der Prompt selbst. Strukturierte Prompt-Vorlagen reichern genau diesen Kontext gezielt an. Wer denselben Prompt in versionierter Form einsetzt, reduziert den Interpretationsspielraum des Modells und damit eine der häufigsten Ursachen für inkonsistente oder halluzinierte Ausgaben. Der Prompt ist der praktisch relevanteste Hebel, und strukturiertes Prompt-Management macht ihn dauerhaft nutzbar.

* * *

Verlässlichkeit · was der Prompt festlegt, was der Lauf entscheidet

Du hast einen sauberen CRAFT-Prompt geschrieben. Lauf ihn fünfmal, und manche Eigenschaften des Outputs kommen fast identisch zurück, andere schwanken stark. Der Unterschied ist kein Rauschen, er ist messbar und er trennt sich sauber.

Derselbe Prompt liefert nicht denselben Output, selbst bei Temperatur 0. Aber diese Schwankung ist nicht gleichförmig. Wir haben es nicht bei einem Lauf belassen: sechs Versionen des Prompts (die volle und fünf mit je einem entfernten Baustein), über zwei Modelle (Opus 4.8 und Haiku 4.5), je fünf Läufe, insgesamt sechzig echte Outputs, an jedem vier Eigenschaften gemessen. Zwei davon, Informationsdichte und Rhythmus, bewegen sich von Lauf zu Lauf kaum: der Prompt steuert sie. Die anderen zwei, Formelhaftigkeit und wie der Text den Leser anredet, sind bei fünf Läufen Glückssache: der Lauf entscheidet, nicht der Prompt.

Darüber liegt ein zweites, stärkeres Signal: ein Modell-Fingerabdruck. Über 9 von 9 Testbedingungen schreibt Haiku vorhersagbarer (niedrigere Surprisal) und fragmentierter (höhere Burstiness) als Opus, mit sehr großen Effektgrößen (d_z 1,7 bis 2,8). Diese Lücke ist reproduzierbar, wo die Lauf-Lotterie es nicht ist. Die praktische Lehre: leg fest, was der Prompt wirklich steuert, und hör auf, mit dem Lauf um das zu ringen, was er nicht steuert.

Der Prompt oben in voller Breite. Darunter Output und Einschätzung nebeneinander, weil sie sich gemeinsam ändern: schalt das Modell oder blätter durch die Läufe, und Text und Messung springen synchron.

Der Prompt

Klick einen Baustein, um ihn zu entfernen.

Output, echter Lauf

Einschätzung über die 5 Läufe

Lage = Modell-Typik, Breite = Lauf-Streuung

Beide Modelle sind echte Läufe (Opus 4.8 Aufwand hoch, Haiku 4.5 Standard, Denken aus). Prompt und Outputs sind auf Deutsch, das gemessene Korpus; die Effekte sind sprachunabhängig. Belegt: Haiku vorhersagbarer (niedrigere Surprisal, d_z=1,72) und fragmentierter (höhere Burstiness, d_z=2,76), je 9 von 9 Bedingungen. Nicht-Determinismus selbst bei Temperatur 0 (arXiv 2408.04667).

* * *

7 Prompt-Techniken gegen KI Halluzinationen

Wer den Prompt als Steuerungsinstrument versteht, kann das Halluzinationsrisiko systematisch senken, ohne auf technische Modell-Eingriffe angewiesen zu sein. Wiederverwendbare Vorlagen, die sich nach jeder Korrektur versioniert speichern lassen, halten die Antwortqualität stabil.

Diese Techniken lassen sich kombinieren. Wer sie als versionierte Vorlagen speichert, hält die Antwortqualität über viele Anfragen hinweg stabil und kann erfolgreiche Prompt-Strukturen jederzeit wiederverwenden.

* * *

Halluzination vs. Konfabulation · Unterschied und Relevanz

Beide Begriffe beschreiben fehlerhafte KI-Ausgaben, meinen aber unterschiedliche Mechanismen. Wer den Unterschied kennt, kann gezielter gegensteuern und Prompts so gestalten, dass Modelle seltener in diese Muster verfallen.

Halluzination bezeichnet im KI-Kontext jede Ausgabe, die sachlich falsch ist, aber vom Modell mit Überzeugung präsentiert wird. Das Spektrum reicht von erfundenen Zitaten über nicht existierende Studien bis zu falschen Datumsangaben. Der Begriff stammt aus der Kognitionswissenschaft und wurde auf LLMs übertragen, weil das Phänomen strukturell ähnlich wirkt. Das Modell produziert Inhalte, die keine Grundlage im Trainingsdatensatz haben. Die eigentliche Ursache liegt im Funktionsprinzip großer Sprachmodelle. Sie berechnen Wort für Wort die wahrscheinlichste Fortsetzung eines Textes. Je lückenhafter der Kontext, desto größer das Risiko fehlerhafter Ausgaben. Strukturierte Prompt-Vorlagen reichern genau diesen Kontext gezielt an.

Konfabulation ist ein engerer Begriff aus der Neuropsychologie. Er beschreibt das unbewusste Füllen von Gedächtnislücken mit plausibel klingenden, aber falschen Informationen. Im LLM-Kontext greift er, wenn das Modell eine konkrete Informationslücke schließt, etwa weil Trainingsdaten fehlen oder ein Prompt unvollständig ist. Konfabulation ist damit eine spezifische Unterform der Halluzination mit identifizierbarer Ursache · fehlendes Kontextwissen. Seltene Eigennamen, spezifische Datumsangaben oder interne Fachbegriffe sind typische Auslöser.

Wenn eine KI-Ausgabe generell unzuverlässig wirkt, ist Halluzination der treffendere Oberbegriff. Wenn das Modell erkennbar eine konkrete Informationslücke füllt, beschreibt Konfabulation den Mechanismus präziser. Für die Praxis gilt · beide Phänomene lassen sich durch strukturiertes Prompting und gezielte Kontextanreicherung deutlich reduzieren.

* * *

Halluzinationen reduzieren in 5 Schritten

Der folgende Prozess lässt sich auf jede LLM-Plattform anwenden. Voraussetzung ist ein konkretes Arbeitsvorhaben sowie Zugang zu den relevanten Quelldokumenten oder Daten.

Schritt 1 · Aufgabe klar abgrenzen

Formuliere, was das Modell tun soll, und was nicht. Statt „Schreib einen Bericht über Thema X“ lieber „Fasse die wichtigsten Erkenntnisse aus dem beigefügten Dokument in fünf Punkten zusammen. Interpretiere nichts, was dort nicht steht.“ Klare Grenzen reduzieren den Spielraum für freies Assoziieren erheblich. Je präziser die Aufgabe formuliert ist, desto weniger muss das Modell auf Wahrscheinlichkeitsrechnung zurückgreifen.

Schritt 2 · Kontext direkt einfügen

Relevante Texte, Daten oder Dokumente gehören in den Prompt selbst, nicht in eine vage Beschreibung davon. Je mehr verwertbares Material das Modell als Grundlage hat, desto seltener greift es auf statistische Wahrscheinlichkeiten zurück. Retrieval Augmented Generation (RAG) automatisiert diesen Schritt für größere Dokumentenmengen.

Schritt 3 · Wissenslücken explizit erlauben

Füge dem Prompt den Satz hinzu „Wenn eine Information in den beigefügten Materialien nicht enthalten ist, schreib das explizit.“ Dieser Zusatz gibt dem Modell die Erlaubnis, Lücken zu benennen statt zu füllen. Ohne diese Erlaubnis tendiert es dazu, kohärent zu wirken, auch auf Kosten der Richtigkeit.

Schritt 4 · Ausgabe per Self-Consistency prüfen

Sende denselben Prompt mehrfach ab und vergleiche die Antworten. Widersprüche zwischen den Ausgaben sind ein zuverlässiges Signal für Unsicherheit im Modell. Stimmen alle Antworten überein, steigt die Wahrscheinlichkeit, dass die Aussage auf stabilen Trainingsdaten basiert. Abweichungen zeigen, wo eine manuelle Quellenprüfung sinnvoll ist.

Schritt 5 · Prompt als Vorlage speichern

Prompts, die zuverlässig halluzinationsarme Ergebnisse liefern, sollten als Vorlagen gesichert werden. Wer denselben Prompt-Typ regelmäßig nutzt, etwa für Recherchen, Zusammenfassungen oder Analysen, profitiert von versionierten Templates mit festen Platzhaltern für variable Inhalte. Ein Prompt-Management-System mit Versionierung speichert Vorlagen mit dynamischen Feldern, versioniert jeden Stand automatisch und ermöglicht die Wiederherstellung früherer Versionen. So bleibt die Qualität reproduzierbar, ohne jeden Prompt neu aufzubauen.

Wer diese fünf Schritte konsequent anwendet, wird schnell feststellen, dass die Zuverlässigkeit der Ausgaben messbar steigt. Der Aufwand pro Prompt wächst dabei kaum, weil die Struktur nach wenigen Durchläufen zur Gewohnheit wird.

* * *

Häufige Fragen zu KI Halluzinationen

Warum halluziniert ChatGPT auch bei einfachen Fakten?

ChatGPT und andere LLMs berechnen keine Fakten, sondern die statistisch wahrscheinlichste Wortfolge. Selbst bei scheinbar einfachen Sachverhalten greift das Modell auf Muster aus dem Training zurück, nicht auf eine Datenbank. Sind Trainingsdaten zu einem Thema dünn oder widersprüchlich, steigt die Wahrscheinlichkeit einer falschen, aber überzeugend formulierten Antwort. Wer Prompts strukturiert und Wissenslücken explizit benennt, kann dieses Risiko spürbar senken.

Wie erkenne ich, ob eine KI-Antwort halluziniert ist?

Verlässliche Signale sind fehlende oder nicht nachprüfbare Quellenangaben, sehr spezifische Zahlen ohne Kontext sowie Aussagen, die sich bei wiederholter Abfrage widersprechen. Self-Consistency, also das mehrfache Absenden desselben Prompts und Vergleichen der Antworten, ist eine praktische Methode zur Erkennung. Mit gespeicherten Prompt-Vorlagen lässt sich dieser Prozess systematisch wiederholen. Kritische Ausgaben sollten immer gegen Primärquellen geprüft werden.

Was ist der Unterschied zwischen Halluzination und einem Modellfehler?

Halluzinationen sind kein klassischer Fehler im Sinne eines Bugs, sondern ein architektur-immanentes Merkmal autoregressiver Sprachmodelle. Das Modell funktioniert technisch korrekt, wählt aber eine Wortfolge, die faktisch nicht stimmt. Ein klassischer Modellfehler wäre dagegen ein Rechenfehler oder ein Absturz, also eine Abweichung vom erwarteten technischen Verhalten. Dieser Unterschied ist für alle relevant, die KI-Ausgaben in Workflows einbinden.

Wie wirksam ist Prompt Engineering gegen Halluzinationen?

Prompt Engineering ist der direkteste Hebel, den Nutzende selbst in der Hand haben. Kontext mitgeben, Wissenslücken explizit erlauben und Few-Shot-Beispiele verwenden, reduziert Halluzinationen nachweislich. Versionierte Prompt-Vorlagen ermöglichen es, bewährte Formulierungen konsistent einzusetzen und gezielt weiterzuentwickeln. Technische Maßnahmen auf Modellebene wie RLHF oder RAG wirken ergänzend, sind aber für die meisten Anwendenden nicht direkt steuerbar.

Was bedeutet der EU AI Act für den Umgang mit Halluzinationen?

Der EU AI Act unterscheidet zwischen Anbietern und Deployern von KI-Systemen. Anbieter von General-Purpose-AI-Modellen mit systemischen Risiken müssen nach Artikel 55 Risikoanalysen durchführen und Maßnahmen gegen erkannte Risiken ergreifen. Deployer, die GPAI-Systeme in Hochrisiko-Kontexte integrieren, tragen nach Artikel 26 die Pflicht zu menschlicher Aufsicht, Input-Daten-Qualität und Monitoring sowie nach Artikel 9 die Pflicht zu einem Risk-Management-System. Halluzinations-Risiken in Hochrisiko-Kontexten zu erkennen und zu begrenzen ist damit Compliance-relevant. Auditierbarkeit der Prompts und dokumentierte Qualitätssicherungsprozesse gewinnen dadurch an praktischer Bedeutung. Eine nachvollziehbare Prompt-Versionierung bildet die Grundlage für solche Anforderungen.

* * *

Warum Prompt-Qualität langfristig entscheidet

Prompt-Qualität entscheidet langfristig, weil ihre Reproduzierbarkeit der einzige praktisch steuerbare Halluzinations-Hebel für Nutzende ist. Halluzinationen sind kein neues Problem. Schon frühe Sprachmodelle produzierten sachlich falsche Ausgaben, aber das Ausmaß blieb begrenzt, weil die Modelle weniger überzeugend formulierten. Mit zunehmender Sprachkompetenz der Modelle wuchs auch das Risiko. Je flüssiger und selbstsicherer eine Antwort klingt, desto schwerer fällt es, Fehler zu erkennen.

Teams, die Prompts systematisch entwickeln und versionieren, werden deutlich seltener mit Halluzinationen konfrontiert als solche, die Prompts spontan formulieren. Strukturierte Prompt-Versionierung ist dabei der zentrale Hebel. Der Grund liegt in der Reproduzierbarkeit. Ein Prompt, der einmal zuverlässig funktioniert hat, funktioniert als Vorlage wieder, sofern er den Kontext mitliefert und dem Modell klare Grenzen setzt. Versionierung schafft dabei eine Grundlage, auf der sich Prompts schrittweise verbessern lassen, statt jedes Mal von vorn anzufangen.

Retrieval Augmented Generation wird mittelfristig für viele Teams zur Standardtechnik werden, weil sie das Halluzinationsrisiko strukturell senkt. Bis dahin bleibt Prompt Engineering die zugänglichste und wirksamste Maßnahme für alle, die täglich mit LLMs arbeiten.

* * *

KI Halluzinationen · Was bleibt und was hilft

KI Halluzinationen lassen sich nicht abschalten, aber systematisch reduzieren. Der entscheidende Hebel liegt im Prompt. Sprachmodelle berechnen Wort für Wort die wahrscheinlichste Fortsetzung eines Textes. Sie verstehen keine Fakten, sondern rechnen Wahrscheinlichkeiten. Wer dem Modell im Prompt gezielt Kontext mitgibt, Wissenslücken erlaubt und Ausgaben per Self-Consistency gegenprüft, bekommt zuverlässigere Antworten. Prompts, die dabei gut funktionieren, verdienen es, gesichert und wiederverwendet zu werden.

Versionierte Vorlagen mit dynamischen Platzhaltern machen funktionierende Prompts dauerhaft nutzbar und auf neue Aufgaben anpassbar.

Verwandte Themen: Welches Modell weniger halluziniert, zeigt der 2026er KI-Tool-Vergleich. Strukturierte Konfigurationen via Custom GPTs reduzieren das Risiko in wiederkehrenden Aufgaben.

Praxis-Beispiele für ähnliche Aufgaben findest du auf Prompt-Beispiele für Sales, Content, Outreach und Universal.

Weiterführende Patterns und Praxis-Tipps zu Prompt Management findest du im splicelog-Prompt-Engineering-Guide.