Kluger‑Hans‑Effekt
in der KI‑Forschung
Wie ein rechnendes Pferd aus dem Jahr 1904 eines der hartnäckigsten Probleme moderner KI erklärt: das richtige Ergebnis, aber aus den völlig falschen Gründen.
Es gibt Geschichten, die klingen so absurd, dass man sie kaum glauben mag. Eine dieser Geschichten ist die eines Pferdes mit dem Namen Hans, der so genannte „kluge Hans“. Sie handelt von einem Pferd, das angeblich rechnen kann. Und sie erklärt ganz nebenbei ein Problem, das die KI‑Forschung bis heute beschäftigt.
Der Kluge Hans ist ein Pferd, das um 1895 geboren wird. Großgezogen und trainiert wird es von einem Mathematiklehrer namens Wilhelm von Osten. Und der ist von seinen eigenen pädagogischen Fähigkeiten so dermaßen überzeugt, dass er nicht nur versucht, dem Pferd das Rechnen beizubringen, sondern fest davon ausgeht, dabei auch wirklich Erfolg gehabt zu haben.
Ein Pferd, das rechnen kann?
Das Ganze hat so funktioniert, dass von Osten dem Pferd eine Aufgabe stellt, etwa eine einfache Addition wie 3 + 3. Daraufhin geht er die richtigen Zahlen durch und wenn das Pferd Hans glaubt, dass die richtige Zahl genannt wurde, dann klopft er mit dem Huf auf den Boden. Für die Zuschauer sieht es so aus, als würde das Tier tatsächlich rechnen. Die Sache spricht sich herum und seine Auftritte werden zur Sensation.
Verständlicherweise vermuten viele zunächst einen Trickbetrug dahinter. Genau deshalb wird im September 1904 eine eigens dafür einberufene wissenschaftliche Kommission eingesetzt, geleitet von dem Philosophie‑Professor Carl Stumpf. Dreizehn Personen prüfen den Fall. Und sie kommen zu einem überraschenden Schluss: Ein Trick ist nicht zu erkennen. Das Pferd beantwortet die gestellten Aufgaben tatsächlich richtig.
Was dabei aber wirklich geschieht, findet man erst später heraus. Und zwar dank einem Mann namens Oskar Pfungst. Er dreht den Spieß um und stellt nicht die Frage, ob Hans rechnen kann, sondern unter welchen Bedingungen er es plötzlich nicht mehr kann.
Pfungst nimmt eine entscheidende Veränderung vor, nach der das Pferd plötzlich nicht mehr das richtige Ergebnis „berechnen“ kann. Und zwar entzieht er ihm die Körpersprache des Fragestellers. Denn es stellt sich heraus, dass Hans lediglich auf winzige, unbewusste Körpersignale seines menschlichen Gegenübers reagiert. Eine kaum merkliche Anspannung oder eine minimale Kopfbewegung in dem Moment, in dem die richtige Zahl erreicht ist. Genau dann hört er auf zu klopfen.
Und was hat das mit KI zu tun?
Mit dem Lüften dieses Phänomens ist die Karriere des Klugen Hans beendet. Aber das Phänomen begleitet uns auch heute noch in der Forschung, etwa in der künstlichen Intelligenz. Denn der Kern des Phänomens, also dass ein System das richtige Ergebnis liefert, aber aus einem „falschen“ Grund, der mit der eigentlichen Aufgabe nichts zu tun hat, ist etwas, zu dem es beim maschinellen Lernen schnell kommen kann. Also wenn ein Modell zum richtigen Ergebnis kommt, aber aus den falschen Gründen.
Ein eindrückliches Beispiel liefert ein Forschungsteam in einer 2025 in Nature Machine Intelligence veröffentlichten Studie. Die Forschenden untersuchen KI‑Modelle, die auf Röntgenbildern der Lunge erkennen sollen, ob eine Covid‑19‑Infektion vorliegt oder nicht. Anfangs funktioniert das auffällig gut.
Doch der Schein trügt. Bei einer genaueren Analyse mit Methoden der erklärbaren KI (also KI‑Modelle, die erklären sollen, wieso andere KI‑Modelle zu einer Entscheidung gekommen sind) zeigt sich, dass das Modell die medizinisch relevanten Merkmale der Lunge gar nicht betrachtet. Stattdessen stützt es seine Entscheidung auf textartige Notizen und Markierungen am Bildrand, die je nach Datenquelle unterschiedlich ausfallen. Sobald sich diese unwichtigen Begleitmerkmale ändern, etwa bei uneinheitlicheren Bildern aus dem echten Klinikalltag, bricht die Trefferquote ein.
Das Modell ist damit genau wie der Kluge Hans. Es hat nie gelernt, eine Lungeninfektion zu erkennen. Es hat gelernt, eine zufällige Begleiterscheinung auszunutzen. Und ein solches System ist in der echten Welt, wenn es wirklich angewendet wird, im schlimmsten Fall nicht nur nutzlos, sondern gefährlich, weil es zu Fehldiagnosen führen kann. Deshalb ist es bei Experimenten und beim Training von Modellen bis heute entscheidend, solche Effekte mitzudenken.
KI verständlich auf die Bühne bringen?
Ich halte Keynotes, die komplexe KI‑Themen greifbar machen. Verständlich, aktuell und mit Geschichten wie dieser, die hängen bleiben. Von der Funktionsweise von Sprachmodellen bis zu ihren Grenzen.
Quellen
- Pfungst (1907): „Das Pferd des Herrn von Osten (Der Kluge Hans)“, https://de.wikipedia.org/wiki/Kluger_Hans
- Kauffmann et al. (2025): „Explainable AI reveals Clever Hans effects in unsupervised learning models“, https://www.nature.com/articles/s42256-025-01000-2
- Science Media Center (2025): „Kluger-Hans-Effekt als Fehlerquelle bei KI“, https://www.sciencemediacenter.de/angebote/kluger-hans-effekt-als-fehlerquelle-bei-ki-25051
- heise online (2025): „Kluger-Hans-Effekt: Gefahr durch fehlerhaftes Lernen“, https://www.heise.de/news/Kluger-Hans-Effekt-Gefahr-durch-fehlerhaftes-Lernen-10319498.html