Die glatte Oberfläche des Ungefähren: Warum Plausibilität in der Oberstufe nicht reicht
Wenn ich mir anschaue, was KI zu leisten in der Lage ist, beeindruckt mich (in den unterschiedlichen Modellen mit deutlichen Abstufungen, die hier aber nicht näher analysiert werden sollen) die rhetorische Eleganz, mit der diese generativen, rein auf Statistik beruhenden Sprachmodelle Leerstellen füllen. Wir sprechen bei der KI bei einer solchen Füllung von Leerstellen von »Halluzinationen«. Dabei erfindet eine KI Fakten, die statistisch wahrscheinlich, aber inhaltlich falsch sind. – Das ist im schulischen Kontext nicht neu. Als Deutsch- und Religionslehrer, als Philologe und Theologe, begegnet mir diese Form der Spekulation vor allem im schulischen Kontext regelmäßig. Und dennoch ist das, was die KI »halluziniert«, von dem Versuch einer (inhaltlichen) Sinnstiftung zu unterscheiden, die letztlich den Text als Text verlässt und somit zur reinen Spekulation wird.
In der Oberstufe lässt sich besonders häufig ein Reaktionsmuster beobachten, das Parallelen zur Funktionsweise der KI aufweist. In Klausuren zeigt sich dies dort, wo die Analyse abbricht und durch allgemeine Lebensweisheiten ersetzt wird. Das liegt vermutlich daran, dass das System Schule einen Erwartungsdruck erzeugt, der das Eingeständnis, etwas nicht verstanden zu haben, oft als Versagen markiert. Die Flucht in die Plausibilität – also in das, was »irgendwie stimmig« klingt – ist eine erlernte Strategie. Wenn das Wissen um die geschichtliche Epoche oder die wissenschaftliche Methode nicht ausreicht, wird das Vakuum durch Sinn-Ersatz gefüllt.
Ein Beispiel für eine solche Kohärenzfalle, bei der die bloße Vermutung über die analytische Belegbarkeit siegt: Ein Schüler schreibt über ein barockes Gedicht: »Der Autor möchte uns damit sagen, dass man sein Leben genießen soll, weil alles vergänglich ist.« Das klingt nachvollziehbar und passt zum Zeitgeist des Barock. Aber ohne den Beleg am konkreten Bild (etwa der verblühenden Rose) und ohne die Analyse der Form bleibt es eine bloße Behauptung. Hier wird Stimmigkeit um den Preis der Textferne erkauft. Gleichzeitig entsteht bei der Schülerin oder dem Schüler der Eindruck von Genauigkeit, was bei der Begründung einer Note manchmal für die Lehrer:innen eine Herausforderung darstellt. Um es klar zu sagen: In der Qualifikationsphase führen bloße Behauptungen, die – so nachvollziehbar (zum Zeitgeist) sie auch sein mögen – nicht begründet werden, zu Punktabzügen, da die Bewertung nicht die Qualität der Erfindung, sondern die Genauigkeit der Herleitung in den Blick nimmt.
Im Religionsunterricht greift hier die Unterscheidung zwischen der Auslegung des Textes (Exegese) und dem Hineinlesen eigener Vorstellungen (Eisegese). Während die methodische Auslegung den Sinn aus dem Wortlaut herausarbeitet, bezeichnet das Hineinlesen das Überstülpen eigener Meinungen. Ein Beleg hierfür ist die Ersetzung geschichtlicher Analyse durch ein diffuses »christliches Weltbild«, das als Universalschlüssel für jede Erzählung fungieren soll. Wenn Schüler:innen Gleichnisse bearbeiten, füllen sie Verständlücken oft mit moralischen Appellen der Gegenwart. Sie produzieren eine Deutung, welche die damalige Lebenswelt oder die sprachliche Struktur des Urtextes ignoriert. – Und was Schüler:innen immer zu passen scheint, ist das »Argument«, dass es im Christentum ja um »Nächstenliebe« gehe. Diese Form des Hineinlesens entspricht dem Vorgehen der KI: Sie berechnet die Erwartungshaltung des Lehrers und liefert eine glatte Oberfläche, die beim Abgleich mit dem historischen Fundament in sich zusammenbricht. Wer die methodische Strenge durch Spekulation ersetzt, verlässt den Boden wissenschaftlicher Arbeit.
In diesem Zusammenhang gilt es auch auf das Phänomen hinzuweisen, das ich als »subjektive Wendung« bezeichne. Da hat sich ein Text über Seiten argumentativ diskutierend um eine Erkenntnis bemüht, bevor dann formuliert wird, dass dies alles aber jeder selbst entscheiden müsse, weil jede:r den Text anders lese. Warum aber wurde dann der Text analysiert und interpretiert, wenn am Ende gesagt wird, dass das alles doch eigentlich der Beliebigkeit anheimgegeben ist?
In der Germanistik zeigt sich die methodische Unsauberkeit dort, wo die Arbeit am Text durch Rhetorik ersetzt wird. Eine Analyse, die sich in Betrachtungen über »Gefühle« verliert, ohne das Versmaß, Zeilensprünge oder Wortbedeutungen am Text festzumachen, erfüllt die Anforderungen nicht. Die bloße Benennung eines Stilmittels – etwa: »Hier liegt eine Metapher vor« – ohne zu erklären, wie diese im Gesamtzusammenhang wirkt, ist kein Beleg, sondern nur ein Etikett. – Die KI-Halluzination dient dabei als Kontrast: Ein Sprachmodell kann über »Zerrissenheit« schreiben und Fachbegriffe einstreuen, weil diese statistisch häufig gemeinsam vorkommen. Die Kompetenz der Schüler:innen zeigt sich jedoch darin, die Besonderheit eines Textes zu erfassen, die sich gerade nicht in Wahrscheinlichkeiten erschöpft. Es hilft nicht, diese Ansätze wohlwollend zu bewerten. Die Reibung am Text muss im Mittelpunkt stehen. Jeder Punkt in der Analyse muss – das ist ein Bewertungskriterium! – mit einem Beleg und dessen Deutung am Material begründet werden. Und das bedeutet nicht, dass einfach nur Textverweise genutzt werden, die beim Lesen dann gefüllt werden müssen (z. B. Vgl. Zeilen 1–20). In diesem Fall wird erwartet, dass der Leser oder die Leserin selbst entscheidet, was hier eigentlich gemeint ist. Ich will aber verstehen, was die Autorin oder der Autor der Interpretation genau (!) meint. Dafür brauche ich genaue Textbelege in Form von Zitaten und nicht möglichst umfassende, auf konkrete Belege verzichtende Textverweise.
Die Herausforderung durch die KI zwingt dazu, die pädagogische Praxis zu schärfen. Wir können Halluzinationen der KI im Unterricht vorführen und reflektieren, um die Urteilskraft zu schulen. Und um ehrlich zu sein: Ich schreibe diesen Blogartikel in der Hoffnung, dass auch dieser ein Beitrag zur Reflexion und Urteilskraft sein möge. Oder aber er verdeutlicht: Als Lehrer weiß ich um diese Strategien, ich weiß auch, wie das System »Schule« diese »fördert«; ich bin gegenüber solchen Simulationen von Wissen und Kompetenz allerdings auch einigermaßen resistent.
Wenn eine KI eine Interpretation schreibt, bemerken einigermaßen wachsame Schüler:innen (und natürlich Lehrer:innen) bei genauer Prüfung die Bruchstellen: Die Behauptung eines Vergleiches, der im Text nicht existiert, oder die Erfindung von Zitaten zur Stützung einer These. Wer die statistische Logik der KI kennt und in jedem Fall zu entlarven in der Lage ist, schärft für sich den Blick für eigene methodische Fehler. Dieses Erkennen markiert den Unterschied zwischen einer statistischen Wahrscheinlichkeit und einer methodisch abgesicherten Herleitung. Die kritische Zerlegung dieser glatten Oberflächen wird zur zentralen Fähigkeit. – Lehrkräfte agieren hier als Anwälte der Methode. Wir müssen vermitteln, dass die Genauigkeit der Textarbeit kein Selbstzweck ist, sondern ein Schutz gegen Beliebigkeit. Das Aushalten der Spannung zwischen Text und eigener Meinung sowie das Eingeständnis, dass eine Stelle nicht sofort »nachvollziehbar« ist, sind Bildungsziele. In der Oberstufe bedeutet das: Die Bewertung (Benotung) belohnt die methodische Tiefe und sanktioniert die rhetorische Fassade. – Das ist Schüler:innen allerdings nicht immer einfach zu vermitteln, weil die Erfahrung von Widerstand im Lernprozess schmerzhaft ist und die glatte Oberfläche der Plausibilität den bequemeren Ausweg aus der Komplexität verspricht; und weil das Aushalten von Nicht-Verstehen und das Eingeständnis eigener Wissenslücken eine Form von intellektueller Demut erfordern, die in einer auf Effizienz getrimmten Klausurkultur als Schwäche missverstanden wird.
Bildung hat etwas mit der Haltung gegenüber Widerständen zu tun – Widerstände in Texten, in der Geschichte, in der Sprache, die nicht glattgebügelt werden dürfen. Als Theologe ergänze ich hier die Widersprüche in biblischen Zeugnissen. Wenn dieser Widerstand durch Spekulationen, Vorurteile oder persönliche Haltungen – die in der Auseinandersetzung mit Quellen eigentlich eventuell reflektiert und im Fall der Fälle auch in Frage gestellt werden sollten – ersetzt wird, geht der Kern des geisteswissenschaftlichen Lernens verloren.
Das Handwerk der Textarbeit – das genaue Lesen, das Belegen und die geschichtliche Einordnung – gewinnt in Zeiten automatisierter Plausibilität massiv an Bedeutung. Es geht dabei um mehr als nur um das korrekte Er- oder Ausfüllen eines Erwartungshorizonts. Wer den Sinn mühsam aus dem Material entwickelt, statt ihn (statistisch) zu vermuten, schult intellektuelle Resilienz und Ambiguitätstoleranz: die Fähigkeit, Mehrdeutigkeiten, Widersprüche und das eigene Nicht-Verstehen auszuhalten, statt die Komplexität vorschnell wegzuerklären.
In einer Welt, die zunehmend von glatten, aber substanzlosen Oberflächen dominiert wird, ist diese methodische Erdung die eigentliche Kernkompetenz. Wir bewerten in Klausuren ebenso wie in der Abiturprüfung am Ende die Genauigkeit der Herleitung, weil sie der einzige Schutz gegen die Beliebigkeit ist – und weil sie den Unterschied markiert zwischen einer Simulation von Wissen und jener Bildung, die auf echtem Verstehen gründet.