Die Macht der Testingenieure

Zukunft der Schule Die technisierte Beurteilung durch zentrale Leistungstests wird den Unterricht nicht verbessern, sondern ihn inhaltlich aushöhlen

Anfang Juni hat die Kultusministerkonferenz (KMK) bundesweite zentrale Leitungstests in Schulen beschlossen, die ab 2009 überprüfen sollen, ob Schüler bestimmte "Bildungsstandards" erreichen. Die so festgelegten Bildungsstandards erhalten damit faktisch den Rang eines bundesweiten Lehrplans, denn die Tests werden einen festen Platz im Unterrichtsgeschehen einnehmen. Die Leistungsprüfung für das Fach Mathematik wurde bereits im April und Mai während der PISA-2006-Erhebung erprobt.

Während der PISA-Test zunächst das öffentliche Denken und Glauben über unser Bildungssystem verändert haben, wird dieser zweite zentrale Leistungstest das Unterrichten selbst verändern, wahrscheinlich sogar umkrempeln: Der Test zu den bundesweiten Bildungsstandards will die Resultate des gesamten Unterrichts bis zur zehnten Klasse messen. Nie gab es in Deutschland eine schulische Leistungskontrolle mit einem solch umfassenden und sachlich problematischen Anspruch. Dieser Test wird künftig entscheiden, wer ein guter Lehrer ist, wer befördert wird, wessen Vertrag verlängert wird. Gute Gründe, nicht mehr Mathematik oder Deutsch, sondern Testbewältigung zu unterrichten.

Maß für Bildung

Tests im Bildungswesen sind standardisierte Instrumente, um Schülerleistungen quantitativ zu vermessen. Ihr vereinheitlichtes, output-orientiertes Verfahren erlaubt es nicht, Bildung als einen unabgeschlossenen, zugleich kognitiven und emotionalen, individuellen Prozess des Erkennens zu verstehen. Lehrer, die einen Anspruch von staatsbürgerlicher und demokratischer Erziehung haben, von Bildung des Selbst und des Sozialen, werden diese standardisierten Testverfahren eher als Hindernisse und Bremsklötze empfinden. Dabei beansprucht das Testkonstrukt, dass mit ihm ein Maß für "Bildung" genommen wird. Denn die Kultusministervereinbarung legte nun fest, dass Bildung bzw. Bildungsstandards und Testresultat ein und dasselbe sind. Schule wird damit ein Ort der Herstellung eines Testbaren, das man Bildung nennt. Messkonstrukt und Bildungsgedanke werden in eins gesetzt.

Die vom Bundesbildungsministerium und der KMK 2003 vorgestellte Expertise Zur Entwicklung nationaler Bildungsstandards beschreibt dies zunächst noch sehr offen: "Die Bildungsstandards legen fest, welche Kompetenzen die Kinder oder Jugendlichen bis zu einer bestimmten Jahrgangsstufe mindestens erworben haben sollen. Die Kompetenzen werden so konkret beschrieben, dass sie in Aufgabenstellungen umgesetzt und prinzipiell mit Hilfe von Testverfahren erfasst werden können." Doch bereits hier deutet sich an, dass es wesentlich darum geht, Kompetenzen "empirisch zuverlässig" zu erfassen. Die Expertise diskutiert dementsprechend, wie Tests in der Schule fest institutionalisiert werden können.

Wenn Tests nicht mehr lediglich ein Weg zur Ermittlung eines Leistungsstandes sind, sondern selbst zum Mittelpunkt und Inhalt von Unterricht werden, besteht die Gefahr, dass es beim Lernen immer weniger darum geht, sich einen Gegenstand zu erschließen und um seinen Gehalt zu ringen. Vielmehr wird sich mehr als bisher alles nur noch darum drehen, das Kreuz an der richtigen Stelle zu machen, die korrekte Zahl hinzuschreiben und abfragbares Wissen zu erlangen.

Die große Effektivität von Tests ist verführerisch: Der Scanner ist schneller als der Lehrer, der Student, der die offenen Schülerantworten kodiert, ist billiger als der Lehrer. Die rasch verfügbaren Ergebnisse werden bald zum Selbstzweck. Dabei helfen sie weder Lehrern noch Schülern bei ihrer Arbeit und geben auch keinerlei Hinweis darauf, was man auf welche Weise besser machen könnte. Stattdessen können Belohnung oder Bestrafung von "Leistung" direkt an das Testresultat gebunden werden. Indem diese zentralen Tests den Schulen aufgezwungen werden, beschädigen sie die relative Autonomie von Bildungseinrichtungen, denn sie beeinflussen direkt die Unterrichtsrealität. Dies hat vor allem damit zu tun, wie die Test-Aufgaben entwickelt werden und welchen Anforderungen sie unterliegen. Testaufgaben müssen in extrem kurzer Zeit in einem technisierten Verfahren ausgewertet werden können und haben bestimmte weitere technische Anforderungen zu erfüllen (zum Beispiel skalierungsfähig zu sein und ähnliches). Das Inhaltliche hat sich dem in jedem Falle unterzuordnen. Am Beispiel von PISA hat sich gezeigt, dass zumindest der Mathematiktest als Prüfung für mathematische Fähigkeiten nicht geeignet ist. Der Test für Bildungsstandards wird aber in einer vergleichbaren Prozedur erstellt.

Sog des Punktwerts

Es wird immer wieder argumentiert, die Testaufgaben könnten Unterricht verbessern. Wenn es wirklich so einfach wäre, dass man das Problem auf diese Weise technisch lösen könnte, dann wäre man im didaktischen Schlaraffenland. Aber selbst die DDR und Japan, die neben der Entwicklung von solchen Materialien noch weitere Anstrengungen unternommen haben, Bildungsprogramme anzuwenden, waren bzw. sind nicht solche Schlaraffenländer. Natürlich kann Unterricht immer auch mit problematischen Aufgaben produktiv arbeiten, zum Beispiel, indem man die Aufgaben hinterfragt, erweitert oder verändert. Der Lehrer, der mit solchen Testaufgaben anspruchsvollen, reichhaltigen Unterricht halten kann, dem gelingt es mit jeder noch so stupiden Aufgabe. Doch der Gedanke, dass zentral entwickelte Testaufgaben den Unterricht verbessern könnten, ist eindimensional. Verändern werden sie den Unterricht allerdings, indem sie als Bewertungsmaßstab auftreten.

Die zentral entwickelten Leistungstests ermöglichen einen direkten Zugriff auf Lehrer und Schüler. Mit ihnen wird mittels mechanisierter Beurteilung technokratische Kontrolle ausgeübt. Um diesem Problem seine Spitze zu nehmen, will man in der praktischen Anwendung weitere Beurteilungskriterien hinzuziehen, zum Beispiel Zensuren, Verbalbeurteilungen, Gespräche, Portfolios und Arbeitsproben. Das verschleiert aber das Problem, statt es zu lösen: Die technische Beurteilung geriert sich objektiv, präzise und valide, weil sie als wissenschaftlich fundiertes Instrument daherkommt. Im Zweifelsfall müssen also alle nichttechnischen Beurteilungen ihre abweichenden Urteile gegenüber der technischen Beurteilung rechtfertigen. Das hängt nicht nur mit dem Sog des scheinbar präzisen Punktwertes zusammen, sondern ergibt sich auch aus dem wissenschaftlichen Grundsatz von Tests: Das Verfahren duldet keine Relativierungen und Ungenauigkeiten, denn ein technisches Instrument, das in Einzelfällen nicht aussagekräftig ist, wäre im Ganzen überflüssig, falls diese Einzelfälle nicht heraussortierbar sind. Man muss also zwangsläufig Allgemeingültigkeit postulieren.

Test als Selbstzweck

In einer zunehmend "vertesteten" Schule werden Zukunftschancen anders vergeben, Schulleitung und Verwaltung müssen anders arbeiten: Erforderten Sanktionen gegen Lehrer, Schüler und Schulen bisher eine mühsame inhaltliche Auseinandersetzung, so bedarf es dieser nicht mehr, wenn die Beurteilung technisiert ist. Schlechte Testergebnisse genügen, um zu rügen, Aufstiege oder Prämien zu verweigern, Verträge nicht zu verlängern, Verbeamtungen zurückzuweisen, Versetzungen zu torpedieren. Die inhaltliche Auseinandersetzung ist auf die Ebene der Testingenieure verlagert, die das Instrument entwickelt haben. Die Testingenieure definieren die Instrumente als wissenschaftlich und somit als fundiert. Kritik an den Instrumenten und ihren Resultaten ist nahezu nur noch von Testexperten möglich. Dies ist natürlich umso schwieriger, wenn die Instrumente geheim sind wie bei PISA und bei den Tests zu den Bildungsstandards.

Schule zu verbessern, ist kein einfaches Geschäft. Dass Tests als technisierte Instrumente dieses Geschäft unterstützen, ist nicht mehr als ein frommer Wunsch, denn der Glaube, dass technisierte Beurteilungen präzise und objektiv seien, führt viel eher dazu, dass Tests dieses Geschäft formalisieren und den Unterricht inhaltlich aushöhlen - die Tests werden zu reinen Instrumenten institutionalisierter Kontrolle.

Wolfram Meyerhöfer ist Mathematikdidaktiker an der Universität Potsdam. Sein Buch Tests im Test. Das Beispiel PISA ist 2005 bei B. Budrich erschienen.


Liebe Leserin, lieber Leser,

dieser Artikel ist für Sie kostenlos.
Unabhängiger und kritischer Journalismus braucht aber auch in diesen Zeiten Unterstützung. Wir freuen uns daher, wenn Sie den Freitag hier abonnieren oder 3 Ausgaben gratis testen. Dafür bedanken wir uns schon jetzt bei Ihnen!

Ihre Freitag-Redaktion

00:00 15.09.2006

Ausgabe 43/2021

Hier finden Sie alle Inhalte der aktuellen Ausgabe

3 Ausgaben kostenlos lesen

Der Freitag ist eine Wochenzeitung, die für mutigen und unabhängigen Journalismus steht. Wir berichten über Politik, Kultur und Wirtschaft anders als die übrigen Medien. Überzeugen Sie sich selbst, und testen Sie den Freitag 3 Wochen kostenlos!

Kommentare