Zwei Jurastudierende reichen nahezu identische Klausuren ein. Inhaltlich sind diese gleichwertig, die Bearbeiter:innen haben die zentralen Probleme erkannt und es wurde gutachterlich sauber gearbeitet. Doch während die eine Klausur mit 10 Punkten bewertet wird, erhält die andere nur 4. Wie kann das sein? Die Ursache dieser Ungleichheit ist auf strukturelle Probleme im juristischen Prüfungssystem zurückzuführen: Fehlende Anonymisierung von Klausurbearbeitungen und subjektive Bewertungsmaßstäbe können Willkür begünstigen und die Chancengleichheit der Studierenden beeinträchtigen. Dieser Beitrag thematisiert, welche Faktoren Ungleichheiten fördern und wie sich die bestehenden Bewertungspraktiken auf die berufliche Entwicklung der Studierenden auswirken können. Vor diesem Hintergrund werden Reformansätze sowie der mögliche Einsatz KI-gestützter Verfahren diskutiert, mit denen subjektive Verzerrungen verringert und Bewertungsprozesse transparenter und gerechter gestaltet werden können.

 

Das bestehende Bewertungssystem

Ein zentrales Instrument, um eine unparteiische und objektive Bewertung zu gewährleisten, ist die Anonymisierung von Klausur-Bearbeitungen. Bereits bei universitären Prüfungen vor dem ersten Staatsexamen wird statt des Namens lediglich die Matrikelnummer auf dem Deckblatt angegeben. Ein persönlicher Bezug der Korrektor:in durch Handschrift, Namen, Geschlecht oder frühere Kontakte ist dadurch ausgeschlossen. Auf den ersten Blick erscheint dieses Verfahren plausibel: Wenn die prüfende Person nicht weiß, wen sie bewertet, sollte doch auch die Bewertung frei von Vorannahmen oder persönlicher Voreingenommenheit erfolgen, so zumindest die Theorie.

In der Praxis konnte sich dieses System, bei dem Klausurbearbeitungen einheitlich anonymisiert werden, nicht mehrheitlich durchsetzen. Nur 41,18 % der juristischen Fakultäten gaben an, dass Klausuren im Grund- und Hauptstudium anonym bearbeitet werden.1 Als Gründe gegen eine flächendeckende Einführung werden insbesondere ein organisatorischer Mehraufwand und zusätzliche Kosten angeführt. Zugleich wird teilweise vertreten, dass eine fehlende Anonymisierung keine nachteiligen Auswirkungen auf die Bewertung habe.

Viele Jurastudierende empfinden die Bewertung ihrer Klausuren – anonymisiert oder nicht – als schwer vorhersehbar und intransparent. Die Noten wirken in der Folge häufig willkürlich. Dieses Empfinden wird durch eine empirische Studie an der LMU München gestützt: Es wurden dieselben 15 Anfängerklausuren von 23 Personen insgesamt 230 Mal korrigiert. Jede Klausur hat mindestens 15 Benotungen erhalten, jeweils durch eine andere Person. Die statistische Analyse der Ergebnisse zeigte eine durchschnittliche Abweichung bei der Notenvergabe von über 6 Punkten, für ein und dieselbe Klausur.2

Diese Studie verdeutlicht, dass die zentralen Bewertungsunterschiede nicht primär auf die fehlende Anonymität zurückzuführen sind, sondern auf die grundlegende Subjektivität des juristischen Korrekturprozesses.

Anders als in standardisierten Prüfungsformaten wie Multiple-Choice-Tests existiert im juristischen Bereich keine starre Lösungsskizze – es gibt kein eindeutiges „Richtig” oder „Falsch”. Die Bewertung hängt vielmehr vom individuellen Rechtsverständnis, der Schwerpunktsetzung und der methodischen Ausrichtung der jeweiligen Korrektor:innen ab. Kriterien wie Argumentationslogik, juristische Ausdrucksweise, Schreibstil oder die Tiefe der rechtlichen Auseinandersetzung lassen sich nur eingeschränkt objektiv messen und sind häufig interpretationsbedürftig.

 

Ein Bewertungssystem mit Folgen

Schon früh im Studium wirken sich Prüfungsergebnisse entscheidend auf die weitere berufliche Laufbahn aus: Zwischenprüfung und universitäre Klausuren bestimmen maßgeblich den Zugang zu Praktikumsplätzen, studienbegleitenden Zusatzqualifikationen und weiteren Fördermöglichkeiten, die den späteren Karriereverlauf frühzeitig beeinflussen. Insbesondere das von den Studierenden angestrebte Prädikatsexamen fungiert als zentrales Selektionskriterium für begehrte Positionen in renommierten (Groß-) Kanzleien, im Staatsdienst oder bei Unternehmen. Wird diese Note nicht erreicht, bleiben viele dieser Karrierewege für die Betroffenen dauerhaft verschlossen. Andere Qualifikationen oder Eigenschaften, die gute Jurist:innen auszeichnen, wie soziale Kompetenz oder praxisorientiertes Denken, finden zumeist nur zweitrangige Beachtung und können „schlechte” Prüfungsleistungen oft nicht kompensieren.

Die LMU-Studie zeigt, dass bei der Notenvergabe durchschnittliche Abweichungen von über sechs Punkten auftreten können. Im juristischen Bewertungssystem entspricht eine solche Differenz dem Unterschied zwischen Nichtbestehen und Erreichen eines Prädikatsexamens. Diese Diskrepanz verdeutlicht die Tragweite subjektiver Bewertung und macht deutlich, wie entscheidend die damit verbundenen Notenabweichungen die beruflichen Perspektiven junger Jurist:innen prägen können.

 

Das zukünftige Bewertungssystem

Das derzeitige Benotungssystem im Jurastudium weist erhebliche Defizite auf, wodurch die Chancengleichheit der Studierenden systematisch gefährdet wird. Solange Leistungen nicht anhand klar definierter, nachvollziehbarer Kriterien bewertet werden, bleibt die Objektivität ein Ideal, das in der Praxis allzu oft verfehlt wird. Ein Prüfungssystem, das derart weitreichende Konsequenzen für berufliche Chancen und Lebenswege hat, darf nicht auf subjektiv anfällige, intransparente Bewertungskriterien gestützt sein.

Um dem entgegenzutreten, erscheint die konsequente Anonymisierung sämtlicher Prüfungsleistungen als unerlässlich. Unbewusste Vorannahmen durch Name, Geschlecht oder frühere Kontakte können jede Bewertung beeinflussen. Die Anonymisierung ist im staatlichen Teil des ersten Examens bereits etabliert, was ihre Bedeutung für eine gerechte Bewertung unterstreicht. Ihre konsequente Ausweitung stellt einen zentralen Schritt zur Reduzierung struktureller Verzerrungen dar.

Eine weitere Perspektive für ein gerechteres Benotungssystem bietet die Implementierung künstlicher Intelligenz bei der Bewertung juristischer Klausuren. Denkbar ist ein hybrides Modell, bei dem KI-gestützte Systeme Prüfungsleistungen anhand vorab festgelegter, transparenter Kriterien strukturieren und analysieren, während die abschließende Bewertung weiterhin durch menschliche Prüfer:innen erfolgt. Auf diese Weise lassen sich technologische Präzision und juristische Verantwortung miteinander verbinden, ohne die individuelle fachliche Würdigung zu ersetzen.

Dass dieser Weg auch institutionell vorgezeichnet ist, zeigt ein gemeinsames Schreiben der Justizminister:innen des Bundes und der Länder zum Einsatz von Künstlicher Intelligenz in der Justiz. Leitgedanke ist hier: Chancen nutzen, Verantwortung übernehmen, Transparenz gewährleisten.3 Dieses Prinzip lässt sich direkt auf das juristische Prüfungswesen übertragen: KI soll nicht autonom bewerten, sondern als unterstützendes Instrument dienen, das klare Kriterien nachvollziehbar umsetzt, Bewertungseinheiten standardisiert und Transparenz schafft.

Der Appell ist klar: Statt sich auf wiederholte Kritik und Rufe nach Reformbedürftigkeit zu beschränken, ist es Zeit, das juristische Prüfungswesen aktiv weiterzuentwickeln. Insbesondere der Einsatz künstlicher Intelligenz eröffnet die Möglichkeit, Leistungen fair zu würdigen und Chancengleichheit zu stärken, ohne menschliche Verantwortung zu ersetzen. Der Mensch bleibt Maßstab.

 

Quellen:

1 Meinhof/Roßbach, ZDRW 3/2024, 208-225

2 Hufeld, ZDRW 1/2024, 59-83

3 Bund/Länder, Gemeinsame Erklärung zum Einsatz von Künstlicher Intelligenz in der Justiz, 6/2025, Justizportal des Bundes und der Länder, Die Justizministerinnen und Justizminister des Bundes und der Länder Gemeinsame Erklärung zum Einsatz von Künstlicher Intelligenz in der Justiz

Bild von Julia Fundin

Julia Fundin

Bild von Aziza Kamphausen

Aziza Kamphausen

Bild von Anton Lennertz

Anton Lennertz