Bewertung von Prüfungen
Taiga Brahm
Bevor die durch Lernerfolgskontrollen erhobenen Lernergebnisse sichtbar und mit anderen Leistungen vergleichbar sind, müssen sie bewertet werden (Lernerfolgskontrolle). Unterschieden wird zwischen zwei Bewertungsarten: Wird der Lernverlauf kontinuierlich und prozesshaft begleitet und bewertet, spricht man von einer formativen Bewertung.
Dem gegenüber steht die Bewertung punktueller Leistungsstände, die i.d.R. einer summativen Bewertung entspricht (Böhner & Dolzanski, 2016). Abhängig vom Zweck der Bewertung stehen unterschiedliche Kompetenzerfassungsinstrumente zur Verfügung. Bei der Auswahl dieser Instrumente ist es bedeutend, die Auswahlkriterien an den Unterricht anzupassen und die Kompetenzorientierung zu berücksichtigen (Böhner & Dolzanski, 2016).
Instrumente
Ohne Anspruch auf Vollständigkeit wird im Folgenden eine kurze Übersicht von Instrumenten gegeben, die u.a. im Wirtschaftsunterricht zur Bewertung verschiedener Lernleistungsprüfungen genutzt werden können.
Mathes (2016) weist hinsichtlich des Aufbaus von Klassenarbeiten daraufhin, dass die darin vorkommenden „Aufgaben unterschiedliche Lernzielstufen abdecken“ (Mathes, 2016, S. 383) sollten. Eine mögliche prozentuale Aufteilung, die als Orientierung genutzt werden kann, sieht beispielsweise so aus (Mathes, 2016, S. 383):
- Reproduktion (nennen, aufzählen, berechnen): 25%,
- Transfer (erklären, prüfen, vergleichen): 45% und
- problemlösendes Denken (beurteilen, abwägen, diskutieren): 30%.
In Klammern sind nach den einzelnen Lernzielstufen jeweils einige für die Aufgabenformulierung passende Operatoren angegeben (Handeln von Lehrpersonen). Der prozentuale Anteil kann und sollte je nach Schulart, Klassenstufe und den vorangegangenen Themen und Übungen angepasst werden (Mathes, 2016).
Um die Note zu berechnen, können sog. “Notenprogramme“ (Mathes, 2016, S. 384) genutzt werden. Diese berechnen individuell anhand der erreichten Punktzahl und der möglichen Gesamtpunktzahl die erzielte Note. Alternativ kann diese auch mit folgender Formel berechnet werden (Mathes, 2016, S. 384):
Für Seminararbeiten im Bereich Wirtschaft können unterschiedliche Bewertungskriterien angelegt werden: Oftmals werden die fachliche Richtigkeit, die Struktur, die Nutzung der Fachsprache, die Argumentationslinie sowie Formalia bewertet. Böhner & Dolzanski (2016) nennen beispielsweise die Professionalität, das fachliche Spektrum, den Zielerreichungsgrad und die Ökonomie der Arbeit als Kriterien. Kriterien können unterschiedlich gewichtet werden und sollten je nach Thema und Kompetenzen, die mit der Arbeit gefördert/geprüft werden, angepasst werden. Wesentlich ist, dass die Erwartungen, konkreten Tätigkeiten und Bewertungskriterien gegenüber den Lernenden zu Beginn der Bearbeitung transparent gemacht werden. Sofern die Seminararbeit auch noch andere Bestandteile umfasst, ist auch zu verdeutlichen, wie diese sich gegenseitig ergänzen. Ein Vorschlag für eine Bewertung wäre: schriftliche Arbeit (50%), Präsentation (20%) und Kolloquium (30%) (Böhner & Dolzanski, 2016, S. 237).
Mündliche Mitarbeit und Interaktionsleistungen können auf verschiedenen Wegen erfasst werden. Eine Möglichkeit stellt die so genannte Tickbox dar. Dabei werden verschiedene Interaktionsleistungen, z.B. die kritische Auseinandersetzung im Unterricht oder durchgeführte Perspektivenwechsel etc., stündlich beobachtet und im Anschluss in einer Tabelle als durchschnittlich, gut oder sehr gut bewertet. Nach gewissen Zeiträumen wird aus diesen Notizen eine Note berechnet. Eine andere Möglichkeit, mündliche Noten zu erfassen, bietet ein Beobachtungs- und Bewertungsbogen (siehe unten) oder die Bewertungsmatrix. In dieser wird die “Fachqualität mündlicher Beiträge“ (Böhner & Dolzanski, 2016, S. 245) in Form von Noten festgehalten. Dafür bewertet die Lehrkraft zu verschiedenen Zeitpunkten des Unterrichts die mündliche Mitarbeit und trägt diese als Note in die Matrix ein. Dieses Vorgehen ist insofern hilfreich, da die Lehrkraft ihre Schülerinnen und Schüler zwischenzeitlich über ihren momentanen Leistungsstand informieren kann (Böhner & Dolzanski, 2016).
Dieses Instrument kann sowohl prozessbegleitend (formativ) als auch summativ eingesetzt werden. Böhner & Dolzanski (2016) schlagen als Beispiel das Auflisten verschiedener Beobachtungsindikatoren auf, die mit Bewertungstendenzzeichen (- -, -, o, +, ++) beurteilt werden. Ebenso können Bewertungsbögen in verschiedene Elemente unterteilt werden, z.B. den fachlichen Inhalt, genutzte Medien sowie Tischvorlagen (z.B. Handout) und die sprachliche Darstellung. Diese Abschnitte können einzeln bepunktet und danach unterschiedlich gewichtet werden, woraus sich im Anschluss die Endnote ergibt (Böhner & Dolzanski, 2016).
Für die Bewertung von Referaten existiert ebenfalls eine Vielzahl an Bewertungsbögen, die unterschiedliche Kriterien und Kompetenzen erfassen. Beispielsweise bilden Böhner & Dolzanski (2016, S. 243) die folgenden Bereiche ab: Inhalt (40%), Vortragsstil (15%), Darstellung (15%), Ergebnissicherung (10%) und Kolloquium (20%) (mit der jeweiligen Gewichtung in Klammern). Je nach Bedarf können Bewertungsbögen für verschiedene Wirtschaftsthemen angepasst werden. Kostenlose Bewertungsbögen finden sich z.B. auf der Website „4teachers.de“ sowie auf den Landesservern, z.B. Lehrerfortbildung BW (Böhner & Dolzanski, 2016, S. 243).
Beurteilungsfehler
Sowohl beim Beurteilen als auch beim Bewerten von Leistungen sollte die Lehrkraft reflektieren, ob ihre Beurteilungen und Bewertungen womöglich Beurteilungsfehlern und Voreingenommenheit unterliegen (Böhner & Dolzanski, 2016; Mathes, 2016). Oftmals „werden unbewusste Indikatoren, wie etwa ein wacher, verständiger Gesichtsausdruck“ (Wilbers, 2019, S. 615) des oder der Lernenden in die Leistungsbeurteilung und Bewertung miteinbezogen, obwohl diese „keine valide Erfassung von Intelligenz darstellen“ (Wilbers, 2019, S. 615). Unter anderem können folgende Beurteilungsfehler auftreten (Mathes, 2016, S. 392; Wilbers, 2019, S. 616):
- Sympathie-Fehler/Persönlichkeitseffekt: Sympathie und Antipathie der Lehrkraft gegenüber der Schülerin oder dem Schüler können Folgen für die Bewertung haben. Aus diesem Grund sollte sich die Lehrkraft fragen, in welcher Beziehung sie/er zu den Lernenden steht und ob diese eine Auswirkung auf die Bewertung hat.
- Tendenz zur Mitte: Extrem gute und extrem schlechte Noten werden oftmals vermieden, somit entsteht eine Tendenz zur Mitte, d.h. die Noten befinden sich meistens nur im mittleren Bereich.
- Referenzfehler: Hierbei orientiert sich die Lehrkraft an der falschen Bezugsnorm, z.B. der individuellen Bezugsnorm (Bezugsnormen). So kann es vorkommen, dass Noten zwischen Klassen nicht vergleichbar sind.
- Halo-Effekt: Persönlichkeitseigenschaften von Schülerinnen und Schülern wie z.B. Selbstbewusstsein, Kleidung oder Sprache „überstrahlen die zu beurteilende Qualifikation“ (Mathes, 2016, S. 392). So können sie die Gesamtbeurteilung verfälschen oder zu komplett falschen Bewertungen führen.
- Logischer Fehler: Die Ausprägung eines Merkmals lässt auf die Ausprägung eines anderen Merkmals schließen, ohne dass wissenschaftliche oder sachliche Evidenz besteht. Beispielsweise ist dies dann der Fall, wenn mangelnde Rechtschreibung als Indiz für niedrige Intelligenz angesehen wird (Wilbers, 2019, S. 616).
- Zufallseffekt: Beim Bewerten von mehreren Leistungen von Lernenden wird die nachfolgende Person anders bewertet abhängig davon, wie gut/schlecht die/der zuvor bewertete Schülerin oder Schüler bewertet wurde.
Bei allen Leistungsbewertungen ist zu reflektieren, dass die individuellen Leistungen sowie die Leistungsfähigkeit der Lernenden schließlich mithilfe von Bildungszertifikaten operationalisiert werden. Hintergrund ist nach Waldow (2019), dass die Chancenverteilung in westlich, demokratisch geprägten Gesellschaften „auf Basis von individueller Leistung bzw. Leistungsfähigkeit (…) [und] nicht auf der Basis von askriptiven Faktoren wie [z.B. dem] Vermögen“ erfolgen soll (Waldow, 2019, S. 255). Die Bildungszertifikate greifen auf die Leistungsbeurteilung, z.B. in Form von Zeugnissen in der Schule, zurück und „konvertieren“ somit die Leistungen einer Schülerin oder eines Schülers in ihre oder seine „Lebenschancen“ (Waldow, 2019, S. 255). Somit entscheidet die Bewertung durch die Lehrkraft regelmäßig über Karrierechancen, schulische Abschlüsse und Hochschulzulassungen (Böhner & Dolzanski, 2016).
Literatur
Böhner, M., & Dolzanski, C. (2016). Fachdidaktik für Lehrende im Bereich Wirtschaft. Schlüssel für erfolgreichen Unterricht. 1. Auflage. Cornelsen.
Mathes, C. (2016). Wirtschaft unterrichten Methodik und Didaktik der Wirtschaftslehre (9. Aufl.). Verlag Europa-Lehrmittel Nourney, Vollmer GmbH & Co. KG.
Waldow, F. (2019). Akteurskonstellationen und Gerechtigkeit von schulischer Leistungsbeurteilung in Deutschland, Schweden und England. In J. Bellmann, & H. Merkens (Hrsg.), Bildungsgerechtigkeit als Versprechen: Zur Rechtfertigung und Infragestellung eines mehrdeutigen Konzepts (S. 255-278). Waxmann.
Wilbers, K. (2019). Wirtschaftsunterricht gestalten (4. Aufl.). epubli.
zuletzt aktualisiert: 01.11.2024
Zitationshinweis
Die Inhalte dieser Homepage sind CC-BY lizenziert (https://creativecommons.org/licenses/by/4.0/). Bei Verwendung der Inhalte empfehlen wir folgende Zitation:
Brahm, T. (2024). Bewertung von Prüfungen. In T. Brahm, M. Ring, & K. Schild (Hrsg.), Wirtschaft unterrichten. Offenes Lehrbuch für Wirtschaftsdidaktik. Online verfügbar unter: https://wirtschaft-unterrichten.de/diagnose-ueben-pruefen/bewertung-von-pruefungen (zuletzt abgerufen am [Datum]).