
Home: www.vep-landau.de
Empirische Pädagogik
Zeitschrift zu Theorie und Praxis erziehungswissenschaftlicher Forschung
Zusammenfassung des Artikels: 2007, 21(4), 352-367
Ingmar Hosenfeld & Jana Groß Ophoff
In diesem Heft geht es um die Nutzung und den Nutzen von Evaluationsstudien in Schule und Unterricht, wobei der Fokus auf den beiden Aspekten des wahrgenommenen Nutzens und der tatsächlichen Nutzung von Rückmeldungen an Schulen liegt. Es geht hier also weniger um Varianten der schulinternen Evaluation als vielmehr um Verfahren mit mindestens externen Anteilen. Die beiden fokussierten Begriffe stehen in einem komplexen Verhältnis zueinander, bei dem idealerweise eine hohe wahrgenommene Nützlichkeit zu einer intensiven Nutzung führt. Im Allgemeinen wird also der wahrgenommene Nutzen als Voraussetzung für die Nutzung aufzufassen sein, auch wenn es spezifische Konstellationen geben kann, in denen es trotz fehlendem wahrgenommenen Nutzen zu einer intensiven Nutzung kommt – entweder im Sinne eines Missbrauchs oder weil spezifische Verwendungen angeordnet wurden. Nehmen die Adressaten von Rückmeldungen also idealerweise einen Nutzen wahr, so hängt es von einer ganzen Reihe weiterer Faktoren ab, ob, wie und in welchem Umfang die zur Verfügung gestellten Informationen verwendet werden.
In diesem Sinne wird im Rahmen des wissenschaftlichen Diskurses über datengestützte Qualitätsentwicklung von Schule und Unterricht immer wieder betont, dass die Rückmeldung von extern ermittelten Ergebnissen nicht automatisch zu den gewünschten Veränderungsprozessen führt (u. a. Kohler & Schrader, 2004; Rolff, 2002; Visscher, 2002; Weiss, 1998). Das komplexe Geflecht aus Voraussetzungen, Einflussfaktoren und Folgen wird mit unterschiedlichem Fokus von einer Reihe von Autoren anhand unterschiedlicher Modelle theoretisch gegliedert. Im Folgenden stellen wir einige Ansätze dar, die uns geeignet erscheinen zentrale Mechanismen zu erläutern und so eine Hintergrund-Folie bilden, mit der die in diesem Heft gesammelten Beiträge eingeordnet und interpretiert werden können.
Kluger und DeNisi betonen (1996, 1998), dass Feedback durch den Lernenden akzeptiert, modifiziert oder zurückgewiesen werden und somit unterschiedlich auf die nachfolgende Aufgabenausführung wirken kann. Auf Basis von Meta-Analysen stellen die Autoren fest, dass in einem Drittel der berücksichtigten Studien negative Performanz-Effekte berichtet wurden, auch wenn über alle Studien hinweg ein moderat positiver Effekt von Feedback-Interventionen nachgewiesen werden konnte. Sie leiten aus den verschiedenen Befunden ein theoretisches Modell der Wirkung von Feedback-Interventionen (1996) ab. Grundlegende Annahmen sind, dass über den Vergleich von Feedback mit hierarchisch organisierten Zielen und den darauf bezogenen Prozessen das Verhalten reguliert wird. Da jedoch die Aufmerksamkeit limitiert ist, spielen nur die in diesem Vergleich bewusst wahrgenommenen Diskrepanzen eine Rolle für die Regulation des Verhaltens. Indem Feedback-Interventionen den Aufmerksamkeitsfokus verändern, können sie das Verhalten beeinflussen. Das „Auflösungsniveau“ der Auseinandersetzung mit dem Feedback wird letztlich durch den Automatisierungsgrad der zu bewältigenden Aufgabe beeinflusst: In der Auseinandersetzung mit bewusst wahrgenommenen Diskrepanzen wird die Aufmerksamkeit i. d. R. zunächst auf die mittlere Prozessebene gelenkt, auf der die eigentliche Aufgabenbearbeitung insbesondere in motivationaler Hinsicht reguliert wird. Ein motivierter Handelnder würde in diesem Fall zunächst auf bewährte, stark automatisierte Strategien zurückgreifen (u. a. mehr Anstrengung) und schließlich – falls die gewählte Strategie „versagt“ – aufgabenspezifische Strategien einsetzen. Falls die wahrgenommene Diskrepanz auf diesem Wege nicht beseitigt werden kann, wird die Aufmerksamkeit auf andere, kognitiv aufwändigere Prozessebenen gelenkt: entweder auf die niedrigere Ebene der Aufgabenausführung (Lernen) oder auf die Ebene des Selbst, was beides zu sowohl vor- als auch nachteiligen Effekten für die Aufgabenbearbeitung führen kann. Die Wirkung von Feedback wird also davon beeinflusst, auf welche Verarbeitungsebene sich die Informationen beziehen. So konnten Kluger und DeNisi (1996) basierend auf Moderator-Analysen zeigen, dass insbesondere solche Rückmeldungen positive Effekte auf die Performanz nach sich ziehen, die für bekannte (automatisierte) Aufgaben gegeben werden, lernförderliche Hinweise enthalten, Hinweise zur unmittelbaren Aufgabenbearbeitung und zur Zielsetzung derselben vermitteln sowie zugleich Hinweise vermeiden, die auf die Ebene des Selbst lenken.
Während Kluger und DeNisi in ihrem Modell von drei Verarbeitungsebenen ausgehen, unterscheiden Hattie und Timperley (2007) mit Blick auf Schule und Unterricht vier Ebenen, auf die sich Feedback beziehen kann.
1. (Ausführung der) Aufgaben-Ebene
2. Prozess-Ebene (Verstehen/Strategien)
3. regulatorische (metakognitive) Ebene
4. persönliche Ebene
Diese Verarbeitungsebenen entsprechen im Kern dem Modell von Kluger und DeNisi, wobei Hattie und Timperley die mittlere Prozessebene der Aufgabenbearbeitung zusätzlich unterteilen in kognitive und metakognitive Prozesse. Feedback, das sich auf diese beiden Ebenen bezieht, bezeichnen die Autoren als besonders wirksam. Eine elaborierte Auseinandersetzung und Aufgabenbeherrschung wird dabei erreicht, indem Feedback auf der Prozess-Ebene (2) Hinweise darauf gibt, wie die Aufgabe bearbeitet werden kann, und Feedback auf Ebene der Selbstregulation (3) sich darauf bezieht, wie der Lernende seine Aktivitäten auf dem Weg zum Lernziel überwacht, steuert und reguliert. Feedback, das sich auf die Aufgaben-Ebene (1) bezieht, informiert demgegenüber in erster Linie über die Korrektheit der Ausführung und ist nur wirksam, wenn die Informationen genutzt werden können, um kognitive und metakognitive Prozesse zu optimieren bzw. zu entwickeln. In diesem Sinne sollte Feedback idealerweise die Lernenden von der Ebene der Aufgabe auf die Ebene von Verstehensprozessen und schließlich auf die Ebene der Selbstregulation begleiten. Feedback über das Selbst (4) ist nach Hattie und Timperley wenig effektiv, da es i. d. R. keinen unmittelbaren Bezug zur Handlung herstellt (z. B. „Du bist ein begabter Schüler.“). Die Autoren betonen, dass Feedback die Funktion hat, Diskrepanzen zwischen dem Gelernten und dem, was gelernt werden soll, zu reduzieren. Effektives Unterrichten beinhaltet dabei nicht nur die Vermittlung von Informationen und Verständnis, sondern bedeutet auch die Beurteilung und Bewertung des Verständnisses dieser Informationen, damit der nächste Lehr-Schritt daran angepasst werden kann. Vor diesem Hintergrund sollte effektives Feedback drei Fragen beantworten können.
1. Was sind die Ziele?
2. Welcher Fortschritt wird in Richtung Ziel gemacht?
3. Welche Aktivitäten müssen unternommen werden, um im Lernprozess fortzuschreiten?
Die erste Frage bezeichnen die
Autoren als „feed up“-Aspekt, wonach es grundlegend ist, dass Feedback darüber
informiert, was „Erfolgskriterien“ sind und inwiefern bestimmte Lernziele im
Rahmen der Aufgabenbearbeitung oder Performanz erreicht wurden. Solange das (Lern-)Ziel
mangelhaft definiert ist, kann die Lücke zwischen dem tatsächlichen und dem
gewünschten Lernprozess von den Lernenden weder identifiziert noch angemessen
beseitigt werden. Die Ziele sollten außerdem verbindlich und herausfordernd
formuliert sein, um eine Orientierung an Erfolgskriterien zu ermöglichen. So
kann der Lernende die eigene Leistung mit Blick auf das Ziel nachvollziehen
und bei Bedarf Anstrengung, Handlungsrichtung oder Bearbeitungsstrategie
anpassen. Sobald die Aufgabe erfüllt ist, können darauf aufbauend neue, moderat
fordernde Ziele formuliert werden, was wiederum die Bedingungen für einen
fortlaufenden Lernprozess schafft. Da jedoch nicht vorausgesetzt werden kann,
dass die Lernenden diese Ziele von selbst verbindlich teilen, sollte ein
entsprechendes „commitment“ gezielt gefördert und aufgebaut werden. Die
zweite Frage informiert darüber, welche Fortschritte in Richtung Ziel
gemacht werden („feed back“-Aspekt) – und zwar i. d. R. mit Blick auf einen
bestimmten Standard, frühere Leistungen oder den (Miss-)Erfolg bei Teilaspekten
der Tätigkeit. Demnach zeichnet sich effektives Feedback aus durch
Informationen zum Prozess und/oder wie weiter zu verfahren ist. Die dritte
Frage schließlich gibt Auskunft über „feed forward“-Aspekte, also darüber,
welche Aktivitäten für den weiteren Lernfortschritt zu unternehmen sind (z. B.
verstärkte Selbstregulation, höhere Automatisierung der Ausführung, weitere
Bearbeitungsstrategien oder -prozesse, usw.). Ein wesentliches Ziel ist es vor
diesem Hintergrund, dass Lücken zwischen dem Gelernten und zu Lernendem
identifiziert werden, indem der (Lern-)Fortschritt ins Verhältnis zu den (Lern-)
Zielen gesetzt wird und unterstützend alternative bzw. folgende Schritte
angeboten werden, ohne dass die Aufmerksamkeit auf das Selbst gelenkt wird.
Mit Blick auf Leistungsmessungen stellen Hattie und Timperley (2007) fest, dass die Resultate selten genutzt werden, um die genannten drei Feedback-Fragen nach Zielen, Fortschritten und Folgeschritten zu beantworten. Insbesondere Lehrkräfte scheinen die Ergebnisse aus Leistungstests eher als Feedback über die Leistung der Schüler zu interpretieren als über die Effektivität ihres eigenen Unterrichts (siehe auch Timperley, Phillips & Wiseman, 2003; Schneewind in diesem Band). Dabei sollte in der Auseinandersetzung mit Feedback aus Leistungstests im Vordergrund stehen, wie die Lücke zwischen dem Gelernten und zu Lernendem geschlossen werden kann.
Auch Ditton und Arnold (2004) greifen auf den Ansatz von Kluger und DeNisi zurück und integrieren diesen in ein Modell ergebnisorientierter Qualitätssicherung von Schule und Unterricht, in welchem die Handlungsausführung sowie internes und externes Feedback im Mittelpunkt stehen. Demnach stellen extern durchgeführte Evaluationen und die daraus resultierenden Rückmeldungen eine Ergänzung oder ggf. Korrektur der alltäglichen, durch die Lehrkräfte selbst erfahrenen Rückmeldungen dar. Die verschiedenen Feedback-Informationen werden im Prozess schulischer Qualitätssicherung integriert, mit den Bildungszielen verglichen und daraus ggf. Maßnahmen zur Bewältigung von Diskrepanzen abgeleitet. Die Wirkung der implementierten Maßnahmen auf die schulische bzw. unterrichtliche Qualität kann wiederum als Rückmeldung bezüglich der erreichten Ziele genutzt werden und wird nach Ditton (u. a. 2002) zusätzlich beeinflusst durch strukturelle, finanzielle, materielle und personelle Bedingungen.
Ein weiteres Modell der Nutzung von Feedback in Schule und Unterricht geht zurück auf Visscher und Coe (2002). Die beiden Autoren entwerfen auf Basis intensiver Literaturrecherchen ein Rahmenmodell, das verdeutlichen soll, welche Faktoren die innerschulische Nutzung und weitere Effekte von „School Performance Feedback Systems“ maßgeblich beeinflussen. Diese Feedback-Systeme zeichnen sich dadurch aus, dass regelmäßig Lernstände sowie zugehörige Hintergrundvariablen erfasst und zurückgemeldet werden, die von den Schulen und Lehrkräften zur Schul- und Unterrichtsentwicklung genutzt werden sollen (vgl. auch Bonsen & von der Gathen, 2004). Nach Visscher und Coe wird die Intensität und Art der Nutzung von Feedback durch Anlage und Inhalt der Rückmeldungen sowie durch schulische Bedingungen beeinflusst. Ausgangspunkt des Modells ist die Anlage des Feedback-Systems: Darunter fallen u. a. Aspekte wie die Zielsetzung des Feedbacks (z. B. Qualitätsentwicklung, Rechenschaftslegung), die strategische Ausrichtung (z. B. Adressaten, Zeitpunkt und Inhalt der Rückmeldung) sowie die Entscheidung, wie standardisiert bzw. wie flexibel angepasst an die spezifischen Interessen der Teilnehmer Informationen zurückgemeldet werden sollen. Die entsprechenden Entscheidungen beeinflussen wiederum den konkreten Inhalt der Rückmeldungen. Dabei ist für die resultierende Nutzung maßgeblich, wie die Adressaten das Feedback-System in Hinsicht auf die Datenqualität, die Anwendbarkeit im schulischen Alltag und die Nützlichkeit beurteilen. Auch der Prozess der Implementierung beeinflusst die Nutzung von Feedback. Dabei regt die alleinige Ausübung von Druck oder das Angebot von Unterstützung nicht zwangsläufig zu entsprechenden Veränderungsprozessen an. Wesentlich ist vielmehr eine Kombination dieser Strategien z. B. in Form eines umfassenden Unterstützungssystems und der Verpflichtung, aus den Ergebnissen Veränderungsmaßnahmen abzuleiten. Auch mit Blick auf Schulmerkmale führen Visscher und Coe Aspekte an, die sich u. a. auf den Leistungsstand der Schule, die schulische Bereitschaft und Kapazität für Innovationen, Kooperation im Kollegium sowie Kompetenzen in der Analyse der zurückgemeldeten Ergebnisse beziehen. In Anlehnung an Rossi, Lipsey und Freeman (1999) unterscheiden Visscher und Coe drei Formen der Nutzung, nämlich die instrumentelle, konzeptuelle und symbolische Nutzung. Instrumentelle Nutzung ist definiert als die direkte Verwendung von Evaluationsergebnissen: Die Ergebnisse werden analysiert und daraus Entscheidungen und Maßnahmen/Aktivitäten abgeleitet. Als konzeptuelle Nutzung wird dagegen die indirekte Verwendung von Ergebnissen bezeichnet, wodurch bestimmte Einstellungen oder Haltungen beeinflusst werden und darüber auf die abgeleiteten Aktivitäten wirken. In der symbolischen Nutzung werden Informationen als Unterstützung des eigenen Standpunktes in Diskussionen herangezogen oder selektiv eingesetzt, um schon vorhandene Einstellungen oder getroffene Entscheidungen zu legitimieren. Visscher (2002, S. 57ff) ergänzt diese drei Nutzungsformen um strategische Nutzung, wonach Testergebnisse eher missbräuchlich verwendet werden, um strategische Ziele zu erreichen. Die Nutzung der Rückmeldungen mündet schließlich in beabsichtigte (wie z. B. ergebnisorientierte Unterrichtsentwicklung) und unbeabsichtigte Effekte (z. B. teaching to the test, Ausschluss „unerwünschter“ Schüler). Dabei entscheidet die einzelne Schule darüber, wie die Rückmeldungen verarbeitet werden (vgl. Bonsen & von der Gathen, 2004; Rolff, 2002).
Die verschiedenen berichteten Modelle weisen zwar z. T. erhebliche Überlappungen auf, setzen jedoch jeweils unterschiedliche Schwerpunkte. So konzentrieren sich z. B. die Modelle von Kluger und DeNisi (1996, 1998) und von Hattie und Timperley (2007) insbesondere auf den individuellen kognitiven Verarbeitungsprozess von Ergebnisrückmeldungen und berücksichtigen v. a. Erkenntnisse zu der Wirkung von Merkmalen bzw. Inhalten von Feedback. Die Modelle von Ditton und Arnoldt (2004) und von Visscher und Coe (2002) beschreiben demgegenüber interne und externe (organisatorische) Bedingungen, die auf den Prozess der Auseinandersetzung mit Ergebnisrückmeldungen wirken. Natürlich gibt es weitere Modelle, die einen Teilaspekt der Nutzung von Ergebnisrückmeldungen beleuchten können, wie z. B. Hall und Hord (u. a. 2001), die ein Entwicklungsmodell der Nutzung von Innovationen vorschlagen.
Das von Helmke entwickelte Modell Von der Evaluation zur Innovation (vgl. Helmke & Hosenfeld, 2005) integriert sowohl prozessuale Komponenten als auch verschiedene Bedingungen auf Personen- und Organisationsebene. Daher soll dieses umfassende, wenn auch eher deskriptive Modell den Überblick über verschiedene theoretische Zugangsweisen zu Nutzen und Nutzung von (externen) Evaluationen im Bildungswesen abschließen und zugleich als Gliederung für dieses Themenheft dienen. Ein idealer Rezeptionsprozess wird als Abfolge verschiedener Schritte dargestellt (Abbildung 1).
Abbildung 1: Zyklenmodell von der Rückmeldung zur Innovation (vgl. Hosenfeld, 2005, S. 113)

Ausgehend von der Rückmeldung (ganz links) kommt es im Idealfall zunächst zur Rezeption der angebotenen Informationen und im Anschluss daran zu einer Reflexion über mögliche Erklärungen. Es folgt die Phase der Aktion, in der entsprechend der angenommenen Erklärungen spezifische Maßnahmen zur Optimierung durchgeführt werden. Diese sollten im Weiteren hinsichtlich ihrer Wirksamkeit evaluiert werden, wobei das Ergebnis der Evaluation wiederum als Rückmeldung und somit Startpunkt des Zyklus verstanden wird. Dabei gilt, dass jeder Schritt als Voraussetzung für den jeweils folgenden gedacht ist, diese idealtypische Verarbeitungskette also an jeder Stelle unterbrochen sein kann. Ob bzw. in welcher Qualität diese Schrittfolge abläuft, hängt zum einen von individuellen Bedingungen der Lehrkräfte und zum andern von schulischen und von externen Bedingungen ab.
Der Wert dieses Modells (ausführlicher siehe Helmke & Hosenfeld, 2005) liegt in seiner heuristischen Kraft, die verdeutlicht, dass eine Rückmeldung alleine keineswegs ausreicht, sondern spezifische Bedingungen des Gelingens erfüllt sein müssen um (insbesondere auch kontinuierlich) Veränderungen zu bewirken. Die in diesem Themenheft gesammelten Beiträge können den einzelnen Komponenten des Modells von Helmke zugeordnet werden, da sie sich den Fragen des Nutzens und der Nutzung von Evaluationen aus unterschiedlichen Perspektiven widmen.
Im ersten Beitrag dieses Themenhefts erweitert Schneewind das Modell von Helmke um Aspekte, die der Rückmeldung von Ergebnissen vorausgehen und insbesondere deren Gestaltung prägen. Sie leitet daraus ab, wie Rückmeldungen gestaltet sein sollten, um Lehrkräften optimale Nutzungsmöglichkeiten zu eröffnen. Ausgehend von schriftlichen und mündlichen Befragungen von Lehrkräften, die im Kontext des Projektes BeLesen in Berlin durchgeführt wurden, analysiert die Autorin, welche Einstellungen in Bezug auf die Rückmeldungen geäußert werden, wie diese im Einzelnen genutzt und welche Schwierigkeiten im Umgang berichtet werden. Diese aus der „Innenperspektive“ des Projektes gewonnenen Informationen verdichtet die Autorin vor dem Hintergrund von (in diesem Band nicht dargestellten) Analysen dreier Schweizer Rückmeldesysteme und gelangt so zu allgemeinen Ergebnissen, sowohl mit Blick auf Prinzipien der Rückmeldungsgestaltung als auch in Bezug auf die Deskription relevanter Einstellungen und Vorstellungen von Lehrkräften. Als zentral erweist sich dabei nach Schneewind, dass die Rezipienten von Anfang an Kenntnisse hinsichtlich der Ziele und damit auch bzgl. der Möglichkeiten und Grenzen eines Verfahrens besitzen. Dabei sollten Rückmeldungen so gestaltet werden, dass die verfolgten Ziele sich auch in der Auswahl und Aufbereitung der dargestellten Informationen wiederfinden. Andernfalls stellt Schneewind grundsätzlich in Frage, ob sich der Aufwand für die Rückmeldung von Ergebnissen überhaupt lohnt.
Der zweite Beitrag des Hefts von Breiter und Stauke widmet sich dem Medium, mit welchem die vielfältigen Informationen zur Qualitätssicherung an Schulen ausgewertet, zurückgemeldet und verwaltet werden können. In einer Analyse der aktuellen Situation in Deutschland aus informationstheoretischer Sicht verdeutlichen sie zunächst, dass internetgestützte Leistungsrückmeldungen an Schulen als ein spezieller Fall von Schulinformationssystemen aufgefasst werden können. Dabei wird ersichtlich, dass vor dem Hintergrund der beteiligten Interessengruppen (z. B. Lehrkräfte, Schulleitung, Schulaufsicht, Ministerium) Typen von Informationssystemen nach funktionalen Gesichtspunkten zu unterscheiden sind. Im Fokus stehen hier die elektronischen Rückmeldesysteme, die im Kontext regelmäßig durchgeführter und umfangreicher Evaluationsstudien unumgänglich sind, die aber im schulischen Kontext bislang noch wenig erforscht wurden. Abgeleitet aus den Erkenntnissen der Forschung zu Managementinformationssystemen weisen die Autoren auf die Notwendigkeit systematischer Anforderungsanalysen hin und liefern ein theoretisches Modell des Informationsbedarfs der verschiedenen beteiligten Gruppen. Darauf aufbauend entwickeln sie eine Übersicht zentraler Anforderungen an elektronische Rückmeldesysteme, die sich empirisch auf Befragungen von Bremer Lehrkräften und Schulaufsichtsbeamten stützt. Dabei wird deutlich, dass die bisher in Deutschland eingesetzten Systeme sowohl im Bereich der funktionalen als auch im Bereich der technischen Anforderungen noch erhebliches Entwicklungspotenzial besitzen. Damit umfassende Datensammlungen und Rückmeldungssysteme zur schulischen und unterrichtlichen Qualitätsentwicklung genutzt werden können, halten die beiden Autoren flankierende Maßnahmen (u. a. verbesserte technische Infrastruktur, dauerhafte Unterstützung in technischer und schulpraktischer Hinsicht) für erforderlich.
Die folgenden drei Beiträge konzentrieren sich verstärkt auf den Kern des Modells von Helmke, also auf den Prozess der Rezeption und Reflexion von Ergebnisrückmeldungen sowie daraus abgeleitete Aktionen. Dass die Beiträge den Kontexten zentraler Lernstandserhebungen entstammen, ist dabei kein Zufall. Da diese Verfahren zum einen für alle Beteiligten verpflichtend sind und zum anderen mit dem Ziel durchgeführt werden, zur Unterrichtsentwicklung anzuregen, stellen sie für diesen Aspekt ideale Forschungskontexte dar.
So berichten Nachtigall und Jantowski im dritten Beitrag dieses Heftes über Erfahrungen aus den Thüringer Kompetenztests, den landesspezifischen Lernstandserhebungen in den Klassenstufen 3 und 6. Dabei greifen sie auf standardisierte, internetgestützte Befragungen von Lehrkräften und Schulleitungen über mehrere Jahre zurück, die durchgeführt wurden, um Wirkungen und Potenziale der Tests und der Rückmeldungen auf die Beteiligten zu untersuchen, u. a. auch mit Blick auf die Rezeption und den wahrgenommenen Nutzen. Die Autoren stellen fest, dass die Kompetenztests bei den Lehrkräften insgesamt eine sehr hohe Akzeptanz besitzen, die bei den Schulleitungen sogar noch etwas höher ausfällt. Zugleich wird jedoch auch deutlich, dass nicht alle Rückmeldungselemente die gleiche Aufmerksamkeit erfahren oder als gleichermaßen nützlich wahrgenommen werden. Je geringer z. B. das Aggregationsniveau der Ergebnisrückmeldungen, desto höher ist die wahrgenommene Nützlichkeit. Weiter stellen die Autoren fest, dass die Kompetenztests bislang primär schulintern diskutiert werden und hier erheblichen Einfluss auf verschiedene Aspekte des Unterrichts ausüben. Besonderen Handlungsbedarf machen sie jedoch im Bereich der Elternarbeit aus. Insgesamt nehmen nach Einschätzung der Autoren die Schulleiter eine zentrale Rolle ein, da sie nachweislich das innerschulische Evaluations- und Kooperationsklima beeinflussen. Damit Lernstandserhebungen nicht als normative Rechenschaftslegung wahrgenommen werden, betonen Nachtigall und Jantowski, dass die zurückgemeldeten Daten die Ebene der Schule nur in aggregierter Form verlassen dürfen.
Groß Ophoff, Hosenfeld und Koch untersuchen im vierten Beitrag dieses Hefts die Rezeption und Nutzung der Ergebnisrückmeldungen des Projektes VERA, einer Lernstandserhebung in der Grundschule. Dabei wählen sie einen differenziellen Ansatz und identifizieren auf der Grundlage einer internetgestützten Befragung zunächst verschiedene Typen von Lehrkräften, die sich hinsichtlich der Verständlichkeit, der Intensität der Auseinandersetzung und der wahrgenommenen Nützlichkeit bezüglich der erhaltenen Rückmeldungen unterscheiden. Im Weiteren belegen die Autoren, dass diese unterschiedlichen Verarbeitungsprozesse auch mit Unterschieden im folgenden Handlungsschritt kovariieren. Die identifizierten Typen unterscheiden sich gemäß Helmkes Modell nicht nur in der Phase der Rezeption und Reflexion, sondern auch in der Wahl der Aktionen, wobei sowohl Unterschiede in der Anzahl der ergriffenen Maßnahmen als auch Differenzen in den Schwerpunktsetzungen der Veränderungen deutlich werden. Dementsprechend könnte es lohnend sein, sowohl die im Rahmen des Projektes angebotenen Rückmeldungen als auch die Fortbildungsangebote typspezifisch zu differenzieren und so passgenauer auf die Bedürfnisse der Nutzer zuzuschneiden.
Im fünften Beitrag dieses Hefts berichten Kühle und Peek aus den nordrhein-westfälischen Lernstandserhebungen der 9. bzw. 8. Jahrgangsstufe. Grundlage ihrer Darstellung sind drei internetgestützte Befragungen von Lehrkräften, Schulleitern, schulinternen Koordinatoren und Fachkonferenzleitern. Es wird zunächst deutlich, dass die verschiedenen angesprochenen Gruppen (Schulleitung, Lehrerkonferenz, Schulkonferenz, Fachkonferenz, unterrichtende Lehrkräfte) die Rückmeldungen in unterschiedlichem Umfang und mit anderen Schwerpunkten rezipieren. Dabei werden die Rückmeldungen im Großen und Ganzen als verständlich und nützlich angesehen. Die wahrgenommene Nützlichkeit hängt zum einen deutlich von der Akzeptanz von Lernstandserhebungen ab, zum anderen ergeben sich interessanterweise keine Zusammenhänge mit dem erzielten Testergebnis der Klasse bzw. Schule. Im Weiteren benennen die Autoren verschiedene Strategien der innerschulischen Auseinandersetzungen mit den Ergebnissen, die mit unterschiedlichen Schwerpunktsetzungen korrespondieren. Sie kommen zu dem Schluss, dass die Lernstandserhebungen tendenziell an solchen Schulen positiver wahrgenommen werden, an denen die Ergebnisse fächerübergreifend gemeinsam diskutiert werden, wobei an diesen Schulen oft bereits eine gute Kooperationspraxis existiert. Abschließend nennen Kühle und Peek als künftige Herausforderung u. a., dass Ziele, Potenziale und Grenzen von Lernstandserhebungen transparent gemacht werden.
Im abschließenden Beitrag leistet Arnold einen kritischen Kommentar mit Blick auf den gesamten Prozess Von der Evaluation zur Innovation. Dabei analysiert er zunächst die institutionellen und politischen Bedingungen in der Bundesrepublik und reflektiert sie vor dem Hintergrund der internationalen Erfahrungen im Kontext von Leistungsmessungen, die im Auftrag der Bildungspolitik durchgeführt werden. Es wird deutlich, dass wissenschaftlicher Erkenntnisgewinn und bildungspolitisch verwertbare Evaluationen nicht immer in Übereinstimmung zu bringen sind. In einem zweiten Schritt untersucht Arnold das Verhältnis von diagnostischem und didaktischem Wert der Leistungsmessungen. Dabei wird deutlich, dass Lernstandserhebungen zwar unter Umständen interessante und relevante diagnostische Zusatzinformationen liefern können. Dies geht jedoch aufgrund der durch die Anlage bedingten Fokussierung auf wenige Ausschnitte des Fachs zum einen mit deutlichen Beschränkungen der Validität und damit des didaktischen Nutzens einher. Zum anderen werden hohe Anforderungen an die diagnostische Expertise der Rezipienten gestellt. Ist diese nicht vorhanden, besteht die Gefahr einer Überschätzung des diagnostischen Wertes solcher Verfahren.
Im Versuch, die hier vorgestellten Modelle zu synthetisieren sowie Kernaussagen der Beiträge dieses Bandes zusammenzufassen, lassen sich u. E. vier zentrale Schlussfolgerungen ziehen.
1. Zielklarheit ist eine elementare Voraussetzung.
Praktisch alle Autoren dieses Heftes weisen darauf hin, dass Rückmeldeverfahren nur unter Bedingung klarer Zielvorstellungen eine Chance haben, im intendierten Sinne genutzt zu werden („feed up“-Aspekt, vgl. Modell von Hattie & Timperley, 2007). Dieser hohe Grad an Einigkeit unter Wissenschaftlern korrespondiert jedoch nicht mit den Wahrnehmungen der Adressaten der Verfahren. Im Spannungsfeld von bildungspolitischen Auftraggebern und wissenschaftlichen Auftragnehmern führen knappe Ressourcen leicht zu einer „Anreicherung“ von Zielen, die nur partiell vereinbar sind, was zur bereits erwähnten Intransparenz auf Seiten der Lehrkräfte und Schulen führt. Dass dadurch ansonsten „funktionstüchtige“ Verfahren gefährdet werden, wird leider sehr leicht übersehen.
2. Klarheit bezüglich der Grenzen beugt unrealistischen Erwartungen vor.
Eine klare Kommunikation der Grenzen eines Verfahrens erhöht die Chance, dass Missverständnisse und missbräuchliche Nutzungen reduziert oder eliminiert werden können. Dies ist auch mit Blick auf die motivationalen Folgen von Ergebnisrückmeldungen bedeutsam – sowohl im Falle erfreulicher als auch unerfreulicher Resultate. Ein realistisches Verständnis des Bedeutungsgehaltes solcher Rückmeldungen in Relation zu Informationen aus anderen Quellen kann dazu beitragen, sowohl unangemessene Euphorie als auch inadäquate Resignation zu verhindern. Auch hier gilt: Je klarer die Ziele sind, desto deutlicher können Grenzen identifiziert und kommuniziert werden.
3. Die angelegten Möglichkeiten sind nicht selbsterklärend.
Ähnlich wie im Falle der Zielklarheit herrscht weitgehende Einigkeit, dass aus einer Rückmeldung nicht automatisch Veränderung erwächst. Neben der Bereitstellung allgemein guter Rahmenbedingungen geht es u. E. darum, die Kompetenzen der Lehrkräfte in verschiedenen Bereichen zu erweitern. Neben den oft erwähnten allgemeinen Fähigkeiten im Umgang mit empirischen Daten und dem vertieften Verständnis einer tragfähigen Diagnostik sind hier auch kommunikative Kompetenzen als Voraussetzung von Kooperationen und die möglichst vollständige Kenntnis der denkbaren (intendierten) Nutzungsvarianten gefordert. Daneben gilt es, die Verfahren so weiter zu entwickeln, dass sie nicht nur den „feed back“-Aspekt (vgl. Hattie & Timperley, 2007), sondern stärker als bisher auch den „feed forward“ Aspekt bedienen. Ein erster Schritt in diese Richtung könnte in einer Differenzierung des Feedbacks i. S. von individualisierten und auf die Interessen der Lehrkraft zugeschnittenen Rückmeldungen bestehen.
4. Weitere Erkenntnisse über das komplexe Zusammenwirken der unterschiedlichen Faktoren sind notwendig.
Die verschiedenen hier skizzierten Modelle verdeutlichen zwar einerseits, dass bereits eine Fülle relevanter Erkenntnisse existiert, zugleich wird jedoch deutlich, dass die Komplexität der Materie – nicht zuletzt aufgrund der Vielzahl beteiligter Akteure in Schule und Unterricht – weitere, systematische Forschung erforderlich macht. Dabei ergibt sich auch hier nicht selten ein Spannungsverhältnis zwischen Politik und Wissenschaft hinsichtlich des Stellenwertes begleitender Untersuchungen. Das Interesse des Auftraggebers an der komplexeren Erzeugung von Grundlagenwissen ist (naturgemäß) deutlich geringer als an der Erhebung eher deskriptiv orientierter Evaluationsdaten, die eine einfache Legitimation des gewählten Ansatzes erlauben. Eine weitere Schwierigkeit ergibt sich aus dem Spannungsfeld zwischen Wissenschaft und Schulpraxis. Denn insbesondere diejenigen Lehrkräfte, die im Sinne Deci und Ryans (1985) die Verfahren als kontrollierend oder gar amotivierend wahrnehmen, sind zum einen besonders relevant für die Forschung, zum anderen aber auch besonders schwer für entsprechende Untersuchungen zu gewinnen.
Mit Sicherheit gibt es eine Vielzahl weiterer relevanter Aspekte, die in den hier dargestellten Modellen und den Beiträgen dieses Themenhefts gar nicht oder nur am Rande behandelt werden. Auf einen dieser Aspekte, nämlich die Frage der Motivation (für Überblicke s. z. B. Schiefele & Köller, 2001; Rheinberg, 2004), möchten wir abschließend noch eingehen, da er unseres Erachtens zentral für den Nutzen und die Nutzung von externen Leistungsrückmeldungen im schulischen Kontext ist. Als besonders ergiebig erweist sich dabei u. E. die Selbstbestimmungstheorie von Deci und Ryan (1985), in der zunächst grundlegende menschliche Bedürfnisse nach der Erfahrung von Kompetenz und Selbstbestimmung (Autonomie) sowie nach sozialer Eingebundenheit postuliert werden. Das Ausmaß, in dem diese verschiedenen Bedürfnisse befriedigt werden, bestimmt dabei, welche Form der Motivation vorliegt. Die Autoren unterscheiden neben der intrinsischen Motivation und dem Zustand der Motivationslosigkeit verschiedene Formen der extrinsischen Motivation, von external regulierten oder kontrollierten Formen zu stärker internalisierten oder autonomen Formen. Diese Stufen können im Sinne eines Entwicklungs- oder Prozessmodells in Richtung intrinsischer Motivation bzw. Selbstbestimmung durchlaufen werden, wobei nicht jede Stufe durchlaufen werden muss (ausführlicher z. B. Ryan & Deci, 2000). Damit lassen sich aus dem Modell Empfehlungen ableiten, wie sich intrinsische Anteile der Motivation erhöhen lassen. Externe Einflüsse, wie z. B. Rückmeldungen aus Lernstandserhebungen, Belohnung, Strafe, wirken nach Deci & Ryan (2000) über ihre funktionelle Bedeutung, wobei informationale, kontrollierende und amotivierende Bedeutungen unterschieden werden (Ryan & Sapp, 2005). Ein Ereignis besitzt informationale Bedeutung, wenn es eine Rückmeldung enthält, die zur Steigerung der Kompetenz genutzt werden kann, ohne das Gefühl der Selbstbestimmung zu beeinträchtigen. Solche Situationen führen demnach zu Kompetenzerleben und in der Folge zu eher internalisierten Formen der Motivation. Kontrollierende Bedeutung wird Situationen zugeschrieben, in denen man Druck wahrnimmt, bestimmte Ergebnisse oder Verhaltensweisen zu zeigen, d. h. das Bedürfnis nach Autonomie wird nicht befriedigt und es entstehen eher external regulierte Formen der Motivation. Situationen werden schließlich als amotivierend empfunden, wenn sie fehlende Kompetenz indizieren, so dass die Gefahr der Motivationslosigkeit besteht, d. h. es werden gar keine Anstrengungen mehr unternommen. Hier liegt der Bezug zum Thema dieses Bandes auf der Hand: Damit die zur Verfügung gestellten Rückmeldungen im Kontext von externen Evaluationen von den beteiligten Lehrkräften als nützlich erlebt und wie intendiert zur Qualitätsentwicklung genutzt werden, sollten diese idealerweise als informational wahrgenommen werden. Intrinsische Motivation wiederum ist nach Van-Dijk und Kluger (2004) u. a. verbunden mit aktiven Bearbeitungsstrategien und der Beschäftigung mit Auslassungsfehlern (z. B. Welche Unterrichtsmethode wurde noch nicht versucht?). Wird das Feedback als kontrollierend wahrgenommen, resultieren eher Vermeidungsstrategien und eine Konzentration auf Handlungsfehler (z. B. Welcher Inhalt wurde falsch vermittelt?). Ryan und Sapp (2005) analysieren aus motivationaler Perspektive die Wirkungen testbasierter Reformen und belegen, dass der Einsatz von Anreizen und/oder Strafen, die in Abhängigkeit der Testergebnisse vergeben werden, eine Reihe von nicht intendierten Nebenwirkungen hat. Sie argumentieren, dass nicht der Testeinsatz per se problematisch ist, sondern die Verwendung der Ergebnisse über die diagnostischen Zwecke hinaus. Damit wird deutlich, dass bei der Entscheidung darüber, wie die Ergebnisse aus z. B. Lernstandserhebungen verwendet werden sollen (Qualitätsentwicklung vs. Rechenschaftslegung), auch oder gerade die motivationalen Wirkungen bedacht werden müssen.
Wir hoffen in diesem Sinne, dass dieses Themenheft zu einer noch deutlicheren Lernorientierung von Bildungsforschung und Bildungspolitik beitragen kann, um den Nutzen und die Nutzung von Feedback aus Schulleistungsstudien im Sinne des Entwicklungsmodells von Hall und Hord (2001) konstruktiv weiter entwickeln zu können.
Literatur
Bonsen, M. & von der Gathen, J. (2004). Schulentwicklung und Testdaten. Die innerschulische Verarbeitung von Leistungsrückmeldungen. In H. G. Holtappels, K. Klemm & H. Pfeiffer (Hrsg.), Jahrbuch der Schulentwicklung, Band 13 (S. 225-252). Weinheim: Juventa.
Deci, E. L. & Ryan, R. M. (1985). Intrinsic motivation and self-determination in human behavior. New York: Plenum Publishing Co.
Deci, E. L. & Ryan, R. M. (2000). The “what” and “why” of goal pursuits: Human needs and the self-determination of behavior. Psychological Inquiry, 11, 227-268.
Ditton, H. (2002). Evaluation und Qualitätssicherung. In R. Tippelt (Hrsg.), Handbuch Bildungsforschung (1. Auflage, S. 775-790). Opladen: Leske + Budrich.
Ditton, H. & Arnoldt, B. (2004). Schülerbefragungen zum Fachunterricht – Feedback an Lehrkräfte. Empirische Pädagogik, 18, 115-139.
Hall, G. E. & Hord, S. M. (2001). Implementing change. Patterns, principles, and potholes (2nd ed.). Boston: Allyn and Bacon.
Hattie, J. & Timperley, H. S. (2007). The power of feedback. Review of Educational Research, 77, 81-112.
Helmke, A. & Hosenfeld, I. (2005). Ergebnisorientierte Unterrichtsevaluation. In Interkantonale Arbeitsgemeinschaft Externe Evaluation von Schulen (Hrsg.), Schlüsselfragen zur externen Schulevaluation (S. 127-151). Bern: h.e.p.-Verlag.
Hosenfeld, I. (2005). Rezeption – Reflexion – Aktion. Wie lassen sich Lernstandserhebungen und Vergleichsarbeiten pädagogisch nutzen? In G. Becker, A. Bremerich-Vos, M. Demmer, K. Maag Merki, B. Priebe, K. Schwippert, L. Stäudel & K. J. Tillmann (Hrsg.), Standards. Unterrichten zwischen Kompetenzen, zentralen Prüfungen und Vergleichsarbeiten. Friedrich Jahresheft XXIII 2005, 112-114. Seelze: Erhard Friedrich GmbH.
Kluger, A. N. & DeNisi, A. (1996). Effects of feedback intervention on performance: A historical review, a meta-analysis, and a preliminary feedback intervention theory. Psychological Bulletin, 119, 254-284.
Kluger, A. N. & DeNisi, A. (1998). Feedback Interventions: Towards the understanding of a double-edged sword. Current directions in psychological science, 7, 67-72.
Kohler, B. & Schrader, F.-W. (2004). Ergebnisrückmeldung und Rezeption: Von der externen Evaluation zur Entwicklung von Schule und Unterricht. In B. Kohler & F.-W. Schrader (Hrsg.), Empirische Pädagogik, 18, 3-17. Landau: Verlag Empirische Pädagogik.
Rheinberg, F. (2004). Motivation (5. Auflage). Stuttgart: Kohlhammer.
Rolff, H.-G. (2002). Rückmeldung und Nutzen der Ergebnisse von großflächigen Leistungsuntersuchungen. In H.-G. Rolff, H. G. Holtappels, K. Klemm, H. Pfeiffer & R. Schulz-Zander (Hrsg.), Jahrbuch der Schulentwicklung. Daten, Beispiele und Perspektiven, Band 12 (S. 75-98). Weinheim: Juventa.
Rossi, P. H., Lipsey, M. W. & Freeman, H. E. (1999). Evaluation. A systematic approach (7th ed.). Thousand Oaks: Sage.
Ryan, R. M. & Deci, E. L. (2000). Self-determination theory and the facilitation of intrinsic motivation, social development, and well-being. American Psychologist, 55, 68-78.
Ryan, R. M. & Sapp, A. (2005). Zum Einfluss testbasierter Reformen: High Stakes Testing (Considering the Impact of Test-Based Reforms). Motivation und Leistung aus der Sicht der Selbstbestimmungstheorie. Unterrichtswissenschaft, 2, 143-159.
Schiefele, U. & Köller, O. (2001). Extrinsische und intrinsische Motivation. In D. H. Rost (Hrsg.), Handwörterbuch Pädagogische Psychologie (S. 304-310). Weinheim: Beltz.
Timperley, H. S., Phillips, G. & Wiseman, J. (2003). Changing and sustaining teachers’ expectations through professional development in literacy (The sustainability of professional development in literacy, part 1). New Zealand: Ministry of Education.
Van-Dijk, D. & Kluger, A. N. (2004). Feedback sign effect on motivation: Is it moderated by regulatory focus? Applied Psychology, 53, 113-135.
Visscher, A. J. (2002). A framework for studying school performance feedback systems. In A. J. Visscher & R. Coe (Eds.), School improvement through performance feedback (pp. 41-72). Lisse: Swets & Zeitlinger.
Visscher, A. J. & Coe, R. (Eds.). (2002). School improvement through performance feedback (Contexts of learning. Classrooms, schools and society). Lisse: Swets & Zeitlinger.
Weiss, C. H. (1998). Improving the use of evaluations: Whose job is it anyway? In A. J. Reynolds & H. J. Walberg (Eds.), Advances in educational productivity. Evaluation research for educational productivity, 7 (pp. 263-276). London: JAI Press.
Anschrift der Autoren:
Jun.-Prof. Dr. Ingmar Hosenfeld,
Empirische Bildungsforschung, Unterrichtsforschung, Leitung Projekt VERA,
Universität Koblenz-Landau, Campus Landau, E-Mail: hosenfeld@uni-landau.de,
http://www.uni-landau.de/hosenfeld/
Dipl.-Psych. Jana Groß Ophoff, Lehr-/Lernpsychologie, Empirische Bildungsforschung, wissenschaftliche Mitarbeiterin im Projekt VERA, Universität Koblenz-Landau, Campus Landau, E-Mail: ophoff@uni-landau.de,
http://www.uni-landau.de/grossophoff/
![]()
Stand: 31.1.2008