
Home: www.vep-landau.de
Empirische Pädagogik
Zeitschrift zu Theorie und Praxis erziehungswissenschaftlicher Forschung
2008, 22(2), 241-245
Rost, D. H., Sparfeldt, J. R. & Schilling, S. R. (2007). DISK-GITTER mit SKSLF-8. Differentielles Schulisches Selbstkonzept-Gitter mit Skala zur Erfassung des Selbstkonzepts schulischer Leistungen und Fähigkeiten. Göttingen: Hogrefe. Testmappe 59 €.
Sagte jüngst Timo über die Biologie-Kursarbeit: „Ich habe bei der Arbeit ein gutes Gefühl gehabt und denke, dass ich 5 der 6 Aufgaben lösen konnte, das wird 12 Punkte geben.“ Dieses Beispiel will uns nicht nur sagen, dass Timo eine Vorstellung von seinen Fähigkeiten hat, sondern das Fähigkeitsselbstkonzept auch positiv mit schulischen Leistungen korreliert und eine Prognose auf das zu erwartende Leistungsniveau zulässt. Weiterhin kommt ein realistisches Zutrauen in die eigene Leistungsfähigkeit zum Ausdruck und eine recht genaue Selbsteinschätzung. Und um genau dieses Wissen über die eigenen Fähigkeiten geht es in den Fragebogen zum allgemeinen schulischen Selbstkonzept (SKSLF-8) und den fachspezifischen Fähigkeitsselbstkonzepten in Mathematik, Deutsch, Englisch, Physik, Geschichte und Biologie (DISK-Gitter).
Das Instrument kann außer in der Forschung bei Schülern und Schülerinnen der 7. bis 10. Klassenstufe in Realschule und Gymnasium – im Einzel- und Gruppentest – angewendet werden. Es erfasst sehr ökonomisch mit nur 8 Itemstämmen die verschiedenen Fähigkeitsselbstkonzepte (im folgenden FSK), wobei die Items entweder auf „Schule“ oder eines der sechs Fächer zu beziehen sind. Die Beantwortung erfolgt jeweils auf einer 6-stufigen Antwortskala mit den Polen „trifft gar nicht zu“ und „trifft genau zu“. Die 7 Fragebogen können unabhängig voneinander oder zusammen eingesetzt werden. Kommen alle zum Einsatz, liegt die Gesamtarbeitszeit bei 10 Minuten.
Soviel Ökonomie macht jedoch misstrauisch, da sich Skalen auch durch ähnliche Itemformulierungen, z. B. wenn nur ein Wort wie das Schulfach auszutauschen ist – konstituieren können. Aber dieses Misstrauen ist unbegründet. Zwar sind die Skalen sehr homogen (Cronbachs α > .90 bei fachspezifischen FSK bzw. α > .80 beim allgemeinen FSK), aber so wurde es auch aufgrund der Literatur erwartet. Außerdem korrelieren die 6 fachspezifischen FSK untereinander wenig bis mittelhoch, mit dem allgemeinen FSK erwartungsgemäß mittelhoch. Schließlich bestätigten diverse Faktorenanalysen die 6-faktorielle Struktur der fachspezifischen FSK. Und wer jetzt noch mit Störeffekten der Darbietungsform und der Antwortskala rechnet, wird eines Besseren belehrt. Die Einflüsse der Gittertechnik – Blockbildung nach Schulfächern – wurden überprüft, indem einer Versuchsgruppe die Items zufällig und hintereinander wie bei Fragebogen üblich vorgegeben wurden, während die Vergleichsgruppe die fachspezifischen FSK in Gitterform erhielten. Es konnten keine Effekte der Itemvorgabe ermittelt werden. Ferner war vermutet worden, dass die verbale Verankerung der Antwortskala mit „1 = trifft nicht zu“ bis „6 = trifft genau zu“ zu Interferenzen mit der vertrauten Notenskala führt, bei der die positive Ausprägung einer 1 entspricht. Aber es konnten keine Interferenzen aufgrund der Antwortskala nachgewiesen werden.
Bevor auf die Gütekriterien des Instruments eingegangen wird, soll ein Blick auf die Aufarbeitung des Forschungsstands geworfen werden. Rost, Sparfeldt und Schilling beginnen mit dem Begriff des Selbstkonzepts, dann wird das hierarchische Strukturmodell von Shavelson, Huber und Stanton vorgestellt und schließlich der Forschungsstand. Der Leser wird informiert über dimensionale und soziale Vergleiche, deskriptive und evaluative Selbstkonzeptfacetten, mit welchen Variablen Zusammenhänge in welcher Höhe erwartet werden können, wie die Ursache-Wirkungs-Relation zwischen schulischen Leistungen und FSK erklärt wird, u. Ä. Das ist umfassend und aktuell, denn die Literaturdurchsicht endet mit einem 2006 erschienenen Themenheft zu FSK (Dickhäuser, 2006).
Ebenso gründlich werden die vorhandenen Selbstkonzeptfragebogen gesichtet, zwei englische Verfahren, die unveröffentlichten deutschen Forschungsinstrumente, die standardisierten deutschen Instrumente und der SKSLF, der die Basis für die vorliegende SKSLF-8-Skala abgab. Anhand des Instrumentariums lässt sich noch einmal ein Stück Selbstkonzeptforschung nachvollziehen, vom eindimensionalen zum fachspezifischen FSK, von Items mit einer sozialen bis hin zu mehreren Bezugsnormen. Dabei erfährt der Leser auch die Legitimation für die Entwicklung des vorliegenden Instruments, denn obwohl es seit 1972 eine Vielzahl von Forschungsinstrumenten zum FSK gibt, fehlt es bis heute an standardisierten Verfahren. Aktuell noch erhältlich und auf die Altersgruppen des DISK-Gitters bezogen gibt es streng genommen nur ein standardisiertes Verfahren und das ohne Schulfachbezug (zur Kritik des SESSKO, vgl. Ingenkamp & Lissmann, 2005, S. 303).
Im Manual eines Instruments zeigt sich, ob die Testautoren ihr Handwerk verstehen, weil es die einzelnen Entwicklungsschritte von der Itemsammlung bis zur Eichung dokumentiert und für andere transparent macht. Aus diesem Grund räumt man dem Manual in der Qualitätskontrolle berufsdiagnostischer Verfahren auch eine dominierende Stellung ein (DIN 33430; DIN, 2002), die sich in der entsprechenden Checkliste von DIN SCREEN wiederum mit der stattlichen Anzahl von 144 Statements niederschlägt. Für das Testkuratorium der Föderation Deutscher Psychologenvereinigungen gilt das Testmanual deshalb offiziell als Standard zur Berichterstattung über Tests aller Anwendungsbereiche (Kerstin, 2006, S. 7).
Die Testautoren beschreiben detailliert die Maßnahmen zur Sicherung der Durchführungs-, Auswertungs- und Interpretationsobjektivität. Abgesehen von den bekannten Maßnahmen zur Sicherung der Durchführungsobjektivität fällt positiv auf, dass auf den qualifizierten Testleiter abgehoben wird (Psychologe, Sonderpädagoge, Beratungslehrer), und dass bei mehr als einem fehlenden Wert je Skala auf die Auswertung der Skala ganz verzichtet werden soll, während bei einem fehlenden Messwert der individuelle Skalenmittelwert eingesetzt werden kann. Die Interpretationsobjektivität ist durch die Gruppennormen und die Klassifikation in die 5 Interpretationsbereiche nach dem Kriterium „+/- 2 Standardabweichungen“ gesichert. Außerdem werden Auswertung und Interpretation auf einen authentischen Einzelfall aus der psychologischen Praxis angewandt, wobei über die Diagnose hinaus mehrere Fördermaßnahmen vorgeschlagen werden.
Die Reliabilität wurde als interne Konsistenz (Cronbachs α) und Test-Retestreliabilität (Zeitraum 4-6 Wochen) ermittelt. Wie eingangs schon angeführt sind die Konsistenzkoeffizienten der Erwartung entsprechend hoch bis sehr hoch und die Retestkoeffizienten bewegen sich je nach Selbstkonzept zwischen .70 und .90, insgesamt also „gute bis sehr gute“ Reliabilitäten. Diese Bewertung der Retestreliabilität bezieht sich summarisch auf das allgemeine und die fachspezifischen FSK, auf 2 Zeitintervalle, 3 Klassenstufen und 2 Schularten. Im Detail werden einige Koeffizienten nicht berechnet oder nicht angegeben, z. B. für die Gruppe der Gymnasiasten im Retest nach 6 Wochen. Den Autoren ist jedoch zugute zu halten, dass die Zusammenhänge zwischen den Testungen sehr gleichförmig ausgeprägt sind, was einen Transfer auf alle Gruppen nahelegt. Aber es ist unverständlich, warum kein Zeitpunkt für die Datenerhebung der Reliabilitätsbestimmung angegeben wird, da der Nachweis der Geltung der Reliabilitätskennwerte nach DIN 33430 nicht älter als 8 Jahre sein soll.
Die Kontrolle der Validität nimmt im Manual mit 33 Seiten den größten Raum ein. In explorativen Faktorenanalysen mit den Daten verschiedener Studien ließ sich die faktorielle Validität des allgemeinen Selbstkonzepts und der fachspezifischen FSK bestätigen. So beträgt die durch 6 fachspezifischen FSK des DISK-Gitters aufgeklärte Totalvarianz 69.9%, die des eindimensionalen SKSLF-8 44.7%. In mehreren konfirmatorischen Faktorenanalysen konnte die strukturelle Übereinstimmung der Selbstkonzepte von Jungen und Mädchen nachgewiesen werden. Im Rahmen der Konstruktvalidität wurden Korrelationen mit zahlreichen konstruktnahen und -fernen Persönlichkeitsvariablen berechnet, z. B. mit anderen Selbstkonzeptmaßen, der Leistungsmotivation, Leistungsangst, dem Mogeln und Interesse. Die Kriteriumsvalidität umfasste Analysen des Beziehungsgeflechts zwischen dem neuen Instrument und den Fachzensuren, der Intelligenz, Hochbegabung und Wortflüssigkeit. Auch dabei zeigten sich die erwartungsgemäßen Muster positiver (z. B. entsprechende Fachzensuren) und negativer Korrelationen (z. B. Furcht vor Misserfolg) sowie Nullkorrelationen (Wortflüssigkeit). Die Ausführungen der Autoren sind überzeugend und so genau wie möglich, z. B. sind bei den Faktorenanalysen die Analysemethoden und Statistikprogramme angegeben.
Bei aller Genauigkeit in der Darstellung fällt auf, dass bei keiner Datenerhebung – 3 Vorstudien und 14 Studien – der Untersuchungszeitpunkt angegeben ist. Von den Vorstudien einmal abgesehen, ist das Erhebungsjahr der anderen Studien wegen der DIN 33430 bedeutsam. Was im Hinblick auf die Reliabilität schon gesagt wurde, gilt deshalb auch für die Validitätsstudien und die Normierung. Es kann nicht nachgeprüft werden, ob die Koeffizienten und Normen älter als 8 Jahre sind.
Die Normierung erfolgte gemäß diagnostischer Zielsetzung an Realschulen und Gymnasien aus 4 Bundesländern. Eine Repräsentativität für Deutschland besteht somit nicht, aber sie war auch nicht angestrebt worden. Stattdessen war auf gleiche Anteile bezüglich städtischem/ländlichem Raum, Jungen und Mädchen, Realschülern und Gymnasiasten sowie Klassenstufen geachtet worden und auf eine hohe Ausschöpfungsquote.
Die Autoren berichten Stichprobenumfänge von N = 6 567 für den SKSLF-8 und N = 5 589 für das DISK-Gitter. Zu beachten ist, dass diese Stichprobenumfänge nicht unabhängig voneinander sind, weil, wie die Autoren selbst mitteilen, N = 4 134 Personen beide Verfahren bearbeitet hatten. Wegen Schulart- und Geschlechtsunterschieden werden die T-Wert- und PR-Normen als Gesamt- und Gruppennormen angegeben. Anhang B enthält diese 12 Normentabellen, die teils mehrseitig sind, teils Hoch- oder Querformat haben. Zusammen mit den 10 Tabellen für die Vertrauensintervalle und den 15 Tabellen für die kritischen Profildifferenzen gestaltet sich der Anhang als recht unübersichtlich. Ein zusätzliches Inhaltsverzeichnis könnte sich als nützlich erweisen.
DISK-Gitter und SKSLF-8 schließen eine Lücke bei den schulischen Selbstkonzeptfragebogen. Sie sind aufgrund der sorgfältigen Entwicklung für in der Forschung und in der Beratungspraxis tätige Personen eine Bereicherung und bei einem Preis von 59 Euro fast ein Schnäppchen.
Literatur
Dickhäuser, O. (Hrsg.). (2006). Fähigkeitsselbstkonzepte. Zeitschrift für Pädagogische Psychologie (Themenheft), 20, 1/2.
DIN, Deutsches Institut für Normung e. V. (2002). Anforderungen an Verfahren und deren Einsatz bei berufsbezogenen Eignungsbeurteilungen. Berlin: Beuth.
Ingenkamp, K. & Lissmann, U. (2005). Lehrbuch der Pädagogischen Diagnostik 5. Auflage. Weinheim: Beltz UTB.
Kerstin, M. (2006). „DIN SCREEN“. Leitfaden zur Kontrolle und Optimierung der Qualität von Verfahren und deren Einsatz bei beruflichen Eignungsbeurteilungen. Lengerich: Pabst.
Anschrift des Autors:
PD Dr. Urban Lissmann, zepf, E-Mail: lissmann@zepf.uni-landau.de