Home: www.vep-landau.de

Empirische Pädagogik

Zeitschrift zu Theorie und Praxis erziehungswissenschaftlicher Forschung

Zusammenfassung des Artikels: 2008, 22(1), 17-48

 

Originalarbeiten

Heiner Rindermann

International vergleichende Schulleistungs- und Intelligenzstudien: Worauf sind die Unterschiede zwischen Staaten zurückführbar?
Versuch einer Erklärung unter ausschließlicher Berücksichtigung von Bildungsmerkmalen

Zusammenfassung: In den internationalen Schulleistungsstudien wurden Ergebnisse zu Fähigkeiten der Schüler und Bedingungen der Schulsysteme vorgestellt. Leider fehlten bislang eine Aufklärung der Unterschiede zwischen den Staaten und die Suche nach Zusammenhängen der Fähigkeitsunter­schiede mit Merkmalen der Bildungssysteme. In Analysen mittels Korrelationen, Partialkorrelationen und Pfadmodellen zeigen sich positive Zusammenhänge nationaler Fähigkeitsniveaus zu Bildungsni­veau der Erwachsenen, Kindergartenbesuch, Disziplin, hohem Bildungsumfang der Schüler, Unter­richtsumfang, Besuch von Ergänzungsschulen, früher Gliederung und Einsatz von Zentralprüfungen und Tests zum Zwecke schulischer Entscheidungen. Eher negative Zusammenhänge treten auf bei ho­hen Klassenwiederholungsquoten, später Einschulung und großen Klassen bzw. einer ungünstigen Lehrer-Schüler-Relation. Hohe Migrantenanteile als solche wirken sich nicht negativ aus; nur dann, wenn Migranten im Schnitt bildungsferner als die einheimische Bevölkerung sind, zeigen sich nega­tive Folgen. Empfehlungen für die Forschung und für die Gestaltung von Bildungssystemen werden erörtert.

Schlagwörter: Intelligenz – Leistung – Leistungstests

International student assessment and intelligence studies: Why countries differ?
An attempt for explanation by exclusive use of educational variables

Summary: Previous international studies of student performance have provided results regarding abilities of students and various aspects of educational systems. However, no research explains differ­ences between nations or examines the relationships between differences in ability and attributes of educational systems. Analyses indicate positive relationships (in correlations, partial correlations and path analyses) between student ability measures and educational levels of adults, preschool education, discipline, large quantity of institutionalized education for pupils, large quantity of lessons (hours taught per year), attendance at additional schools (private cram schools, juku), early streaming and the use of central exams and tests for school decisions. Rather negative relationships are found between student ability measures and high repetition rates, late school enrolment and large class sizes or high pupil-teacher ratios. A high ratio of migrants has not been found to be negatively associated with stu­dent abilities except when migrant families show a lower educational level than the native population. Suggestions for research and for educational systems are discussed.

Key words: academic achievement intelligence – performance tests

Anhang

Rindermann, H. (2008). International vergleichende Schulleistungs- und Intelligenzstudien: Warum schneiden die einen gut ab, die anderen schlecht? Versuch einer Erklärung unter ausschließlicher Berücksichtigung von Bildungsmerkmalen. Empirische Pädagogik, 22, 17-48. Methodenteil und die dazu gehörige Literatur (alle Literatur, die im Methodenteil erwähnt wurde).

1          Kausalanalysen auf makrosozialer Ebene

Optimal zur Prüfung von Kausalhypothesen sind Experimente. Hier existieren auf makrosozialer Ebene neben Problemen der Durchführbarkeit spezifische der Daten. Diese sollen kurz skizziert werden:

1)       Einschätzvariablen wie Lesefreude u. Ä. können im internationalen Vergleich durch Referenzrahmeneffekte belastet sein, internationale Differenzen wären somit nicht valide (vgl. OECD, 2004a, S. 126, 133, 165). Die Bedeutung von Variablen kann sich ändern. In einzelnen Variablen scheinen Fehler vorzuliegen, so sollen etwa nach PISA 2003 (DPK, 2004, S. 229) in der Türkei weltweit am zweithäufigsten Kinder von Alleinerziehenden erzogen werden. Die PISA-Angaben für Gliederungsalter sind für einzelne Staaten falsch, so wird in der Schweiz nicht mit 15 Jahren (OECD, 2003, S. 221), sondern je nach Kanton ab 10 gegliedert (Büeler & Merki, 2003; OECD, 1999, S. 30), in Hongkong nicht mit 19 Jahren, sondern mit 12 (Marsh, Kong & Hau, 2000, S. 339f.). Bestimmte Variablen müssen so ausgeschlossen oder korrigiert, alle Informationen müssen zuvor zumindest auf Plausibilität hin geprüft werden. Durch Zusammenfassung von Informationen aus verschiedenen Studien lassen sich Messfehler reduzieren.

2)       Es kann nur mit Variablen gearbeitet werden, die vorhanden sind. Vermutliche Stärken etwa des finnischen Schulsystems wie die intensive Betreuung von schwachen Schülern, pflichtmäßige ärztliche Untersuchungen für alle in der Vorschulzeit und an Schulen fehlen.

3)       Die Definitionen von Klassenstufe sind variabel: Wenn Schüler mit vier oder fünf eingeschult werden (Niederlande, Großbritannien), ist die Schule unter sechs Jahren dann Vorschule? Oder wenn erst mit sieben eingeschult wird (Finnland), ist dann das letzte Kindergartenjahr schon Schule? Aus diesen Gründen waren in IGLU oder TIMSS als „Viertklässler“ geführte Schüler auch je nach Land in ihrem dortigen Schulsystem „Fünftklässler“ (vgl. Gaeth, 2005). Grundsätzlich ist es deshalb eindeutiger, Schüler verschiedener Länder nach ihrem Lebensalter zu untersuchen (wie in PISA 15- bis 16-Jährige). Dieses ist zudem überzeugender, da Fähigkeit in einem bestimmten Lebensalter ein Qualitätsmerkmal darstellt. Etwas in jüngerem Alter zu können, ist besser.

4)       Konventionell angenommene Mehrebenenprobleme im Sinne von sich umdrehenden Kausaleffekten sind selten: Die empirische Evidenz für sich drehende unverfälschte Beziehungen oder Kausalwirkungen (als deren Interpretation), also für solche, die nicht durch Drittvariablen überdeckt werden oder erst durch Einschätzprobleme wie Referenzrahmeneffekte entstehen, ist rar. Die Probleme werden von den Mehrebenen-Autoren nicht anhand empirischer Beispiele präsentiert, sondern nur als Gedankenspiele (z. B. Ditton, 1998; Snijders & Bosker, 2003). Persönlichkeitseinschätzungen sind auf internationaler Ebene aufgrund von Referenzrahmeneffekten vermutlich nicht brauchbar.

Trotz der grundsätzlichen Problematik fehlender Experimente und fehlerbehafteter Daten sollte auf Kausalanalysen nicht verzichtet werden. Die Klärung von Kausalwegen stellt ein zentrales Erkenntnisziel der Wissenschaft dar. Kausalwissen ist für Intervention und Förderung und aus ethischen Gründen notwendig. Kommt Wissenschaft einem zentralen epistemischen Anliegen nicht nach, wird diese Lücke von anderen schlechter aufgefüllt.

Notwendig sind theoretische Erklärungen von statistischen Beziehungen und gewählten Pfadrichtungen einschließlich der Beachtung zeitbezogener Sequenzstrukturen. Die Ergebnisse sollten nach Möglichkeit kompatibel zum Forschungsstand auf anderen Ebenen sein, zu dem anderer Autoren, anderer Operationalisierungen und anderer Untersuchungsanlagen unter anderen Rahmenbedingungen. Falls eine Diskrepanz besteht, entsteht ein erhöhter Begründungsbedarf. Statistische Zusammenhänge sollten bei Beachtung weiterer Variablen robust sein. Hierfür können zunächst die üblichen Methoden der bivariaten Korrelation, vor allem aber auch der Partialkorrelation unter Ausschluss bedeutsamer Drittvariablen, der multiplen Regression und der Pfadanalyse, also der Berechnung direkter und indirekter Effekte unter Einschluss relevanter weiterer Variablen, herangezogen werden.

Wie sicher ist das aus diesen Analysen gewonnene Wissen? Das Hauptproblem dürfte in der Möglichkeit bestehen, bestimmte Variablen übersehen zu haben. Aus der prinzipiell endlosen Menge möglicher Variablen sollten aber nur solche näher untersucht werden, die eine theoretische Erklärungskraft besitzen. Messprobleme lassen sich durch prüfende Vorselektionen von Variablen und durch Aggregation der Informationen verschiedener Studien reduzieren. Modelle mit unidirektionalen Pfaden sind unterkomplex, wichtig sind hier theoretische Begründungen und ein Vergleich mit dem Forschungsstand. Nicht untersucht wurde die Rückwirkung gesellschaftlicher Niveaus kognitiver Fähigkeiten auf die Merkmale von Bildungssystemen; die Variable „gesellschaftliches Bildungsniveau“, die berücksichtigt wird, stellt aber eine hinter Niveaus kognitiver Fähigkeiten stehende zentrale Determinante dar. Eine Möglichkeit, die Gefahr durch Übersehen wichtiger Variablen zu reduzieren, besteht darin, maximal viel potentiellen „Einfluss“ durch Herauspartialisierung gesellschaftlicher Hintergrundvariablen zu entfernen (wie Wohlstand, Bildungsniveau der Erwachsenen oder Modernität/Demokratie). Allerdings ist nicht auszuschließen, dass diese sowohl abhängig sind von Bildung und Fähigkeiten (und man so wichtige Varianz reduziert) und dass diese anschließend wieder über Merkmale des Bildungssystems wirken (etwa Demokratie als bildungsförderliche Regierungsform; Lipset, 1962). Nach einer Liberalisierung der Anforderungen an Kausalitätsbelege sind vorgenommene kausale Interpretationen weniger zwingend. Auf makrosozialer Ebene sind sie vor allem auch weniger ausschließlich: Weitere Variablen als intermedierende (z. B. Prüfungsmethoden), Hintergrunddeterminanten (etwa Kultur) oder Zusatzfaktoren (etwa medizinische Betreuung) sind denkbar und sie sind auch nach einer empirischen Stützung bestimmter Faktoren nicht ausgeschlossen. Eine vollständige Erklärung eines Sachverhalts ist für einen Nachweis kausaler Beziehungen aber nicht notwendig (Steyer, 1992, S. 10). Hinzu kommen historische Prozesse wie Veränderungen der Kinderzahlen. Gesellschaften und Bildungssysteme wandeln sich und was unter früheren Bedingungen förderlich war (z. B. unter Bedingungen von Unterernährung zusätzlicher Fleischkonsum; Whaley et al., 2003), muss zukünftig unter anderen nicht mehr förderlich sein.

2          Methoden

2.1        Daten für kognitive Fähigkeiten (Intelligenz- und Schulleistungstests)

Als Maße kognitiver Fähigkeiten werden vier Variablen herangezogen:

1)       Gesamtwert aller Fähigkeitsmaße der Studien zwischen 1991 und 2003 (IEA-Reading 9- und 14-Jährige 1990-1991, TIMSS 4. und 8. Klasse 1995, TIMSS 8. Klasse 1999, TIMSS 4. und 8. Klasse 2003, PISA 15-Jährige 2000 und 2003, IGLU Viertklässler 2001) einschließlich der Intelligenztestsammlung von Lynn und Vanhanen (2006), mit Korrekturen (Korrelation der Testergebnisse verschiedener Einzelstudien im Schnitt zu r = .83 bis r = .88, N = 194 Staaten).

2)       Ein Schulleistungsgesamtwert ohne Korrekturen (mittlere Interkorrelation r = .83, N = 78 Staaten).

3)       Ein Gesamtwert derjenigen Studien, die Denkfähigkeiten und Wissen in bestimmten Klassenstufen erhoben haben (IGLU und TIMSS, ohne Korrekturen; mittlere Interkorrelation r = .90, N = 65 Staaten).

4)       Ein Gesamtwert der beiden PISA-Studien, die Denkfähigkeiten und Wissen in bestimmten Altersstufen, bei 15- bis 16-jährigen Schülern, erfassten (ohne Korrekturen; r = .95, N = 48 Staaten). Detaillierte Beschreibungen der Zusammenfassungen finden sich in Rindermann (2007b, c).

Die vier verwendeten Gesamtmaße der kognitiven Fähigkeiten korrelieren hoch untereinander: KF-Gesamt mit Schulleistungsgesamt r = .97 (.968, N = 78), mit Klassenstufengesamtwert r = .97 (.968, N = 65), mit PISA-Gesamtwert (2000 und 2003) r = .97 (.966, N = 48); Schulleistungsgesamt mit Klassenstufengesamt r = .99 (.992, N = 65), mit PISA-Gesamt r = .97 (.974, N = 48); Klassenstufengesamt mit PISA-Gesamt r = .87 (.867, N = 39); die letzte Korrelation ist die niedrigste, da hier nicht wie in den anderen Korrelationen Studien im jeweils anderen Wert inkludiert sind.

Die kognitiven Anforderungen der verschiedenen Skalen und Tests sind ähnlich, sowohl in Intelligenztests als auch in den Schulleistungstests werden Denkfähigkeiten und Wissen erhoben (vgl. Rindermann, 2006, 2007b). Für den Gesamtwert aller Studien spricht die Existenz von Daten aus einer Vielzahl von Ländern. Für einen reinen Schulleistungsgesamtwert spricht seine größere Nähe (zeitlich, Schüler) zu schulischen Bedingungsfaktoren. Ein unkorrigierter Klassenstufengesamtwert kann Effekte des Schulsystems ohne spätere Einschulung und Klassenwiederholung darstellen. Für den Altersgesamtwert der beiden unkorrigierten PISA-Studien spricht die Alterserhebung (Fähigkeit als Kompetenz in einem bestimmten Alter), die bessere Vergleichbarkeit und dass er das Resultat einer langen Schulzeit darstellt. Die um Überalterung und geringe Teilnahmequoten korrigierten Werte sind insbesondere für gesellschaftliche Analysen geeignet, da sie besser die mittlere kognitive Fähigkeit einer ganzen Generation wiedergeben; für Analysen mit schulischen Bedingungsvariablen sind unkorrigierte Werte mit den gegebenen Schülerergebnissen besser. Korrekturen für den Gesamtwert kognitive Fähigkeiten wurden vorgenommen, weil anzunehmen ist, dass ohne diese die Werte als Repräsentativmaße für Jugendliche oder Gesellschaften überschätzt werden. Über Studien gemittelte Gesamtwerte ermöglichen das Arbeiten mit einer breiteren Länderstichprobe und sie reduzieren zudem studienspezifische Fehler (Wuttke, 2006).

2.2        Daten für Bildungsmerkmale (Bildungssysteme, Schüler, Unterricht, Eltern, Erwachsene)

Lagen Informationen für ein Merkmal mehrfach vor, wurden zunächst innerhalb der Studie und Jahr Mittelungen über meist zuvor standardisierte Variablen vorgenommen, dann innerhalb des Studientyps (IEA-Lesen vs. TIMSS vs. PISA vs. IGLU), dann am Ende über die Studientypen. Verschiedene Variablen eines Konstrukts wurden zusammengefasst. Oft wurden Merkmale in verschiedenen Studien und Erhebungsjahren leicht unterschiedlich erhoben oder unterschiedlich in den Berichten veröffentlicht (z. B. Unterrichtsumfang). Angaben zu Cronbach-a beziehen sich auf die gemeinsamen Stichproben, das N auf die Gesamtzahl.

Besuch von Kindergarten und Vorschule, Quellen: Daten der IGLU-Studie 2001 (Mullis et al., 2003, S. 130, Kategorien ein bis mehr als zwei Jahre zusammengefasst, Prozentangaben für Kinder von den Eltern), N = 29. Daten PISA 2003 (OECD, 2004a, S. 278), Besuch von Vorschule oder Kindergarten länger als ein Jahr, Prozentangaben für Kinder, N = 40. Zusammenfassung zu einem Gesamtwert von IGLU-2001 und PISA-2003, r = .88, a = .93, N = 52.

Alter der Kinder bei der Einschulung, Quellen: PISA-Studie 2000 (OECD, 2003, N = 42), TIMSS 1995 (Baumert & Lehmann, 1997, S. 182, N = 37), TIMSS 2003 (Mullis et al., 2004, S. 20-24, N = 45), IAEP-II 1991 (Lapointe et al., 1992) und IGLU-Studie 2001 (Mullis et al., 2003, N  = 29). Die Angaben von PISA, TIMSS (Mittel) und IAEP korrelieren zu r = .81. Leider sind die Angaben in den Studien nicht auf den Monat genau (z. B. wäre genau „6;3“, also sechs Jahre und drei Monate), sondern ganzzahlig und scheinen nicht oder nicht nur das empirische Durchschnittsalter der Kinder anzugeben, sondern nur die offizielle Vorgabe der Behörden („typical entry age“, OECD, 2003, S. 270), die Praxis kann davon abweichen. Mögliche Wirkungen des Einschulungsalters werden so unterschätzt. Aus der IGLU-Studie 2001 liegt das empirische, tatsächliche, durchschnittliche Schul­eintrittsalter vor (Korrelation des Gesamtwerts PISA-TIMSS-IAEP mit IGLU r = .82). Der Gesamtwert liegt für 72 Staaten vor (a = .90). Korrelationen untereinander sind für ein identisches Merkmal zu gering (Effekte dürften deshalb unterschätzt werden). Die empirische Angabe für Deutschland (6,28 Jahre) aus IGLU ist niedriger als die von Klein (1999, 6,7 Jahre), letzteres scheint plausibler zu sein (keine Korrektur der Daten). Das Einschulungsalter wurde umgepolt, ein hoher numerischer Wert entspricht jungem Alter.

Bildungsausgaben, Quellen: Ausgaben in US-Dollar je Schüler, Daten der IEA-Reading-Literacy-Studie 1990/91 (Elley, 1992), N = 30. Ausgaben je Schüler, „kaufkraftparitätsbereinigt“ (Purchasing Power Parity, PPP), für Grund- und Sekundarschulen und 1985 und 1990 zusammengefasst (a = .95), Daten Lee und Barro (1997), N = 108. Beides zusammengefasst: Bildungsausgaben absolut, Elley und Lee-Barro, a = .99, N = 110. Diese Ausgaben sind stark an das Bruttosozialprodukt gekoppelt.

Offizieller Umfang an Schulunterricht, Quellen: Unterrichtstage im Jahr TIMSS 1995 (Klassen 4+8, Martin et al., 1999, S. 67), N = 32. Unterrichtsstunden im Jahr TIMSS 1999 (Klasse 8, Mullis et al., 2000, S. 293), N = 34. Schulstunden pro Jahr in der Sekundarschule gemäß PISA 2000 (DPK, 2001), N = 31. Schulstunden pro Jahr in der Grundschule gemäß IGLU 2001 (Mullis et al., 2003), N = 32. Schulstunden pro Woche in der Grundschule gemäß IEA-Reading-Literacy-Studie 1990/91 (Scheerens & Bosker, 1997), 26 Staaten. Schulstunden pro Jahr aus PISA 2003 als Produkt der Unterrichtsstunden pro Woche und Anzahl der Unterrichtswochen im Jahr (OECD, 2004a, S. 275 & 481), N = 38. Der Gesamtwert des geplanten Unterrichtsumfangs aus den vier Studientypen liegt für 64 Staaten vor, die Korrelationen der Maße untereinander betragen r = .17-.95, das Gesamtmaß ist reliabel genug (a = .87). Unterrichtsausfall wird hier nicht thematisiert.

Das Gesamtmaß des Bildungsumfanges von Schülern wurde aus Rate des Kindergartenbesuchs (aus IGLU 2001 und PISA 2003), Schülerjugend (Schüler besuchen in jungem Alter hohe Klassenstufen aus den Studien PISA, TIMSS, IGLU, IEA-Lesen; Schüler bestimmten Alters haben so mehr und höhere Bildung erhalten), Unterrichtsumfang (Schulstunden pro Jahr aus IEA-Lesen-TIMSS95-TIMSS99-PISA00-IGLU01-PISA03) und Ergänzungsunterricht (zusätzlicher Besuch von Privatschulen oder Nachhilfe aus PISA 2000) gebildet, r = -.02 bis .34, a = .59 (Effekte dürften deshalb unterschätzt werden), N = 80.

Alter der Schüler, ab dem ein gegliedertes Schulsystem existiert, als Zusammenfügung verschiedener Quellen: Zunächst Daten PISA-Studie 2000 (OECD, 2003, S. 221), PISA-Studie 2003 (DPK, 2004, S. 293, bzw. OECD, 2004a, S. 298). Kombination, Ergänzung und Korrektur der OECD-PISA-Angaben: Es liegen in den Angaben der OECD offensichtliche Fehler vor, Hongkong ist nicht 19 Jahre, sondern 12 (Köller & Baumert, 2002, S. 769); Schweiz nicht 15, sondern je nach Kanton zwischen 10 und 12 (Büeler & Merki, 2003; OECD, 1999, S. 30; bei Woschek, 2005, 12,58). Singapur wurde mit 10 Jahren hinzugefügt, Liechtenstein mit 11 Jahren (Quellen: Netzseiten der Schulbehörden); ebenso Holland mit 12 Jahren (empirisch um 12 bis 13 Jahre, Regel 12 Jahre). USA und Japan fehlen in der OECD/PISA-Tabelle von 2000. USA ist kaum kategorisierbar, offiziell bis 16 ein Gesamtschulsystem (PISA 2003), aber mit schulinternen Zügen je nach Schule und Staat verschieden und mit nach Wohnort und Finanzkraft der Eltern (indirekt korreliert mit Bildung und Intelligenz dieser) differenzierten Schulen und gar schon Kindergärten! Japan hat offiziell und weitgehend real bis einschließlich der 9. Klasse (14-Jährige) ein Gesamtschulsystem. Privatschulen mit Aufnahmeprüfung und demgemäß Fähigkeitsselektion besuchen nur wenige Schüler unter 15 Jahren. Allerdings besuchen etwa zwei Drittel Zusatzprivatschulen (Juku) am Nachmittag, Abend und Wochenende, und dieser Besuch ist als solcher wie die Einteilung dort fähigkeits- und elterneinkommensabhängig (Kosten pro Monat ca. 600 bis 900 Euro; Haasch, 2000, S. 199). Schümer (1998, S. 215, 219) spricht von formeller Differenzierung der Zusatzprivatschulen nach Fähigkeit („nach Leistung auswählen“, „selektive Ergänzungsschule“). Es findet somit außerhalb des staatlichen Schulsystems schon in der Mittelstufe (Klassen 7-9, Alter 12-14) eine Differenzierung statt. Innerhalb des Bildungssystems findet sich eine informelle Gliederung mit Aufnahmeprüfungen bis in das Grundschul- und Kindergartenalter (Haasch, 2000, S. 144, 168, 183). Es gibt Aufnahmeprüfungen für Kindergärten und diesen vorgeschaltete Vorbereitungsschulen! Da das japanische Schulsystem ohne diesen differenzierten Zusatzunterricht undenkbar ist, sollte er in der Einteilung beachtet werden. Wir haben deshalb das Gliederungsalter für Japan statt mit 15 mit 14 Jahren vermerkt (für Abbildungen 4 und 5 aber vorsichtiger 15 Jahre). Zudem ist auffällig, dass der Unterschied zwischen Schulen in Japan bei 15-Jährigen weltweit am größten ist („Effekt des wirtschaftlichen, sozialen und kulturellen Status auf Schulebene“; OECD, 2004a, S. 216, 433) und dass es nach der OECD viele Privatschulen gibt (OECD, 2004a, S. 286). Für Korea müsste man eigentlich Gleiches machen, es unterblieb aber (unklar wie zu gewichten; Berücksichtigung würde aber den Effekt früher Gliederung stärken). Son (2005, S. 55, 58): „Zugleich ist zu beachten, dass in Korea das Lernen nicht nur mit den Lehrern in den Schulen, sondern auch im außerschulischen Förderunterricht und mit hoch bezahlten Privatlehrern gestaltet wird.“ Weitere Ergänzung um Daten aus Schaub und Zenke (2004). Hier bestanden einige Abweichungen zu den OECD-Informationen, bei wenigen Staaten gab es Entscheidungsprobleme: Argentinien und Brasilien wurden von 18 (OECD) auf 15 (Schaub & Zenke) herabgesetzt (Ende der Pflichtschulzeit, danach verschiedene Züge, dies reduziert positiven Gliederungseffekt), Bulgarien von 14 auf 13 (Beginn von Berufsgymnasien, Handwerksschulen), Großbritannien von 16 auf 11 (England: Grammar Schools nehmen 11-Jährige nach leistungsbezogener Aufnahmeprüfung auf, zusätzlich gilt für Gesamtschulen, Schaub & Zenke, S. 177: „In manchen Gebieten erfolgen bei der Aufnahme Auswahl- oder Eignungstests. Einige Schulen bilden feste Schülergruppen nach fächerübergreifendem Leistungs- und Begabungsniveau.“, ähnlich Nordirland; dies erhöht positiven Gliederungseffekt), Irland von 15 auf 12 (wie England Grammar Schools), Israel von 12 auf 15 (erst dann verschiedene Züge), Japan statt 15 Jahre (OECD und Schaub & Zenke) 14 Jahre (Schaub & Zenke, S. 298, für Japan: „Intensive informelle Differenzierung der Einrichtungen in einer Rangfolge, die durch deren Prestige, das erhobene Schulgeld, Leistungsfähigkeit und ihre Verbindungen zu jeweils weiterführenden Institutionen bestimmt wird.“), Südkorea von 14 (OECD) auf 15 (Schaub & Zenke; vermutlich falsch; s. Son, 2005), Kanada von 13 auf 16, Luxemburg von 13 auf 12, Malta wurde auf 11 festgelegt (Beginn Lyzeum), in einigen Staaten heißt die allgemeine Sekundarschule Gymnasium, das Gymnasium wie in Deutschland Lyzeum (z. B. Rumänien Gliederung erst ab Lyzeumsbesuchmöglichkeit), Russland von 15 auf 14, hier gab es Entscheidungsprobleme, da es schon Gymnasien ab dem 6. Lebensjahr gibt (s. a. Döbert, Hörner, Kopp & Mitter, 2004), Gymnasien werden aber von weniger als 4% der Schüler besucht, Schweiz 12 Jahre als vorsichtiger Schnitt zwischen 10, 12 und selten 15 (nicht 15 wie bei OECD; Schaub & Zenke, S. 499: „Die Primarschule dauert in zwanzig Kantonen sechs Jahre, in vier Kantonen fünf Jahre und in zwei Kantonen vier Jahre.“), Slowakei, Tschechien und Ungarn von 11 auf 10 (Beginn Gymnasium), Südafrika hat ein Einheitsschulsystem (16 Jahre), dürfte aber nach Wohnort und Ethnie/Rasse weiterhin stark unterschiedlich sein, USA ist der bekannte Problemfall, wurde auf 13 Jahre festgesetzt (ab 12 oder 14 differenziert, High Schools ab 14 mit Aufnahmeprüfung, hohe, elternabhängige Zwischenschulvarianz; Martin et al., 2000a, S. 76ff., Martin et al., 2004, S. 193). N = 58 Staaten. Hier nicht dargestellt: Gliederung wurde in ihren verschiedenen Erfassungsquellen mit Fähigkeit korreliert, fast ausschließlich resultieren positive Korrelationen zwischen früher Gliederung und Fähigkeiten, die in Partialkorrelationen größer werden. Gliederungsalter wurde zum Schluss so gepolt, dass junge Gliederung numerisch hohe Werte ergibt.

Rate von Schülern ausländischer Herkunft, Migranten, Quellen: Schüler, die selbst im Ausland geboren wurden und zugewandert sind bzw. deren Eltern – mindestens ein Elternteil – aus dem Ausland stammen. Daten PISA-Studie 2000 („Migrationshintergrund“, DPK, 2001), N = 31. Das Gleiche für die IGLU-Studie 2001 (Mullis et al., 2003), N = 34. Schüler, die im Schulland geboren wurden und mindestens einen Elternteil haben, der im gleichen Land wie sie geboren wurde, Daten PISA-Studie 2003 (OECD, 2004b, S. 153 oben links umgepolt), N = 40. Die drei Werte korrelieren zu r = .90-.94, der Gesamtwert liegt für 56 Staaten vor (a = .95). Die Variable ist nicht unproblematisch: Österreicher in Deutschland, Engländer in Kanada und Australien oder Chinesen in Hongkong werden genauso kategorisiert wie Kurden in Dänemark, Schwarzafrikaner in Frankreich oder Araber in Holland. Vermutlich wird in einigen Ländern, auch in Deutschland, der Anteil der Migranten unterschätzt, da diese Information auf Selbstauskunft beruht und diese vermutlich in Richtung Einwandererland verzerrt ist (Hagemeister, 2006, S. 271f.). Herausrechnungen des Migrantenanteils unterschätzen damit die in Westeuropa negativen Effekte hoher Migrantenanteile auf die Ergebnisse der Messungen kognitiver Fähigkeiten. Hinzu kommt, dass durch hohe Anteile bildungsferner und der Unterrichtssprache nicht adäquat mächtiger Migranten auch der Unterricht für verbleibende Einheimische weniger förderlich ist.

Klassengröße und quantitatives Lehrer-Schüler-Verhältnis, Quellen: Anzahl der Schüler je Klasse bei 9-Jährigen, IEA-Reading-Literacy-Studie 1990/91 (Scheerens & Bosker, 1997), 26 Staaten. Klassengröße und quantitatives Lehrer-Schüler-Verhältnis TIMSS 1995 (Klassen 4 und 8, Martin et al., 1999, S. 45f.), N = 36. Klassengröße TIMSS 1999 (Klasse 8, Mullis et al., 2000, S. 203), N = 37. Klassengröße TIMSS 2003 (Klassen 4 und 8, Mullis et al., 2004, S. 266f.), N = 44. Anzahl der Schüler je Klasse bei 15-Jährigen, PISA-Studie 2000 (OECD, 2003, S. 363), 40 Staaten. Klassengröße der IGLU-Studie 2001 (Mullis et al., 2003), N = 34. Quantitatives Lehrer-Schüler-Verhältnis von Lee und Barro (1997), 1985 und 1990 sowie Grund- und Sekundarschule zusammengefasst (a = .89), N = 143. Die Maße korrelieren zu r = .59 - .90. Der Gesamtwert liegt für 154 Staaten vor (a = .95). Ein günstiges quantitatives Lehrer-Schüler-Verhältnis muss nicht unbedingt in kleinen Klassen erkennbar sein, Lehrer wären auch in der Verwaltung einer Schule oder als zusätzliche Förder- und Beratungslehrer innerhalb oder außerhalb des Unterrichts einsetzbar.

Klassenwiederholung, Quellen: Klassenwiederholungsquote nach Lee und Barro (1997), Grund- und Sekundarschule und 1985 und 1990 zusammengefasst, a = .93, N = 130. Sitzenbleiben bei 15-Jährigen über die ganze Schulbiographie in Primar- und Sekundarstufe zusammengefasst, PISA 2003 (OECD, 2004a, S. 298), N = 30. Zusammenfassung von Lee-Barro und PISA-2003 zu einem Gesamtwert, r = .54, a = .70, N = 132.

Disziplinvariablen, Schulbesuchsdisziplin, Quellen: Kein Absentismus, kein vorzeitiges Abgehen von der Schule, TIMSS 1995 (Klassen 4 und 8, bei TIMSS immer Direktorenurteil, Martin et al., 1999, S. B14 und B15), N = 37. Wenig Probleme mit Schulbesuch („seriousness of attendance problems at school“, „arriving late at school, absenteeism, skipping class“) und im Unterricht („classroom disturbance“), TIMSS 1999 (Klasse 8, Mullis et al., 2000, S. 240, 244), N = 37. Kein Absentismus, TIMSS 2003 (Klassen 4 und 8, Mullis et al., 2004, S. 324f.), N = 44. Kein Absentismus: Nicht Schule schwänzen aus Schülersicht, Daten der PISA-Studie 2000 für 41 Staaten (OECD, 2003, S. 290). Nicht zu spät zum Unterricht kommen: Daten der PISA-Studie 2000, Schülersicht (OECD, 2003, S. 291), für 41 Staaten. Bei einem bestimmten Prozentsatz von Schülern ist aus Sicht von Direktoren Absentismus ein Problem, PISA 2003 (OECD, 2004a, S. 457), N = 38. Bei einem bestimmten Prozentsatz von Schülern ist aus Sicht von Direktoren Schwänzen ein Problem, PISA 2003 (OECD, 2004a, S. 457), N = 37. Unterrichtsinterne Probleme aus PISA 2003 (OECD, 2004a, S. 457 u. 459), Zusammensetzung aus „Unterrichtsstörungen ist ein Problem“, „Wartezeit bis Schüler sich beruhigen“ und „Schüler brauchen lange bis sie zu arbeiten beginnen“ (r = .47, .36 und .68, a = .75), N = 40. Prozentsatz der Schüler mit Absentismusproblem (moderatem oder gravierendem), IGLU 2001 (Mullis et al., 2003), N = 34. Gesamtwert nach Umpolung zu proschulischem Verhalten und TIMSS- und PISA-internen Gesamtbildungen (a = .71 und .72), Korrelation untereinander zwischen r = .17 und .52, a = .53. Der Gesamtwert gibt Schulbesuchsdisziplin und unterrichtsintern proschulisches Verhalten wieder. Er liegt für 72 Staaten vor.

Direkte Instruktion („work together as a class with teacher teaching the whole class“, „lecture-style presentation by teacher“ oder „listening to lecture-style presentations“) aus den TIMS-Studien 1995 (N = 37, Mullis et al., 1997, S. 164f., Beaton et al., 1996a, S. 154f., Beaton et al., 1996b, S. 146f.), 1999 (N = 38, Mullis et al., 2000, S. 205, Martin et al., 2000b, S. 219) und 2003 (N = 44, Mullis et al., 2004, S. 286-288, Martin et al., 2004, S. 310), jeweils Lehrerurteil zum Anteil der Unterrichtszeit im Mathematik- und im Naturwissenschaftsunterricht der vierten und achten Klassen, a = .67, N = 61.

Leistungs- und Leistungstestorientiertes Schulsystem, Quellen: TIMSS 8. Klasse 1995 Schüler­einteilung gemäß Leistungstest („factors that are moderately or very important in deciding courses of study in mathematics, standardized tests“, Martin et al., 1999, S. 64, N = 20). Aus anderen TIMS-Studien liegen keine Informationen vor. PISA 2003: Der Schulzugang ist leistungsabhängig, Direktorenantwort (im englischen Original: „Percentage of students in schools where the principals consider the following statements as a ,prerequisite‘ or a ,high priority‘ for admittance at school: students‘ academic records (including placement tests)“; OECD, 2004a, S. 467 u. 362), N = 37. Leistungstestergebnisse werden von der Schule zur Gruppierung von Schülern im Fach Mathematik genutzt, PISA 2003, Direktorenantwort (im englischen Original: „use of assessment results and student performance in mathematics: group students for instructional purposes“; OECD, 2004a, S. 472), N = 38. Tests werden von der Schule zur Information der Eltern über den Leistungsstand ihrer Kinder in Mathematik genutzt, PISA 2003 Direktorenantwort (im englischen Original: „use of assessment results and student performance in mathematics: inform parents about their child’s progress“; OECD, 2004a, S. 471), N = 38. Die Werte korrelieren innerhalb PISA zu r = -.03, .04 und .23 (a = .21). Die statistische Homogenität ist in PISA gering, inhaltlich beziehen sich alle Merkmale auf ein an (meist objektiv) gemessenen Leistungen orientiertes Schulsystem. Der Gesamtwert liegt für 44 Staaten vor (TIMSS mit PISA-Gesamt r = .62, a = .77).

Zentralprüfungen: Einsatz von Zentralprüfungen im Schulsystem nach Bishop (1997) und Wößmann (2002, S. 15). Die Werte werden für Mathematik und Naturwissenschaft angegeben (r = .84, Gesamtwert a = .91). Es wurden zwei Änderungen vorgenommen: 1. China ergänzt (Zentralprüfungen nach Heine et al., 2006) und 2. die USA wurden statt auf 07 auf 70 auf einer Skala von 0-100 festgesetzt, da der Zugang an Hochschulen in den USA über Leistungstests geregelt wird (vor allem den SAT), ein Großteil der Schüler später studiert und das Grundstudium eine Art schulischer Oberstufe in Inhalten und Alter der Studierenden darstellt (Gesamtwert N = 53). Dies erhöht Korrelationen mit Fähigkeiten um .01 bis .02, Partialkorrelationen werden niedriger um .02. Die Variable gibt somit den Einsatz von Zentralprüfungen im Schulsystem oder im Anschluss an dieses bei Vergabe von Studienplätzen wieder. Die Korrelation mit „Leistungs- und Leistungstestorientiertem Schulsystem“ beträgt r = .28 (N = 37).

Auswahl der Schüler durch Schulen nach Leistung (Teilvariable von „Leistungs- und Leistungstestorientiertes Schulsystem“, nicht in Tabelle 1): Der Schulzugang ist leistungsabhängig, PISA 2003, Direktorenantwort (im englischen Original: „Percentage of students in schools where the principals consider the following statements as a ,prerequisite‘ or a ,high priority‘ for admittance at school: students‘ academic records (including placement tests)“; OECD, 2004a, S. 467 u. 362), N = 37. Korrelationen dieser mit Fähigkeiten und Bruttoinlands­produkt in der Reihenfolge von Tabelle 1: r = .12, .15, .21, .07 und -.08; Partialkorrelationen: rP = .40, .45, .50, .39 und .17.

Ergänzungsunterricht (Zusatzvariable, nicht in Tabelle 1): Prozentsatz an Schülern, die an Ergänzungsunterricht teilnehmen (z. B. Juku in Japan, Hakwon in Südkorea), Schülerangaben, Daten PISA-Studie 2000 (DPK, 2001, S. 417) für 30 Staaten. Korrelationen dieser mit Fähigkeiten und Bruttoinlandsprodukt in der Reihenfolge von Tabelle 1: r = .24, .31, .59, .16 und -.26; Partialkorrelationen: rP = .72, .87, 1, .78 und .05.

Varianz zwischen Schulen (Zusatzvariable, nicht in Tabelle 1): Daten PISA 2000 (Skalen Lesen, Mathematik und Naturwissenschaften, a = .97; OECD, 2003, S. 357-359) und Daten 2003 (nur Mathematik; OECD, 2004a, S. 433) nach Standardisierung kombiniert (a = .87, Gesamtwert N = 48). Varianz innerhalb von Schulen: Daten PISA 2000 (Skalen Lesen, Mathematik und Naturwissenschaften, a = .90; OECD, 2003, S. 357-359) und Daten 2003 (nur Mathematik; OECD, 2004a, S. 433) nach Standardisierung kombiniert (a = .93, Gesamtwert N = 48). Die Angaben zu Varianzen 2003 sind im deutschen und internationalen Bericht leicht voneinander abweichend (DPK, 2004, S. 293, rzw = .98 und rin = .93; bei DPK nur OECD-Länder, aber hier Frankreich dabei, das im OECD-Bericht fehlte), ebenso diejenigen für 2000 in den OECD-Berichten 2004a (S. 434) und 2003 (S. 357-359). Es wurden für 2003 die Angaben der OECD (2004a) genommen, nur für Frankreich, das fehlte, stammen die Daten (mit leichter Korrektur für innerhalb, Anpassung an die OECD-Variante) aus DPK (2004). Die Varianzen zwischen und innerhalb korrelieren untereinander nicht zu r = -1, sondern von r = -.11 (OECD, 2003) bis r = -1 (DPK, 2004), die beiden Gesamtwerte zu r = -.46 (N = 48); sie addieren sich (bis auf DPK, 2004) nicht zu 1 auf. Dies ist unplausibel. Dateneingabe wurde wie immer auf Fehler geprüft, die Varianzen doppelt (fehlerfreie Dateneingabe). Korrelationen dieser mit Fähigkeiten und Bruttoinlandsprodukt in der Reihenfolge von Tabelle 1: Die Varianz innerhalb von Schulen eher positiv (r = .18, .14, .04, .19 und .33), die zwischen negativ (r = -.17, -.19, -.04, -.24 und -.22).

2.3        Gesellschaftliche Hintergrundmerkmale

Durchschnittliches Bruttoinlandsprodukt je Person 1998 von Lynn und Vanhanen (2002) in der Variante „kaufkraftparitätsbereinigt“ (Purchasing Power Parity, PPP; Quelle UNO). Das Jahr 1998 liegt ungefähr in der Mitte von 1992-2003 (Erhebungen der Schulleistungsstudien).

Für das gesellschaftliche Bildungsniveau wurden drei Werte zusammengeführt: 1. Nichtanalphabetenanteil unter Erwachsenen 1991 nach Vanhanen (1997) in 172 Staaten, 2. Prozentsatz der Menschen im Alter von 12-19 Jahren von 1960 bis 1985, die über Sekundarschulausbildung verfügen, N = 117 (Mankiw, Romer & Weil, 1992), 3. Anzahl der Schuljahre insgesamt 1990, 1995 und 2000 von Personen im Alter über 25 Jahren nach Barro und Lee (2000; N = 107); Gesamtbildungsindex der Bevölkerung (Mittel nach Standardisierung) aus diesen dreien a = .94, N = 173.

Gesellschaftlich-kulturell-politische Moderne: Einschätzung dieser durch vier deutsche Akademiker (Arzt, Psychologe, Psychologe-Philosoph, Historiker; alle promoviert; einer muslimisch, zwei katholisch, einer protestantisch; Alter 37 bis 60 Jahre; einer aus der Türkei; zusammen Kenntnis von 11 verschiedenen Fremdsprachen; Arbeitsaufenthalte im Ausland). Moderne beschreibt: „Der Staat ist ‚gesellschaftlich-politisch-kulturell modern‘ und die Menschen in diesem leben ‚gesellschaftlich-politisch-kulturell modern‘: Menschenrechte, Demokratie, gerechte und funktionierende Justiz, Gleichstellung von Mann und Frau, demokratische Überzeugungen, friedliches Miteinander, Pressefreiheit, Religionsfreiheit, Meinungsfreiheit, Gleichheit vor dem Gesetz, Bestimmung der Regierung durch echte Demokratie, gute Behandlung von Ausländern, Präferenz für moderne Kultur (moderne Kunst)“; Interraterreliabilität a = .93, N = 186. Korrelationen dieses Einschätzungsmaßes mit Demokratie: r = .78.

Demokratie 1950-2004 nach Vanhanen (2003, 2005) und Marshall und Jaggers (2000), a = .95, N = 183. Vanhanen verwendet quantitative Maße (1. Prozentsatz der Stimmen der kleineren Parteien als Maß politischen Wettbewerbs und 2. Wahlbeteiligung einschließlich an Volksabstimmungen als Maß politischer Partizipation), Marshall und Jaggers ziehen Einschätzungen heran (1. Institutionen und Verfahren, die den Ausdruck politischer Wünsche der Bürger, was alternative Politik und Führer betrifft, ermöglichen. 2. Gesetze und Regeln, die die Macht der Führer einschränken. 3. Garantie politischer Freiheiten für alle Bürger in ihrem täglichen Leben und bei politischer Partizipation.). Die beiden Maße korrelieren hoch: r = .90, a = .95, Gesamtwert für N = 183.

2.4        Methoden

Zunächst werden bivariate Korrelationen zwischen Merkmalen der Bildungs- und Schulsysteme und den verschiedenen Varianten der Maße kognitiver Fähigkeiten berechnet. In einem zweiten Schritt werden gesellschaftliche Hintergrundmerkmale (Bruttoinlandsprodukt, Bildungsniveau der Erwachsenen, Modernität oder Demokratie) durch Partialkorrelationen reduziert. Ergebnisse werden in der Interpretation mit Resultaten anderer Studien verglichen (anderer Autoren auf gesellschaftlicher Ebene, anderer Autoren auf innerstaatlicher, meist individueller Ebene).

Die mit Bildungsfaktoren vorgenommenen korrelativen Analysen berücksichtigten aber nur ein Merkmal. Es ist jedoch zum einen höchst unplausibel anzunehmen, dass die Bedingungen innerhalb der Bildungssysteme voneinander unabhängig sind, somit könnten hinter oder neben einem kausal interpretierten Effekt Einflüsse anderer Bildungsdeterminanten stehen. Zum anderen beeinflussen sich diese Merkmale selbstverständlich auch untereinander, so könnte etwa umfangreicher Kindergartenbesuch ein früheres Einschulungsalter (vgl. Tietze, 1987) und proschulisches Verhalten fördern (Barnett, 1985; Barnett, Young & Schweinhart, 1998). Solche Interdependenzen sind in Pfad­analysen untersuchbar. Pfadanalysen sind aber nicht problemfrei: (1) Zunächst liegen nicht für alle Staaten Informationen zu allen interessierenden Variablen vor. Viele Varianten des Umgangs mit diesem Defizit wären denkbar: Fallweiser Ausschluss ganzer Länder bei dem Fehlen einer Information in einer Variablen; Imputationen, also die Schätzung fehlender Variablen aus den Ausprägungen anderer Variablen eines Modells oder noch weiterer Variablen (Graham, Cumsille & Elek-Fisk, 2003); Full-Information-Maximum-Likelihood (FIML), d. h. Nutzung sämtlicher Informationen einer Datentabelle (Raykov, 2005). Alle Varianten (dazu noch paarweiser Ausschluss und Mittelwertersetzung) haben spezifische Vor- und Nachteile (s. a. Lüdtke, Robitzsch, Trautwein & Köller, 2007): Bei fallweisem Ausschluss verschwinden Länder bei Fehlen nur einer Variablen; bei Imputationen misst man Effekte von Variablen auf Variablen, deren Ausprägungen man zuvor erst gegenseitig auseinander geschätzt hat, die Zuverlässigkeit der Ergebnisse liegt an den nur wenig transparenten Imputationsvarianten; bei FIML-Berechnungen stecken hinter Variablenbeziehungen eines Modells völlig unterschiedliche Länder mit je nach Datensatz extrem unterschiedlichen Stichprobengrößen (hier von 30 bis 186 Staaten).

Es wurde hier ein Kompromiss gewählt. Zunächst wurde durch die Zusammenfügung verschiedener Informationsquellen die Datenbasis deutlich verbreitet (s. Variablenbildung). Analysen mit fallweisem Ausschluss stützen sich somit meist auch auf ausreichende Länderzahlen. Hinter allen Koeffizienten stehen die gleichen Länder und alle Werte sind gemessen (fast immer auch die IQ-Daten von Lynn & Vanhanen, weil Bildungsstudien primär in Staaten der Ersten Welt durchgeführt wurden und zu diesen Intelligenztestdaten vorliegen). Die Aggregierung von Informationen erhöht zudem die Zuverlässigkeit der Daten. Zum Vergleich wurden auch zusätzlich FIML-Berechnungen vorgenommen, die Ergebnisse variierten nur gering. Eine ähnliche Robustheit trotz unterschiedlicher Varianten des Umgangs mit fehlenden Daten berichten auch Graham et al. (2003) und Lüdtke et al. (2007). Wichtig war, dass die in den Modellen berichteten Korrelationen nicht zu stark von den bivariat berechneten abweichen. Falls hier größere Abweichungen auftreten sollten, wäre dies ein Hinweis auf unterschiedliche Effekte je nach Staatenstichprobe.

Drei weitere Probleme kommen hinzu: (2) Bei simultaner Berücksichtigung des Bruttoinlands­produkts gab es regelmäßig rechentechnische Probleme (LISREL 8.20: „PS 4,4 may not be identified.“; MPLUS 3.13: „convergence problems in the baseline model“). Die Programme liefen zwar, aber LISREL gab kein Pfaddiagramm aus und MPLUS verzichtete auf einige Angaben (CFI, TLI, einzelne Koeffizienten zum Bruttoinlandsprodukt). Die Werte der Pfadkoeffizienten und Korrelationen waren plausibel (letztere wichen kaum oder nicht von Korrelationen in SPSS ab, Bruttoinlandsprodukt auf kognitive Fähigkeiten zwischen b = .10 und .30), was bedeuten aber die rechentechnische Probleme inhaltlich? (3) Es sind sehr viele verschiedene Modelle darstellbar, etwa im Vergleich der vier unterschiedlichen Maße kognitiver Fähigkeiten, im Vergleich der verschiedenen Varianten des Umgangs mit fehlenden Werten oder in der Berücksichtigung unterschiedlicher Variablen und deren Kombination. Eine Beschränkung auf wenige, besonders interessierende und begründbare Fragestellungen ist notwendig. (4) Am schwierigsten dürfte das Problem der Kausalrichtungen innerhalb der Bildungsmerkmale sein. Klassische Sukzessionsvoraussetzungen stellen eine Hilfe dar, allerdings handelt es sich um Daten auf Schulsystemebene und zeitlich Späteres könnte Vorwirkungen erzielen (etwa eine später kommende Gliederung nach Fähigkeit erhöht die Bildungsanstrengung davor). Bidirektionale Einflüsse sind nicht ausgeschlossen, z. B. Bildungsumfang fördert Disziplin und umgekehrt oder Gliederung steigert den Einsatz von Leistungstests. Pfadrichtungen bedürfen der Begründung und sind nicht als ausschließliche zu verstehen. Unidirektionale Modelle sind nicht falsch, aber unterkomplex.

In den Abbildungen werden standardisierte Pfadkoeffizienten an Pfeilen und in Klammern Korrelationen dargestellt. Korrelationen stellen eine wichtige Information dar, erlauben die Beurteilung von Suppressoreffekten und die Bewertung der Reduktion von Zusammenhängen durch Berücksichtigung weiterer Variablen in einem Modell. Zudem können über sie faktorbezogene Varianzaufklärungen berechnet werden (R² = Srb). Am jeweiligen Kriterium kognitiver Fähigkeiten ist noch der nicht aufgeklärte Varianzanteil angegeben. Als Fit-Indizes wurden die gängigen SRMR (gut: SRMR £ .08) und CFI (CFI ³ .95) gewählt (Zweiindexstrategie; Hu & Bentler, 1999). Modellfits fehlen bei saturierten Modellen.

Literatur

Barnett, W. S. (1985). Benefit-cost analysis of the Perry preschool program and its policy implications. Educational Evaluation and Policy Analysis, 7, 333-342.

Barnett, W. S., Young, J. W. & Schweinhart, L. J. (1998). How preschool education influences long-term cognitive development and school success. A causal model. In W. S. Barnett & S. S. Boocock (Hrsg.), Early care and education for children in poverty (S. 167-184). New York: State University.

Barro, R. J. & Lee, J.-W. (2000). Barro-Lee data set. International data on educational attainment: Updates and implications. Boston: Harvard University (www2.cid.harvard.edu/ciddata/barrolee/ readme.htm, 18-11-04)

Baumert, J. & Lehmann, R. (1997). TIMSS – Mathematisch-naturwissenschaftlicher Unterricht im internationalen Vergleich. Opladen: Leske & Budrich.

Beaton, A., E., Mullis, I. V. S., Martin, M. O., Gonzalez, E. J., Kelly, D. L. & Smith, T. (1996a). Mathematics achievement in the middle school years: IEA’s Third International Mathematics and Science Study (TIMSS). Chestnut Hill: TIMSS International Study Center, Boston College.

Beaton, A., E., Martin, M. O., Mullis, I. V. S., Gonzalez, E. J., Smith, T. & Kelly, D. L. (1996b). Science achievement in the middle school years: IEA‘s Third International Mathematics and Science Study (TIMSS). Chestnut Hill: TIMSS International Study Center, Boston College.

Bishop, J. H. (1997). The effect of national standards and curriculum-based exams on achievement. American Economic Review, 87, 260-264.

Büeler, X. & Merki, K. M. (2003). Schulentwicklung in der Schweiz. In Ch. Burkard & G. Eikenbusch (Hrsg.), Schulentwicklung international (S. 48-59). Hamburg: Bergmann & Helbig.

Ditton, H. (1998). Mehrebenenanalyse. Weinheim & München: Juventa.

Döbert, H., Hörner, W., Kopp, B. v. & Mitter, W. (Hrsg.). (2004). Die Schulsysteme Europas. Baltmannsweiler: Schneider.

DPK (Deutsches PISA-Konsortium; Baumert, J., Klieme, E., Neubrand, M., Prenzel, M., Schiefele, U., Schneider, W., Stanat, P., Tillmann K.-J. & Weiß, M.) (Hrsg.). (2001). PISA 2000. Basiskompetenzen von Schülerinnen und Schülern im internationalen Vergleich. Opladen: Leske & Budrich.

DPK (Deutsches PISA-Konsortium; Prenzel, M., Baumert, J., Blum, W., Lehmann, R., Leutner, D., Neubrand, M., Pekrun, R., Rolff, H.-G., Rost, J. & Schiefele, U.) (Hrsg.). (2004). PISA 2003. Ergebnisse des zweiten internationalen Vergleichs. Münster: Waxmann.

Elley, W. B. (1992). How in the world do students read? The Hague: The International Association for the Evaluation of Educational Achievement (IEA).

Gaeth, F. (2005). PISA. Eine statistisch-methodische Evaluation. Berlin: FU Berlin. Verfügbar unter: www.pisa2000.de/pisa/download/download.php [11.11.05].

Graham, J. W., Cumsille, P. & Elek-Fisk, E. (2003). Methods for handling missing data. In J. Schinka & W. Velicer (Eds.), Handbook of psychology, research methods in psychology (Vol. 2, S. 87-114). New York: Wiley.

Haasch, G. (2000). (Hrsg.). Bildung und Erziehung in Japan. Berlin: Volker Spiess.

Hagemeister, V. (2006). Kritische Anmerkungen zum Umgang mit den Ergebnissen von PISA. In Th. Jahnke & W. Meyerhöfer (Hrsg.), PISA & Co – Kritik eines Programms (S. 241-275). Hildesheim: Franzbecker.

Heine, Ch., Briedis, K., Didi, H.-J., Haase, K. & Trost, G. (2006). Auswahl- und Eignungsfeststellungsverfahren beim Hochschulzugang in Deutschland und ausgewählten Ländern. Eine Bestandsaufnahme. Hannover: HIS.

Hu, L. & Bentler, P. M. (1999). Cutoff criteria for fit indexes in covariance structure analysis: Conventional criteria versus new alternatives. Structural Equation Modeling, 6, 1-55.

Klein, G. (1999). Kinder schulfähig machen? Kindergarten heute, 29, 7-13.

Köller, O. & Baumert, J. (2002). Entwicklung schulischer Leistungen. In R. Oerter & L. Montada (Hrsg.), Entwicklungspsychologie (S. 756-786). Weinheim: Beltz.

Lapointe, A. E., Mead, N. A. & Askew, J. M. (1992). The international assessment of educational progress: Learning mathematics. Princeton: Educational Testing Service (Report No. 22-CAEP-01).

Lee, J.-W. & Barro, R. J. (1997). Schooling quality in a cross-section of countries. New York. Verfügbar unter: www.nber.org/papers/W6198 [18.11.04].

Lipset, S. M. (1962/1960). Soziologie der Demokratie. Neuwied: Luchterhand.

Lüdtke, O., Robitzsch, A., Trautwein, U. & Köller, O. (2007). Umgang mit fehlenden Werten in der psychologischen Forschung. Probleme und Lösungen. Psychologische Rundschau, 58, 103-117.

Lynn, R. & Vanhanen, T. (2002). IQ and the wealth of nations. Westport: Praeger.

Lynn, R. & Vanhanen, T. (2006). IQ and global inequality. Athens: Washington Summit.

Mankiw, N. G., Romer, D. & Weil, D. N. (1992). A contribution to the empirics of economic growth. Quarterly Journal of Economics, 107, 407-437.

Marsh, H. W., Kong, C.-K. & Hau, K.-T. (2000). Longitudinal multilevel models of the Big-Fish-Little-Pond effect on academic self-concept: Counterbalancing contrast and reflected-glory effects. In: Hong Kong schools. Journal of Personality and Social Psychology, 78, 337-349.

Marshall, M. G. & Jaggers, K. (2000). Polity IV Project. Political regime characteristics and transitions, 1800-1999. University of Maryland. Verfügbar unter: www.bsos.umd.edu/cidcm/inscr/polity [5.10.04].

Martin, M. O., Mullis, I. V. S., Gonzalez, E. J., Smith, T. & Kelly, D. L. (1999). School contents for learning and instruction: IEA‘s Third International Mathematics and Science Study (TIMSS). Chestnut Hill: TIMSS International Study Center, Boston College.

Martin, M. O., Mullis, I. V. S., Gregory, K. D., Hoyle, C. & Shen, C. (2000a). Effective schools in science and mathematics: IEA‘s Third International Mathematics and Science Study (TIMSS). Chestnut Hill: TIMSS International Study Center, Boston College.

Martin, M. O., Mullis, I. V. S., Gonzalez, E. J., Gregory, K. D., Smith, T. A., Chrostowski, S. J., Garden, R. A. & O’Connor, K. M. (2000b). TIMSS 1999 international science report. Chestnut Hill: International Study Center, Boston College.

Martin, M. O., Mullis, I. V. S., Gonzalez, E. J. & Chrostowski, S. J. (2004). TIMSS 2003 international science report. Chestnut Hill: TIMSS & PIRLS International Study Center, Boston College.

Mullis, I. V. S., Martin, M. O., Beaton, A., E., Gonzalez, E. J., Kelly, D. L. & Smith, T. (1997). Mathematics achievement in the primary school years: IEA’s Third International Mathematics and Science Study (TIMSS). Chestnut Hill: TIMSS International Study Center, Boston College.

Mullis, I. V. S., Martin, M. O., Gonzalez, E. J., Gregory, K. D., Garden, R. A., O‘Connor, K. M., Chrostowski, S. J. & Smith, T. A. (2000). TIMSS 1999 international mathematics report. Chestnut Hill: International Study Center, Boston College.

Mullis, I., Martin, M. O., Gonzales, E. J. & Kennedy, A. M. (2003). PIRLS 2001 international report. Chestnut Hill: IEA.

Mullis, I. V. S., Martin, M. O., Gonzalez, E. J. & Chrostowski, S. J. (2004). TIMSS 2003 international mathematics report. Chestnut Hill: TIMSS & PIRLS International Study Center, Boston College.

OECD (1999). Classifying educational programmes. Paris: OECD.

OECD (2003). Literacy skills for the world of tomorrow. Further results from PISA 2000. Paris: OECD.

OECD (2004a). Lernen für die Welt von morgen. Erste Ergebnisse aus PISA 2003. Paris: OECD.

OECD (2004b). Problem solving for tomorrow‘s world. First measures of cross curricular competencies from PISA 2003. Paris: OECD.

Raykov, T. (2005). Analysis of longitudinal studies with missing data using covariance structure modeling with full-information maximum likelihood. Structural Equation Modeling, 12, 493-505.

Rindermann, H. (2006). Was messen internationale Schulleistungsstudien? Schulleistungen, Schülerfähigkeiten, kognitive Fähigkeiten, Wissen oder allgemeine Intelligenz? Psychologische Rundschau, 57, 69-86.

Rindermann, H. (2007b). The g-factor of international cognitive ability comparisons: The homogeneity of results in PISA, TIMSS, PIRLS and IQ-tests across nations. European Journal of Personality, 21, 667-706.

Rindermann, H. (2008). Relevance of education and intelligence at the national level for the economic welfare of people. Intelligence, 36, 127-142.

Schaub, H. & Zenke, K. G. (2004). Wörterbuch Pädagogik. München: DTV.

Scheerens, J. & Bosker, R. J. (1997). The foundations of educational effectiveness. Kidlington: Pergamon/Elsevier.

Snijders, T. A. B. & Bosker, R. J. (2003/1999). Multilevel analysis. An introduction to basic and advanced multilevel modeling. London: Sage.

Schümer, G. (1998). Mathematikunterricht in Japan – ein Überblick über den Unterricht in öffentlichen Grund- und Mittelschulen und privaten Ergänzungsschulen. Unterrichtswissenschaft, 26, 195-228.

Son, S.-N. (2005). Koreanische Schulkultur – dargestellt aus international vergleichender Perspektive. Zeitschrift für Erziehungswissenschaft, 8, 53-73.

Steyer, R. (1992). Theorie kausaler Regressionsmodelle. Stuttgart: Gustav Fischer.

Tietze, W. (1987). A structural model for the evaluation of preschool effects. Early Childhood Research Quarterly, 2, 133-153.

Vanhanen, T. (1997). Prospects of democracy. London: Routledge.

Vanhanen, T. (2003). Democratization. A comparative analysis of 170 countries. London: Routledge.

Vanhanen, T. (2005). Measures of democracy 1810-2004. Finnish Social Science Data Archive (FSD). Verfügbar unter: www.fsd.uta.fi/english/data/catalogue/FSD1289 [17.01.06].

Whaley, S. E., Sigman, M., Neumann, Ch., Bwibo, N., Guthrie, D., Weiss, R. E., Alber, S. & Murphy, S. P. (2003). The impact of dietary intervention on the cognitive development of Kenyan school children. Journal of Nutrition, 133, 3965-3971.

Woschek, R. (2005). TIMSS 2 elaboriert. Eine didaktische Analyse von Schülerarbeiten im Ländervergleich Schweiz / Deutschland. Universität Duisburg: Dissertation                                          (http://deposit.ddb.de/cgi-bin/dokserv?idn = 976119749).

Wößmann, L. (2002). Central exams improve educational performance: International evidence. Kiel: Institut für Weltwirtschaft, Kieler Diskussionsbeiträge.

Wuttke, J. (2006). Fehler, Verzerrungen, Unsicherheiten in der PISA-Auswertung. In Th. Jahnke & W. Meyerhöfer (Hrsg.), PISA & Co – Kritik eines Programms (S. 101-154). Hildesheim: Franzbecker.

Anschrift des Autors:
Prof. Dr. Heiner Rindermann, Institut für Psychologie,
Karl-Franzens-Universität Graz, Universitätsplatz 2, 8010 Graz, Österreich, E-Mail: heiner.rindermann@uni-graz.at

 

Tabelle A1: Interkorrelationen von Merkmalen der Bildungssysteme und ihrer Schüler (Variablenbeschreibungen s. Methodenteil; * = die Korrelation ist auf dem Niveau von 0.05 2-seitig signifikant; ** = die Korrelation ist auf dem Niveau von 0.01 2-seitig signifikant; Signifikanzen sind für Inferenzen auf gesellschaftlicher Ebene nur eingeschränkt sinnvoll)

 

 

Kin­der­garten

Ein­schu­lung

Aus­gaben abs.

Unt.­umf.

Bild.­umf.

Glie­der­ung

Mi­gran­ten

Klas­sen­größe

Klass.­wdh.

Disz.

Dir. Instr.

Test

Test

(SW)

Zen­tral

Vari­anz zw.

Vari­anz
in

Erg.

GBN

 

 

N

N

N

N

N

N

N

N

N

N

N

N

N

N

N

N

N

N

Kindergartenbesuch

r

53

51

43

53

53

46

53

52

44

53

44

43

37

43

44

44

30

50

Einschulung (jung)

r

.21

72

55

59

72

53

53

72

58

69

60

42

35

52

46

46

30

70

Bildungsausgaben (abs)

r

.25

.09

110

53

62

45

46

110

105

55

48

38

32

45

40

40

26

108

Unterrichtsumfang

r

.34*

.36**

.00

64

64

49

56

63

54

62

53

44

37

52

46

46

30

61

Bildungsumfang

r

.76**

.62**

.18

.77**

80

53

56

79

65

72

61

44

37

53

48

48

30

77

Gliederung (jung)

r

.22

.19

.03

.19

.26

58

47

55

46

52

44

40

33

44

44

44

30

56

Migrantenanteil

r

.15

.38**

.43**

.37**

.36**

.10

56

55

47

56

47

44

37

46

45

45

30

53

Klassengröße/
S-L-V

r

-.24

-.10

-.61**

.28*

-.15

-.02

-.18

154

131

71

61

43

36

53

47

47

30

148

Klassenwiederhol.

r

-.26

.00

-.29**

-.16

-.25*

.02

.04

.47**

132

58

52

40

35

47

42

42

28

127

Disziplin

r

.54**

.17

.17

.23

.38**

.34*

.10

-.09

-.12

72

61

44

37

52

48

48

30

69

Direkte Instruktion

r

-.14

-.14

-.34*

.07

.14

.22

-.21

.31*

-.02

.16

61

38

31

52

38

38

25

60

Leistungstestorient.

r

.27

.32*

-.02

.30*

.40**

.28

.23

.18

-.31*

.38*

.13

44

37

37

41

41

29

42

Leistung für
Schulwahl

r

.33*

-.04

-.08

.53**

.44**

.48**

.24

.27

-.18

.27

.21

.52**

37

30

37

37

26

35

Zentralprüfungen

r

-.06

-.07

-.14

.13

.04

.09

-.08

.13

-.29*

.02

.07

.28

.25

53

37

37

25

52

Varianz zwischen
Schulen

r

.16

.01

-.31

-.01

.07

.57**

-.14

.18

.31*

-.01

.43**

-.05

.33*

-.05

48

48

30

45

Varianz in Schulen

r

-.11

.03

.42**

-.24

-.07

-.52**

.26

-.34*

-.19

-.17

-.32*

-.14

-.58**

-.03

-.46**

48

30

45

Ergänzungsunter­richt

r

.25

.00

-.38

.34

.59**

.01

-.37*

.60**

-.22

.33

.60**

.42*

.65**

.31

.27

-.38*

30

29

Ges. Bildungsni­veau

r

.36*

.25*

.59**

.09

.43**

-.03

.28*

-.65**

-.54**

.15

-.04

.29

-.03

-.04

-.26

.48**

.10

173