Inhalt
Forschung zu Geschlechtsunterschieden in schulischen Leistungen konzentriert sich typischerweise auf Unterschiede in der Gesamtleistung. Diese Sichtweise verschleiert möglicherweise die Art des Zusammenhangs von Geschlecht und Leistung bei schulischen Aufgaben. Um dies zu untersuchen, wurde ein künstliches neuronales Netzwerk (ANN) entwickelt, welches das Geschlecht anhand der Antworten auf einzelne Items vorhersagt. Da ANNs besonders gut darin sind, komplexe und nichtlineare Muster zu erkennen, interpretierten wir die Genauigkeit des Netzwerkes als Maß für das Ausmaß der in den Antworten enthaltenen geschlechtsbezogenen Unterschiede. Um einen Vergleich mit herkömmlichen Methoden zu ermöglichen, die den Einfluss des Geschlechts anhand aggregierter Leistungsunterschiede erfassen, entwickeln wir zusätzlich ein Modell, das das Geschlecht auf Grundlage der Gesamtleistungen vorhersagt. Im Gegensatz zu den Ergebnissen von Loesche (2019), der eine ähnliche Methode bei einer großangelegten Untersuchung deutscher Drittklässler anwendete, deutet unser Vergleich darauf hin, dass aggregierte Leistungen eine akzeptable Annäherung an das Gesamtausmaß des Zusammenhangs zwischen Geschlecht und Item-Antworten darstellen. Diese Beobachtung gilt jedoch nicht für Leistungen in einzelnen Inhaltsbereichen, insbesondere in den Naturwissenschaften, oder für einzelne Aufgaben. Eine explorative Analyse legt nahe, dass dieser Widerspruch möglicherweise darauf zurückzuführen ist, dass das Netzwerk in der Lage ist, aus einzelnen Aufgaben mehrere Kompetenzen abzuleiten.
Schlagwörter: Antwortmuster – Geschlechterunterschiede – Neuronale Netze – Schulleistungsmessung
Research on gender differences in academic achievement typically focuses on differences in summary performance. There is reason to believe this view masks some of the ways gender is related to performance on scholastic tasks. To investigate this, we used an Artificial Neural Network (ANN) to predict gender from responses to individual items. Because ANNs excel at detecting complex and non-linear patterns, we took the network’s accuracy as a measure of the extent of gender-related differences contained in the responses. For a comparison with the traditional method of understanding gender differences through aggregate performance differences, we also developed a model predicting gender based on aggregate performances. Contrary to the findings of Loesche (2019), who applied a similar method to a large-scale assessment of German third-graders, the comparison indicates that aggregate performances provide a reasonable approximation of the overall extent to which gender is associated with item responses. However, this observation does not hold for performances in individual domains, particularly science, or items. An exploratory analysis suggests that this contradiction may be explained by the network’s ability to infer multiple competencies from individual tasks.
Keywords: ANN – educational measurement – gender differences – interpretable ML – response patterns