Instruktionssensitivität von Testitems in der Pädagogisch-Psychologischen Diagnostik (InSe)

Ergebnisse von Schülerinnen und Schülern aus standardisierten Leistungstests werden häufig dazu genutzt, den individuellen Lernstand von Schülerinnen und Schülern zu erfassen, die Qualität von Schule, Unterricht und anderer pädagogischer Maßnahmen zu beurteilen oder Bildungssysteme auf nationaler und internationaler Ebene zu vergleichen.

Gültige Rückschlüsse über Schule und Unterricht erfordern, dass die Testinstrumente im Allgemeinen instruktionssensitiv sind, also dazu in der Lage, Effekte von Schule und Unterricht abzubilden. Das Projekt untersucht, wie sich die Instruktionssensitivität von Tests und Items empirisch fassen und in der Pädagogisch-Psychologischen Diagnostik praktisch nutzen lässt.

Institut Kompetenzdiagnostik
Leitung

Jan Hochweber, Prof. Dr. (PHSG)
Johannes Hartig, Prof. Dr. (DIPF)

Team

Stephanie Musow, M.A. (PHSG)
Alexander Naumann, Dr. (DIPF)

Kooperationspartner DIPF Frankfurt am Main
Laufzeit 1. Oktober 2015 - 30. September 2018
Finanzierung  Projektanteil PHSG: Schweizerischer Nationalfonds (SNF)
Projektanteil DIPF: Deutsche Forschungsgemeinschaft (DFG)

Mehr erfahren

Ergebnisse von Schülerinnen und Schülern aus standardisierten Leistungstests werden häufig dazu genutzt, den individuellen Lernstand von Schülerinnen und Schülern zu erfassen, die Qualität von Schule, Unterricht und anderer pädagogischer Maßnahmen zu beurteilen oder Bildungssysteme auf nationaler und internationaler Ebene zu vergleichen.

Gültige Rückschlüsse über Schule und Unterricht erfordern, dass die Testinstrumente instruktionssensitiv sind, das heisst dazu in der Lage sind, Effekte des Unterrichts abzubilden. Das Projekt baut auf einem von Naumann, Hochweber und Hartig (2014) vorgestellten längsschnittlichen Mehrebenen-Differential-Item-Functioning-Modell (LML-DIF-Modell) zur Untersuchung von Instruktionssensitivität auf. Dieses Modell integriert bestehende Ansätze, indem es sowohl Veränderungen in Schülerleistungen über die Zeit als auch Unterschiede zwischen Schulklassen einbezieht, und es erlaubt die Unterscheidung der globalen und differenziellen Sensitivität von Tests und Items. Das beantragte Projekt verfolgt vier Ziele:

  1. die Weiterentwicklung des LML-DIF-Modells
  2. die Untersuchung der Qualität und Bedingungen der Parameterschätzung
  3. die Validierung von statistischen Indikatoren für Instruktionssensitivität
  4. die Entwicklung von Kriterien zur Klassifikation von Instruktionssensitivität auf Test- und Itemebene

Die Arbeitspakete zur Erreichung dieser Ziele lassen sich einteilen in die Bereiche Modellentwicklung, Simulationsstudien, Sekundäranalysen und eine Datenerhebung an Schweizer Schulen.

Eine Weiterentwicklung des Modells soll hinsichtlich des Einbezugs der Instruktionssensitivität auf Testebene, des Einbezugs von Prädiktorvariablen, der Modellierung variierender Itemdiskriminationen, der Verallgemeinerung auf mehrstufige Antworten und der Anwendung auf Trenddaten erfolgen. Simulationsstudien unterstützen die Modellentwicklung und dienen der Erforschung der Qualität und Bedingungen der Parameterschätzung (z. B. Stichprobenanforderungen). Sekundäranalysen dienen der Entwicklung von Kriterien für "hohe" oder "geringe" Instruktionssensitivität; hierzu sollen so viele geeignete Datensätze wie möglich reanalysiert werden. Darüber hinaus sollen statistische Indikatoren für Instruktionssensitivität validiert werden, indem deren Zusammenhänge mit Prädiktoren auf Klassen- und Itemebene gezeigt werden. Einige weitere Sekundäranalysen dienen darüber hinaus der Ersterprobung von neu entwickelten Modellvarianten. Da in den Daten aus bereits vorliegenden Studien einige für unsere Fragestellungen interessante Variablen fehlen, ist schliesslich die Erhebung eigener Testdaten an Schweizer Schulen geplant. In Zusammenarbeit mit dem Lehrmittelverlag St.Gallen erfolgt eine Erhebung der Schulleistungen von Schülerinnen und Schüler im Fach Mathematik zu mehreren Messzeitpunkten. Parallel dazu sind detaillierte Untersuchungen des Unterrichtsinhalts und umfassende Experten-Einschätzungen der Testaufgaben bezüglich ihrer Nähe zum Unterricht vorgesehen. Die Zusammenführung der erhobenen Daten liefert eine vielversprechende Grundlage für die Validierung statistischer Indikatoren sowie die Entwicklung von Kriterien zur Klassifikation der Instruktionssensitivität von Testitems.

Publikationen

In der Projektdatenbank finden Sie Projektbeschreibungen und Resultate aktueller und abgeschlossener Forschungsprojekte.

Team PHSG