Instruktionssensitivität von Testitems in der Pädagogisch-Psychologischen Diagnostik (InSe)

Testergebnisse von Schülerinnen und Schülern aus standardisierten Leistungsmessungen dienen regelmässig als Basis für Rückschlüsse über die Wirksamkeit von Schule und Unterricht, beispielsweise zum Zwecke einer testdatenbasierten Schul- und Unterrichtsentwicklung oder zur Identifikation von Schul- oder Unterrichtsmerkmalen, die das Lernen von Schülerinnen und Schülern fördern oder beeinträchtigen.

Gültige Rückschlüsse über Schule und Unterricht anhand der Testergebnisse der Schülerinnen und Schüler erfordern, dass die eingesetzten Instrumente instruktionssensitiv sind.  Das heisst, die Instrumente müssen dazu in der Lage sein, Effekte von Schule und Unterricht abzubilden. Das InSe-Projekt untersucht, wie sich die Instruktionssensitivität von Tests und Items empirisch fassen und in der Pädagogisch-Psychologischen Diagnostik praktisch nutzen lässt.

Mehr erfahren

Ergebnisse von Schülerinnen und Schülern aus standardisierten Leistungstests werden häufig dazu genutzt, den individuellen Lernstand von Schülerinnen und Schülern zu erfassen, die Qualität von Schule, Unterricht und anderer pädagogischer Maßnahmen zu beurteilen oder Bildungssysteme auf nationaler und internationaler Ebene zu vergleichen.

Gültige Rückschlüsse über Schule und Unterricht erfordern, dass die Testinstrumente instruktionssensitiv sind, das heisst dazu in der Lage sind, Effekte des Unterrichts abzubilden. Das Projekt baut auf einem von Naumann, Hochweber und Hartig (2014) vorgestellten längsschnittlichen Mehrebenen-Differential-Item-Functioning-Modell (LML-DIF-Modell) zur Untersuchung von Instruktionssensitivität auf. Dieses Modell integriert bestehende Ansätze, indem es sowohl Veränderungen in Schülerleistungen über die Zeit als auch Unterschiede zwischen Schulklassen einbezieht, und es erlaubt die Unterscheidung der globalen und differenziellen Sensitivität von Tests und Items. Das beantragte Projekt verfolgt vier Ziele:

  1. die Weiterentwicklung des LML-DIF-Modells
  2. die Untersuchung der Qualität und Bedingungen der Parameterschätzung
  3. die Validierung von statistischen Indikatoren für Instruktionssensitivität
  4. die Entwicklung von Kriterien zur Klassifikation von Instruktionssensitivität auf Test- und Itemebene

Die Arbeitspakete zur Erreichung dieser Ziele lassen sich einteilen in die Bereiche Modellentwicklung, Simulationsstudien, Sekundäranalysen und eine Datenerhebung an Schweizer Schulen.

Eine Weiterentwicklung des Modells soll hinsichtlich des Einbezugs der Instruktionssensitivität auf Testebene, des Einbezugs von Prädiktorvariablen, der Modellierung variierender Itemdiskriminationen, der Verallgemeinerung auf mehrstufige Antworten und der Anwendung auf Trenddaten erfolgen. Simulationsstudien unterstützen die Modellentwicklung und dienen der Erforschung der Qualität und Bedingungen der Parameterschätzung (z. B. Stichprobenanforderungen). Sekundäranalysen dienen der Entwicklung von Kriterien für "hohe" oder "geringe" Instruktionssensitivität; hierzu sollen so viele geeignete Datensätze wie möglich reanalysiert werden. Darüber hinaus sollen statistische Indikatoren für Instruktionssensitivität validiert werden, indem deren Zusammenhänge mit Prädiktoren auf Klassen- und Itemebene gezeigt werden. Einige weitere Sekundäranalysen dienen darüber hinaus der Ersterprobung von neu entwickelten Modellvarianten. Da in den Daten aus bereits vorliegenden Studien einige für unsere Fragestellungen interessante Variablen fehlen, ist schliesslich die Erhebung eigener Testdaten an Schweizer Schulen geplant. In Zusammenarbeit mit dem Lehrmittelverlag St.Gallen erfolgt eine Erhebung der Schulleistungen von Schülerinnen und Schüler im Fach Mathematik zu mehreren Messzeitpunkten. Parallel dazu sind detaillierte Untersuchungen des Unterrichtsinhalts und umfassende Experten-Einschätzungen der Testaufgaben bezüglich ihrer Nähe zum Unterricht vorgesehen. Die Zusammenführung der erhobenen Daten liefert eine vielversprechende Grundlage für die Validierung statistischer Indikatoren sowie die Entwicklung von Kriterien zur Klassifikation der Instruktionssensitivität von Testitems.

Institut Kompetenzdiagnostik
Leitung

Jan Hochweber, Prof. Dr. (PHSG)
Johannes Hartig, Prof. Dr. (DIPF)

Team

Stephanie Musow, M.A. (PHSG)
Alexander Naumann, Dr. (DIPF)

Kooperationspartner DIPF Frankfurt am Main
Laufzeit 1. Oktober 2015 - 31. Dezember 2018
Finanzierung  Projektanteil PHSG: Schweizerischer Nationalfonds (SNF)
Projektanteil DIPF: Deutsche Forschungsgemeinschaft (DFG)

Publikationen

In der Projektdatenbank finden Sie Projektbeschreibungen und Resultate aktueller und abgeschlossener Forschungsprojekte.

Team PHSG