1 Einleitung

Die Lern- und Leistungsmotivation von Schülerinnen und Schülern zu fördern und über die Schulzeit aufrecht zu erhalten ist ein wichtiges Ziel schulischer Bildung. Nach der Erwartungs-Wert-Theorie der Leistungsmotivation (Eccles et al. 1983; Eccles und Wigfield 2020) sind insbesondere die Erfolgserwartungen bzw. Fähigkeitsselbstkonzepte (Kann ich das?) von Schülerinnen und Schülern sowie ihre subjektiven Wertüberzeugungen (Will ich das?) direkte Prädiktoren ihres Lernverhaltens, ihrer schulischen Leistungen sowie ihrer Kurs‑, Studien- und Berufswahlen. Allerdings nehmen Fähigkeitsselbstkonzepte und Wertüberzeugungen in der Höhe ihrer Ausprägungen in unterschiedlichen Schulfächern, ähnlich wie für andere motivationale Konstrukte im Lauf der Schulzeit typischerweise ab (Scherrer und Preckel 2019; Wigfield et al. 2015). In der Literatur werden hierfür verschiedene Erklärungen diskutiert, zu denen neben entwicklungsbedingten Prozessen auch die schulische Umwelt und ihre Passung zu den entwicklungsgemäßen Bedürfnissen der Schülerinnen und Schüler zählt (Eccles et al. 1993; Eccles und Roeser 2009; Wigfield et al. 2015). Jedoch gibt es bislang relativ wenig Forschung dazu, ob bzw. wie sich motivationale Entwicklungsverläufe zwischen Schulformen unterscheiden (vgl. Frenzel et al. 2010). Schulformen können jedoch durch eine unterschiedliche Zusammensetzung der Schülerschaft sowie Unterschiede in den Curricula, der Unterrichtskultur und den professionellen Kompetenzen der unterrichtenden Lehrkräfte differentielle Lern- und Entwicklungsmilieus bilden (Baumert et al. 2006).

Ein weiterer konsistenter Befund in der Forschung zur Motivation von Schülerinnen und Schülern sind Geschlechterunterschiede, die nach der Erwartungs-Wert-Theorie durch eine unterschiedliche Sozialisation von Jungen und Mädchen entstehen (Eccles 2009). Im Einklang mit Geschlechterstereotypen über Schulfächer berichten Jungen typischerweise stärker ausgeprägte Fähigkeitsselbstkonzepte und Wertüberzeugungen in Mathematik, während Mädchen höhere Ausprägungen in ihren Fähigkeitsselbstkonzepten und Wertüberzeugungen in Sprachen aufweisen (Jacobs et al. 2002; Steinmayr und Spinath 2010; Watt 2004). Weniger konsistent sind die Befunde jedoch in Bezug auf die Entwicklung von Geschlechterunterschieden mit zunehmendem Alter: Teilweise zeigten sich im Einklang mit einer zunehmenden Bedeutung von Geschlechterrollen im Jugendalter zunehmende Geschlechterunterschiede, teilweise stabile Differenzen (Frenzel et al. 2010; Gaspard et al. 2017; Jacobs et al. 2002; Watt 2004). Unklar ist zudem, ob der Besuch unterschiedlicher Schulformen ebenfalls mit einer unterschiedlichen Ausprägung von Geschlechterunterschieden in der Motivation zusammenhängt.

Basierend auf der Erwartungs-Wert-Theorie und bisheriger Forschung zur Entwicklung von Fähigkeitsselbstkonzept und Wertüberzeugungen untersucht unsere Studie motivationale Heterogenität in Abhängigkeit von Alter, Geschlecht und der besuchten Schulform in Bezug auf Fähigkeitsselbstkonzept und verschiedene Komponenten von Wertüberzeugungen in Mathematik und Deutsch. Hierzu nutzen wir Daten einer groß angelegten Studie, in der Schülerinnen und Schüler verschiedener Schulformen in Baden-Württemberg (Gymnasium, Realschule, Gemeinschaftsschule) in Jahrgangsstufe 5 bis 10 zwei Mal in einem Abstand von einem Schuljahr befragt wurden und somit ein Mehrkohorten- mit einem Längsschnittansatz kombiniert wurde.

1.1 Erwartungs-Wert-Theorie

Die Erwartungs-Wert-Theorie (Eccles et al. 1983; Eccles und Wigfield 2020) ist eine der einflussreichsten Theorien zur Erklärung von akademischen Entscheidungen und Lern- und Leistungsverhalten. Nach dieser Theorie sind die Erfolgserwartung und der subjektive Wert, die Schülerinnen und Schüler in Bezug auf eine spezifische Aufgabe bzw. ein Schulfach wahrnehmen, die zentralen Determinanten des Lern- und Leistungsverhaltens in Bezug auf diese Aufgabe bzw. dieses Schulfach. Die Erfolgserwartung bezieht sich hierbei auf die Überzeugung einer Person, wie gut sie eine zukünftige Aufgabe bewältigen kann (Eccles und Wigfield 2020). Diese wird dem Modell zufolge unter anderem durch das Fähigkeitsselbstkonzept beeinflusst. Empirisch bestehen hohe Zusammenhänge zwischen den beiden Konstrukten – zumindest wenn beide relativ global, d. h. in Bezug auf bestimmte Schulfächer und nicht in Bezug auf konkrete Aufgaben erfasst werden (Eccles und Wigfield 2020; Marsh et al. 2019). Daher wird häufig nicht zwischen ihnen unterschieden und Fähigkeitsselbstkonzepte werden als Indikatoren für den Bereich der Erwartungen genutzt (Eccles und Wigfield 2020). Zudem werden solche globalen Fähigkeitseinschätzungen stärker durch Vergleichsprozesse beeinflusst (Marsh et al. 2019) und sind daher theoretisch oft von größerem Interesse. Im Kontext unserer Studie, in welcher die Entwicklung relativ stabiler motivationaler Dispositionen in unterschiedlichen Schulfächern im Vordergrund steht, erachten wir eine Betrachtung des Fähigkeitsselbstkonzepts im Vergleich zu Erfolgserwartungen ebenfalls als sinnvoller.

In Bezug auf die Wertüberzeugungen haben Eccles und KollegInnen vier Komponenten voneinander unterschieden (Eccles 2005; Eccles und Wigfield 2020): den intrinsischen Wert bzw. die Freude, die mit der Erledigung einer Aufgabe einhergeht, die Wichtigkeit einer guten Leistung für die eigene Person, die Nützlichkeit der Aufgabenbewältigung für das Erreichen zukünftiger Ziele und die Kosten der Aufgabenbearbeitung wie bspw. der damit verbundene Aufwand oder die Zeit, die für alternative Beschäftigungen verloren geht. Während intrinsischer Wert, Wichtigkeit und Nützlichkeit positiv zum subjektiven Wert einer Aufgabe beitragen, beeinflussen die wahrgenommen Kosten diesen negativ (Wigfield et al. 2017).

Im Einklang mit der theoretischen Konzeption von Fähigkeitsselbstkonzept und Wertüberzeugungen hat sich gezeigt, dass diese einen stark fachspezifischen Charakter aufweisen, d. h. typischerweise finden sich nur geringe Zusammenhänge zwischen den Fähigkeitsselbstkonzepten und Wertüberzeugungen in unterschiedlichen Fächern, insbesondere zwischen dem mathematischen und sprachlichen Bereich (Bong 2001; Gaspard et al. 2018; Trautwein et al. 2012). Weiterhin haben sich die Fähigkeitsselbstkonzepte und Wertüberzeugungen von Schülerinnen und Schülern theoriekonform als bedeutsame Prädiktoren ihres Lernverhaltens und ihrer Entscheidungen erwiesen (für einen Überblick siehe Eccles und Wigfield 2020). So sagen Fähigkeitsselbstkonzepte auch über das Ausgangsniveau der Leistungen hinaus spätere Leistungen vorher, während Wertüberzeugungen sich in verschiedenen längsschnittlichen Studien eher als zentral für die Vorhersage von Entscheidungen wie Kurswahlen erwiesen haben, wobei die relative Bedeutsamkeit auch in Abhängigkeit vom schulischen Kontext variieren kann (Durik et al. 2006; Ehm et al. 2019; Marsh et al. 2005; Watt et al. 2012).

1.2 Entwicklung von Fähigkeitsselbstkonzept und Wertüberzeugungen im Lauf der Sekundarschulzeit

Zahlreiche Studien aus verschiedenen Ländern haben gezeigt, dass die berichteten Ausprägungen der Fähigkeitsselbstkonzepte und Wertüberzeugungen in verschiedenen Schulfächern mit zunehmendem Alter der Schülerinnen und Schüler abnehmen (z. B. Gaspard et al. 2017; Jacobs et al. 2002; Watt 2004; für eine Metaanalyse siehe Scherrer und Preckel 2019). Diese Abnahme beginnt bereits im Grundschulalter (Wigfield et al. 1997) und setzt sich in der Sekundarschulzeit fort (Gaspard et al. 2017; Watt 2004). Allerdings wurde häufig eine kurvilineare Abnahme gefunden, d. h. eine stärkere Abnahme in den früheren Schuljahren und ein Abflachen der Abnahme oder sogar ein leichter Anstieg gegen Ende der Schulzeit (Frenzel et al. 2010; Jacobs et al. 2002; Watt 2004).

Verschiedene Erklärungen für diese Abnahme werden in der Literatur diskutiert, worunter sowohl entwicklungsbedingte Veränderungen als auch schulische Faktoren fallen (Wigfield et al. 2015). Zum einen werden die zunächst allzu optimistischen Selbsteinschätzungen von Schülerinnen und Schülern durch zunehmende Fähigkeiten im Verständnis und der Interpretation von Feedback und die zunehmende Nutzung von sozialen Vergleichen mit dem Alter realistischer (Harter 2006; Muenks et al. 2018). Weiterhin differenzieren sich die Interessen von Schülerinnen und Schülern in verschiedenen Bereichen aus und die außerschulischen Interessen nehmen insbesondere in der Pubertät zu (Hidi 2000; Schiefele 2009). Zum anderen wird aber auch davon ausgegangen, dass schulische Faktoren zu einer Abnahme der schulischen Motivation beitragen. In höheren Klassenstufen, insbesondere nach dem Übergang an weiterführende Schulen, sind typischerweise Leistungsbewertungen häufiger und bedeutsamer, Wettbewerb unter den Schülerinnen und Schülern ist wahrscheinlicher und die Beziehungen zu Lehrkräften sind weniger persönlich und unterstützend (Eccles und Roeser 2009; für Studien aus Deutschland siehe Fischer und Rustemeyer 2007; Lazarides et al. 2021; Praetorius et al. 2017). Die Stage-Environment-Fit Theorie (Eccles et al. 1993; Eccles und Roeser 2009) geht davon aus, dass diese Veränderungen nicht zu den entwicklungsbedingten Bedürfnissen der Jugendlichen wie etwa einem verstärkten Bedürfnis nach Unterstützung durch Erwachsene passen und diese mangelnde Passung schließlich in einer Abnahme der schulischen Motivation mündet.

1.3 Entwicklung von Fähigkeitsselbstkonzept und Wertüberzeugungen in verschiedenen Schulformen

Wenngleich inzwischen eine Reihe zentraler Einflussfaktoren auf die Motivation der Schülerinnen und Schüler identifiziert werden konnte, ist die Frage nach institutionellen Effekten bislang nicht ausreichend geklärt. Insbesondere die Schulform ist in Deutschland wie auch in anderen Ländern ein bestimmendes Merkmal der Schulumwelt. Schulformen unterscheiden sich in einer ganzen Reihe an Faktoren, die für die Entwicklung von Fähigkeitsselbstkonzept und Wertüberzeugungen von Schülerinnen und Schülern relevant sein können. Zunächst geht die angestrebte Leistungshomogenisierung mit einer unterschiedlichen Zusammensetzung der Schülerinnen und Schüler an verschiedenen Schulformen einher: Neben der Leistung zeigen sich hier typischerweise auch deutliche Unterschiede in Bezug auf den familiären Hintergrund, unter anderem in Bezug auf den Migrationsanteil, den sozioökonomischen Status und den elterlichen Bildungsstand (Autorengruppe Bildungsberichterstattung 2018). Häufig wird der „Big Fish Little Pond“-Effekt (BFLPE; Marsh 1987; Marsh et al. 2008) als Erklärung für Effekte der besuchten Schulform über die Leistungszusammensetzung der Schülerinnen und Schüler herangezogen: Für Schülerinnen und Schüler an selektiven Schulformen wie dem Gymnasium bestehen nach dem Übergang mehr Möglichkeiten eines Aufwärtsvergleiches ihrer Leistungen, was sich negativ auf ihr Fähigkeitsselbstkonzept auswirkt (Schwarzer et al. 1982). Ein umgekehrtes Bild ergibt sich für Schülerinnen und Schüler an weniger selektiven Schulformen. Einen dem BFLPE gegenläufigen Effekt kann der wahrgenommene Status bzw. das Prestige der Schulform haben: Danach sollte der Besuch einer selektiven Schulform sich positiv auswirken; ein solcher Assimilationseffekt wird auch als „Basking in Reflected Glory“-Effekt (BIRGE) bezeichnet (Marsh et al. 2000; siehe auch Knigge und Hannover 2011). Im Einklang mit dem BFLPE fanden Köller und Baumert (2001) bei Schülerinnen und Schülern am Gymnasium unter Kontrolle der individuellen Leistung ein geringer ausgeprägtes Fähigkeitsselbstkonzept in Mathematik in Klassenstufe 7 sowie eine negativere Entwicklung von Klassenstufe 7 bis 10 im Vergleich zur Realschule. Diese Unterschiede verschwanden bei Kontrolle der mittleren schulischen Leistung, d. h. sie konnten durch den BFLPE erklärt werden. Ein ähnliches Ergebnismuster fanden Trautwein et al. (2006) für das Fähigkeitsselbstkonzept und das Interesse in Mathematik in Klassenstufe 9. In beiden Studien war die Evidenz für einen gegenläufigen BIRGE eher schwach. In Bezug auf die Entwicklung des Interesses in Mathematik zeigte sich in einer längsschnittlichen Studie zudem eine geringere Abnahme von Klassenstufe 5 bis 9 an Hauptschulen im Vergleich zu Realschulen und Gymnasien (Frenzel et al. 2010).

Weiterhin unterscheiden sich die Ausbildung der Lehrkräfte, die Curricula und die Unterrichtskultur zwischen Schulformen. So weisen Lehrkräfte an Gymnasien ein vergleichsweise höheres Fachwissen sowie ein höheres fachdidaktisches Wissen auf (Baumert et al. 2010). Schülerinnen und Schüler am Gymnasium berichteten in PISA 2015 zudem vergleichsweise höhere Werte für die Unterrichtsqualitätsmerkmale strukturierte Klassenführung und konstruktive Unterstützung (Autorengruppe Bildungsberichterstattung 2018), welche sich positiv auf die Motivation der Schülerinnen und Schüler auswirken können (Kunter et al. 2013). In der COACTIV-Studie zeigte sich im Fach Mathematik allerdings, dass Lehrkräfte am Gymnasium vergleichsweise geringer ausgeprägte Überzeugungen in Bezug auf die praktische Relevanz und die Anwendungsorientierung des Mathematikunterrichts aufwiesen und die Schülerinnen und Schüler am Gymnasium einen geringeren Alltagsbezug des Mathematikunterrichts wahrnahmen (Bruckmaier et al. 2018). Ein starker Alltagsbezug des Unterrichts kann sich positiv auf die Wertüberzeugungen der Schülerinnen und Schüler auswirken (Parrisius et al. 2020; Schreier et al. 2014). Aufgrund der zahlreichen, potenziell auch gegenläufigen Effekte, die zu einer differentiellen Entwicklung an unterschiedlichen Schulformen beitragen können (z. B. BFLPE vs. BIRGE), werden Schulformunterschiede in Fähigkeitsselbstkonzept und Wertüberzeugungen und deren Entwicklung in der vorliegenden Studie als Bruttoeffekte untersucht. Solche deskriptiven Unterschiede zu identifizieren, ist ein erster wichtiger Schritt bei der Klärung der Frage nach institutionellen Effekten.

Von besonderem Interesse für die vorliegende Studie ist die Gemeinschaftsschule als eine neue, inklusive Schulform, in der Schülerinnen und Schüler der Sekundarstufe I gemeinsam unterrichtet werden und mehrere Bildungsgänge ermöglicht werden (Wiechmann 2009). Aus motivationaler Hinsicht weist die Gemeinschaftsschule, so wie sie in Baden-Württemberg gestaltet ist, verschiedene Besonderheiten auf: Auf numerische Noten sowie die Bildung homogener Lerngruppen wird (zunächst) verzichtet und die Schulen verpflichten sich zum Einsatz individualisierender und kooperativer Lernformen (Wacker und Bohl 2016). Neben den im Allgemeinen positiven Auswirkungen von individualisierenden und kooperativen Lernformen auf die Motivation von Schülerinnen und Schülern (Kyndt et al. 2013; Seidel und Shavelson 2007; Slavin 1996) sollte die Gestaltung der Gemeinschaftsschule aus theoretischer Sicht auch zu einer geringeren Salienz von sozialen Vergleichen führen, Konkurrenz zwischen den Schülerinnen und Schülern reduzieren und die Beziehungen der Schülerinnen und Schüler untereinander stärken. Ausgehend von der Stage-Environment-Fit-Theorie (Eccles et al. 1993; Eccles und Roeser 2009) könnte dies im Jugendalter besonders bedeutsam sein und somit zu einer geringeren Abnahme der schulischen Motivation an der Gemeinschaftsschule über die Sekundarstufe I führen.

1.4 Geschlechterunterschiede in der Entwicklung von Fähigkeitsselbstkonzept und Wertüberzeugungen

Ein Faktor, der in der bisherigen Forschung zu Heterogenität in der Entwicklung von Fähigkeitsselbstkonzept und Wertüberzeugungen große Aufmerksamkeit erfahren hat, ist das Geschlecht der Schülerinnen und Schüler. Dies liegt nicht zuletzt daran, dass die Erwartungs-Wert-Theorie davon ausgeht, dass sich Geschlechterunterschiede in akademischen Entscheidungen wie Studien- und Berufswahlen durch Geschlechterunterschiede in Fähigkeitsselbstkonzept und Wertüberzeugungen erklären lassen (Eccles 2009). Nach der Theorie führen Sozialisationsprozesse dazu, dass Jungen positivere Fähigkeitsselbstkonzepte und Wertüberzeugungen in männlich konnotierten Bereichen entwickeln, während bei Mädchen positivere Überzeugungen in weiblich konnotierten Bereichen entstehen. Im Fach Mathematik zeigt die bisherige Forschung konsistent, dass Jungen im Mittel ihre eigenen Fähigkeiten höher einschätzen als Mädchen (Gaspard et al. 2019; Jacobs et al. 2002; Nagy et al. 2010; Schilling et al. 2006). Geschlechterunterschiede in Wertüberzeugungen in Mathematik scheinen stärker von der erfassten Komponente abzuhängen, wobei Mädchen insbesondere ein niedrigeres Interesse bzw. einen niedrigeren intrinsischen Wert, einen geringeren langfristigen Nutzen und höhere Anstrengung sowie emotionale Kosten berichten (Frenzel et al. 2007; Gaspard et al. 2015; Marsh et al. 2005; Watt 2004). Im sprachlichen Bereich, insbesondere auch in der Muttersprache, zeigt sich konsistent, dass Mädchen positivere Fähigkeitsselbstkonzepte und Wertüberzeugungen aufweisen als Jungen (Gaspard et al. 2017; Jacobs et al. 2002; Schilling et al. 2006; Steinmayr und Spinath 2010; Watt 2004).

Geschlechterunterschiede finden sich bereits im Grundschulalter (Wigfield et al. 1997). Ausgehend von der Annahme, dass eine Sozialisation von Geschlechterrollen verstärkt im Jugendalter stattfindet, sollten sich Geschlechterunterschiede in dieser Entwicklungsphase verstärken (Eccles 1987; Hill und Lynch 1983). Jedoch wurden in bisherigen Studien größtenteils stabile Geschlechterunterschiede über die Zeit gefunden (Daniels 2008; Jacobs et al. 2002; Nagy et al. 2010; Watt 2004). Einzelne Studien zeigen allerdings, dass eine Verstärkung von Geschlechterunterschieden auf bestimmte, besonders stark stereotypisierte Fächer begrenzt sein kann (insbesondere Deutsch und Physik, Gaspard et al. 2017) oder sich solche Unterschiede innerhalb bestimmter Phasen verstärken können (in der frühen Adoleszenz; Frenzel et al. 2010). Dies könnte unter anderem dadurch bedingt sein, dass Mädchen typischerweise früher in die Pubertät kommen als Jungen und sich somit entwicklungsbedingte Veränderungen in der Motivation bei Mädchen und Jungen zu unterschiedlichen Zeitpunkten zeigen (Eccles et al. 1993).

Gleichzeitig wurden Studien in Deutschland zu Geschlechterunterschieden in Fähigkeitsselbstkonzept und Wertüberzeugungen oftmals mit Schülerinnen und Schülern am Gymnasium durchgeführt (Gaspard et al. 2017, 2015; Schilling et al. 2006; Steinmayr und Spinath 2010). Insofern ist die Frage, inwieweit das Ausmaß von Geschlechterunterschieden mit der besuchten Schulform zusammenhängt, bislang unbeantwortet. Unter Berücksichtigung der vielfältigen Schulformunterschiede in Bezug auf die akademische Kultur und die Schülerkomposition ist es denkbar, dass die Schulform auch die Sozialisation von Geschlechterunterschieden beeinflusst. So könnten Geschlechterunterschiede in der schulischen Motivation am Gymnasium aufgrund höherer Leistungsnormen für Mädchen und Jungen geringer ausfallen als an nicht-gymnasialen Schulformen.

1.5 Ziele der vorliegenden Studie

Ausgehend von Daten einer groß angelegten, zweimaligen Befragung von Schülerinnen und Schülern in Jahrgangsstufe 5 bis 10 in Baden-Württemberg im Abstand eines Schuljahres untersucht die vorliegende Studie Heterogenität in Fähigkeitsselbstkonzept und verschiedenen Komponenten von Wertüberzeugungen (intrinsischer Wert, Wichtigkeit, Nützlichkeit, Kosten) in Mathematik und Deutsch in Abhängigkeit von der Jahrgangsstufe, der besuchten Schulform und dem Geschlecht. Die Studie bietet aufgrund der großen Stichprobe von Schülerinnen und Schülern der gesamten Sekundarstufe I an verschiedenen Schulformen und der Erfassung unterschiedlicher motivationaler Konstrukte in zwei Schulfächern die einzigartige Möglichkeit, einen Einblick in den Spiegelsaal der Interaktionen möglicher Einflussfaktoren (vgl. Cronbach 1975) auf die motivationale Entwicklung im Schulkontext zu erhalten. Ähnlich wie in vielen anderen Bundesländern ist auch in Baden-Württemberg das traditionelle dreigliedrige Schulsystem in den vergangenen Jahren reformiert worden. Neben den traditionellen Schulformen Gymnasium und Realschule – die Haupt- bzw. Werkrealschule hat in Bezug auf die Schülerzahlen nur noch eine vergleichsweise geringe Bedeutung – wurde hier in den vergangenen Jahren die Gemeinschaftsschule als eine zusätzliche Schulform eingeführt, die mehrere Bildungsgänge ermöglicht und von einer zunehmenden Anzahl an Schülerinnen und Schülern besucht wird (Statistisches Landesamt Baden-Württemberg 2021). Die Studie untersucht die folgenden Forschungsfragen:

  1. 1.

    Wie hängen Fähigkeitsselbstkonzept und Wertüberzeugungen mit der Jahrgangsstufe zusammen? Im Einklang mit früherer Forschung erwarteten wir hier einen linearen sowie einen quadratischen Trend, welche einer Abnahme mit zunehmender Jahrgangsstufe, die sich in den höheren Klassenstufen abflacht, entsprechen.

  2. 2.

    Wie hängen Fähigkeitsselbstkonzept und Wertüberzeugungen mit der besuchten Schulform zusammen? In bisherigen Studien wurden eher positivere motivationale Überzeugungen sowie positivere Verläufe in niedrigeren Schulformen gefunden, welche sich über den BFLPE erklären ließen. Die Lernumwelt an der Gemeinschaftsschule könnte sich zudem positiv auf die motivationale Entwicklung auswirken, dies wurde bislang jedoch nicht untersucht.

  3. 3.

    Wie hängen Fähigkeitsselbstkonzept und Wertüberzeugungen mit dem Geschlecht zusammen? Ausgehend von früheren Befunden erwarteten wir hier, dass Jungen positivere Fähigkeitsselbstkonzepte und Wertüberzeugungen in Mathematik und Mädchen positivere Fähigkeitsselbstkonzepte und Wertüberzeugungen in Deutsch berichten. Zudem deuten einige frühere Befunde daraufhin, dass sich solche Geschlechterunterschiede mit dem Alter verstärken können.

  4. 4.

    Hängen Geschlechterunterschiede von der besuchten Schulform ab? Diese Frage wurde explorativ untersucht.

2 Methode

2.1 Stichprobe

Für die vorliegende Studie wurden Daten der längsschnittlichen Studie „Unterricht aus Schülersicht“ (UNITAS) genutzt, die im Frühjahr/Sommer 2018 sowie im Frühjahr/Sommer 2019 in Baden-Württemberg erhoben wurden (Jaekel et al. 2021). Die Durchführung der Studie wurde durch das Ministerium für Kultus, Jugend und Sport Baden-Württemberg genehmigt (AZ 31-6600.0/279). Die Ethikkommission der Wirtschafts- und Sozialwissenschaftlichen Fakultät der Universität Tübingen bestätigte zudem, dass die Durchführung der Studie im Einklang mit den ethischen Richtlinien zur Forschung mit Menschen war (AZ A2.5.4-074_aa). Zur Teilnahme an der Studie wurden Schulen aller Schulformen aus dem gesamten Bundesland rekrutiert, die bereit waren freiwillig teilzunehmen. Insgesamt nahmen 27 Schulen teil: 11 Gymnasien, 8 Realschulen, 7 Gemeinschaftsschulen und 1 Werkrealschule. Aufgrund der geringen Stichprobengröße wurden die Schülerinnen und Schüler der Werkrealschule (n = 80) von den Analysen für die vorliegende Studie ausgeschlossen. Die teilnehmenden Schulen verteilten sich über alle vier Regierungspräsidien des Bundeslandes und umfassten für alle drei untersuchten Schulformen sowohl Schulen aus dem städtischen als auch dem eher ländlichen Raum. Zu beiden Messzeitpunkten wurden Daten der Jahrgangsstufen 5 bis 10 erhoben. Dabei wurden falls möglich alle Klassen der entsprechenden Jahrgangsstufen 5 bis 10 an den teilnehmenden Schulen einbezogen, teilweise war die Teilnahmebereitschaft für die Abschlussjahrgänge jedoch etwas geringer. Schülerinnen und Schüler aus fünf Jahrgangskohorten des ersten Messzeitpunktes (Jahrgangsstufe 5 bis 9) wurden im Abstand von einem Jahr wiederholt befragt. Für jeweils eine Jahrgangskohorte (Jahrgangsstufe 10 zu T1 sowie Jahrgangsstufe 5 zu T2) waren lediglich Daten für einen Messzeitpunkt vorhanden. Für die vorliegenden Analysen wurden alle Daten derjenigen Schülerinnen und Schüler genutzt, die zu mindestens einem Messzeitpunkt Informationen über mindestens eine der motivationalen Skalen vorliegen hatten. Somit bestand die verwendete Stichprobe aus insgesamt 8080 Schülerinnen und Schülern (51,1 % weiblich). Die Stichprobengrößen der einzelnen Jahrgangsstufen zu den beiden Zeitpunkten für die verschiedenen Schulformen sind in Abb. 1 zu finden.

Abb. 1
figure 1

Stichprobe zu den beiden Messzeitpunkten nach Jahrgangsstufe und Schulform (unterschiedliche Schattierung entspricht unterschiedlichen Kohorten)

In Tab. 1 sind zudem die deskriptiven Statistiken für Leistungstests, Geschlecht und familiären Hintergrund für die Gesamtstichprobe sowie für die einzelnen Schulformen aufgeführt (s. Instrumente für eine Beschreibung der Variablen). Es zeigten sich die erwartbaren Unterschiede in den Leistungstests mit höheren Leistungen am Gymnasium und den geringsten Leistungen an der Gemeinschaftsschule, keine Unterschiede in der Geschlechterverteilung sowie ein höherer sozioökonomischer Status und eine höhere Anzahl an Büchern im Haushalt am Gymnasium im Vergleich zu den beiden anderen Schulformen und schließlich ein höherer Anteil an Schülerinnen und Schülern mit Migrationshintergrund an der Realschule im Vergleich zu Gymnasium und Gemeinschaftsschule. Gleichzeitig ergaben sich aufgrund der Varianz innerhalb von Schulformen auch nicht unwesentliche Überlappungen zwischen den Schulformen. Ähnliche Unterschiede zwischen dem Gymnasium und den nicht-gymnasialen Schulformen fanden sich in repräsentativen Studien (Reiss et al. 2019; Stanat et al. 2019).

Tab. 1 Deskriptive Statistiken für Kovariaten für die einzelnen Schulformen sowie die Gesamtstichprobe

2.2 Instrumente

Motivationale Skalen

Die Fähigkeitsselbstkonzepte und Wertüberzeugungen in Mathematik und Deutsch wurden anhand von über die Fächer parallelen Skalen erfasst. Alle Items wurden auf einer vierstufigen Skala (1 = stimmt gar nicht bis 4 = stimmt genau) beantwortet. Tab. 2 zeigt Beispielitems und Reliabilitäten der Skalen. Die Fähigkeitsselbstkonzepte in Mathematik und Deutsch wurden anhand von je vier Items erfasst, welche aus verschiedenen großen deutschsprachigen Studien stammten (Köller und Baumert 2001; Rieger et al. 2017; Schwanzer et al. 2005). In dieser Form wurde die Skala bereits erfolgreich in anderen Studien eingesetzt (Gaspard et al. 2018, 2016). Zur Erfassung der Wertüberzeugungen in Mathematik und Deutsch wurde eine Kurzform der Skalen eines Fragebogens von Gaspard et al. (2017, 2015) gebildet, wobei je drei Items für die Komponenten intrinsischer Wert, Wichtigkeit, Nützlichkeit und Kosten verwendet wurden. Die Skalen wiesen über alle Klassenstufen hinweg zufriedenstellende Reliabilitäten auf (vgl. Online-Zusatzmaterial). Konfirmatorische Faktorenanalysen bestätigten zudem die angenommene Faktorenstruktur, das heißt es ließen sich in beiden Fächern und zu beiden Messzeitpunkten fünf Faktoren für Fähigkeitsselbstkonzept, intrinsischen Wert, Wichtigkeit, Nützlichkeit und Kosten trennen (vgl. Online-Zusatzmaterial). Die Korrelationen der latenten Faktoren bewegten sich dabei in einem Range von |0,35| bis |0,79| in Mathematik und |0,24| bis |0,77| in Deutsch.

Tab. 2 Beispielitems und interne Konsistenzen der motivationalen Skalen

Kovariaten

Neben der Jahrgangsstufe und dem Geschlecht der Schülerinnen und Schüler wurden sowohl der familiäre Hintergrund als auch die Fachleistungen als Kovariaten berücksichtigt. Die Schülerinnen und Schüler wurden zum ersten Messzeitpunkt (für die Schülerinnen und Schüler der jüngsten Kohorte zum zweiten Messzeitpunkt) zu ihrem familiären Hintergrund befragt. Als Indikator für den sozioökonomischen Status wurde der International Socio-Economic Index of Occupational Status (ISEI) genutzt. Hierzu wurden die Berufsangaben für beide Elternteile zunächst anhand der International Standard Classification of Occupations (ISCO-08; International Labour Office 2012) kodiert und anschließend in den ISEI überführt (Ganzeboom 2010), welcher Werte zwischen 16 und 90 annehmen kann. Für die Analysen wurde der höchste Wert innerhalb der Familie genutzt (HISEI). Als Indikator für das kulturelle Kapital wurde zudem die Anzahl der Bücher im Haushalt (Baumert und Maaz 2006) auf einer fünfstufigen Skala erfasst (1 = keine oder nur sehr wenige, 2 = genug, um ein Regalbrett zu füllen, 3 = genug, um ein Regal zu füllen, 4 = genug, um drei Regale zu füllen, 5 = über 200 Bücher). Schließlich wurde der Migrationshintergrund auf Basis der Angaben der Schülerinnen und Schüler zum eigenen Geburtsland sowie dem Geburtsland der Eltern kodiert. Ein Migrationshintergrund wurde dann festgestellt, wenn der Schüler bzw. die Schülerin selbst oder eines der Elternteile nicht in Deutschland geboren wurde.

Die Fachleistung der Schülerinnen und Schüler wurde zum ersten Messzeitpunkt anhand zweier Kurztests zur Ermittlung fachlicher Grundfähigkeiten erfasst. Zur Erfassung der Grundfähigkeiten im Fach Deutsch wurde der Lesegeschwindigkeits- und Leseverständnistest (LGVT 5–12+; Schneider et al. 2017) eingesetzt. Hierbei lasen die Schülerinnen und Schüler innerhalb von sechs Minuten einen Fließtext und sollten an maximal 47 Textstellen unter jeweils drei Alternativen das in den Textzusammenhang passende Wort unterstreichen. Zur Erfassung der mathematischen Grundfähigkeiten wurde der Test mathematischer Basiskompetenzen (MBK 5–12+; Ennemoser et al. 2011; Krajewski und Ennemoser 2013) eingesetzt, der sowohl Mengen-Zahlen-Kompetenzen (z. B. Zahlvergleiche) als auch Konventions- und Regelwissen (z. B. Bruchrechnung) beinhaltet. Die Skalierung der individuellen Leistungsscores erfolgte anhand eines expected a posteriori (EAP) Personenparameterschätzers. Die EAPs für beide Leistungstests wurden dabei ohne Hintergrundmodell allein auf der Grundlage der Testleistungen von Schülerinnen und Schülern geschätzt. Die EAP-Reliabilitäten waren über alle Schulformen und Jahrgangsstufen hinweg zufriedenstellend (LGVT 5–12+: rEAP = 0,93; MBK 5–12+: rEAP = 0,79).

2.3 Statistisches Vorgehen

Alle Analysen wurden in Mplus 8.4 (Muthén und Muthén 2017) unter Verwendung eines robusten Maximum-Likelihood-Schätzers (MLR) und einer designbasierten Korrektur der Standardfehler (mit type = complex) durchgeführt, um Verletzungen der Normalverteilung und die Nestung von Schülerinnen und Schülern innerhalb von Klassen zu berücksichtigen.

Als Voraussetzung für die inhaltlich interessierenden Analysen wurde vorab die Messinvarianz über Zeit, Jahrgangsstufe, Geschlecht und Schulform überprüft. Ausgehend von gängigen Richtlinien in Bezug auf Veränderungen in den Goodness-of-Fit-Indizes (Chen 2007; Cheung und Rensvold 2002) waren die Ergebnisse dieser Analysen durchgängig im Einklang mit der Annahme strikter Messinvarianz (vgl. Online-Zusatzmaterial).

Heterogenität im Fähigkeitsselbstkonzept und in den verschiedenen Wertkomponenten in Abhängigkeit von Zeitpunkt, Jahrgangsstufe, Geschlecht und Schulform wurde anschließend anhand von multiplen Mehrebenen-Regressionsanalysen überprüft, in denen die Zeitpunkte innerhalb von Personen genestet waren und jeweils eine abhängige, latente Variable auf beiden Ebenen modelliert wurde (d. h. es wurden separate Analysen für die verschiedenen motivationalen Konstrukte berechnet). Um die Interpretation zu erleichtern und ausgehend von der getesteten Messinvarianz über die Zeit wurden die Faktorladungen hierbei über die Ebenen gleichgesetzt. Zudem wurden die Indikatorvariablen anhand der Gesamtvarianz (d. h. über Zeitpunkte hinweg) standardisiert, um eine leichtere Interpretation der Regressionskoeffizienten zu ermöglichen, ohne Unterschiede zwischen den Zeitpunkten zu eliminieren. Auf der Ebene innerhalb von Personen wurden die motivationalen Faktoren auf den Zeitpunkt (als Dummyvariable) regrediert. Auf der Ebene zwischen Personen wurden die motivationalen Faktoren durch einen linearen und einen quadratischen Trend der Jahrgangsstufe, das Geschlecht, die Schulform und die Interaktionen dieser Variablen vorhergesagt. Zur Testung des linearen Trends wurde die Jahrgangsstufe zu T1 um 7 zentriert, so dass der entsprechende Regressionskoeffizient der Steigung (bzw. dem Unterschied über ein Jahr) für diese Kohorte entspricht (d. h. von Jahrgangsstufe 7 zu 8). Diese Variable wurde quadriert, um den quadratischen Trend zu erhalten. Entsprechend repräsentiert dieser Koeffizient die Beschleunigung bzw. Verlangsamung von Jahrgangsstufenunterschieden. Das Geschlecht wurde effektkodiert (−1 = weiblich, 1 = männlich), um eine Interpretation der Regressionskoeffizienten der Jahrgangsstufe im Sinne von mittleren Effekten über beide Geschlechter hinweg zu ermöglichen. Die Schulform wurde über zwei Dummyvariablen berücksichtigt, welche die Realschule und die Gemeinschaftsschule im Vergleich zum Gymnasium indizierten. Zusätzlich wurde eine Cross-Level-Interaktion des Zeitpunkts mit dem linearen Trend der Jahrgangsstufe aufgenommen, um eine mögliche Verringerung des Effekts der Zeit in höheren Jahrgangsstufen zu modellieren. In einem zweiten Modell für jede abhängige Variable wurden neben dem Zeitpunkt, der Jahrgangsstufe, dem Geschlecht, der Schulform sowie den entsprechenden Interaktionstermen die Leistung im entsprechenden Fach sowie die Indikatoren des familiären Hintergrundes als Kovariaten mit aufgenommen, um zu prüfen, ob sich die gefundenen Unterschiede durch diese Variablen erklären lassen.

Aufgrund der großen Anzahl an Tests nutzten wir die Benjamini-Hochberg-Prozedur zur Kontrolle einer falschen Aufdeckungsrate von 0,05 (Benjamini und Hochberg 1995). Alle kontinuierlichen Variablen wurden vorab standardisiert und die Regressionskoeffizienten über den Model Constraint in Mplus an der Standardabweichung des Outcomes (über Ebenen hinweg) aus dem Nullmodell relativiert, so dass diese wie Effektstärken in Bezug auf die Gesamtvarianz interpretiert werden können bzw. leicht in solche transformiert werden können. Für Geschlechterunterschiede müssen aufgrund der Effektkodierung (−1, 1) die Koeffizienten, die zunächst Abweichungen vom Mittelwert beschreiben, verdoppelt werden, um Effektstärken im Sinne von Differenzen zwischen Mädchen und Jungen zu erhalten. Signifikante Interaktionen wurden zudem genauer anhand von Simple Slope-Analysen überprüft.

Zum Umgang mit fehlenden Werten wurde die Full-Information-Maximum-Likelihood-Methode verwendet, welche als modellbasiertes Verfahren alle vorhandene Information zur Schätzung der Modellparameter nutzt (Lüdtke et al. 2007). Somit konnte die gesamte Stichprobe für alle abhängigen Variablen genutzt werden. Um die Plausibilität der Missing at Random-Annahme und die Vergleichbarkeit zwischen den Modellen mit und ohne Kovariaten zu erhöhen, wurden die jeweils nicht berücksichtigten Kovariaten (Leistungstests und Variablen des familiären Hintergrunds) als Hilfsvariablen auf der Ebene zwischen Personen aufgenommen. Hierzu wurden Korrelationen dieser Variablen mit allen unabhängigen Variablen und mit den Fehlertermen der Indikatoren der motivationalen Konstrukte sowie innerhalb der Hilfsvariablen spezifiziert (Collins et al. 2001; Graham 2003).

3 Ergebnisse

Die deskriptiven Statistiken für die motivationalen Skalen zu beiden Zeitpunkten in Abhängigkeit von der Jahrgangsstufe sind in Tab. 3 zu finden (für eine grafische Darstellung siehe Online-Zusatzmaterial). Deskriptive Statistiken in Abhängigkeit von Geschlecht und der besuchten Schulform zusätzlich zur Jahrgangsstufe sind im Online-Zusatzmaterial dargestellt. Tab. 4 zeigt die Ergebnisse der Mehrebenen-Regressionsanalysen zur Vorhersage von Fähigkeitsselbstkonzept und Wertüberzeugungen in Mathematik, Tab. 5 präsentiert die Ergebnisse dieser Analysen für das Fach Deutsch. Die aus den Mehrebenen-Regressionsanalysen im Modell ohne Kovariaten geschätzten Mittelwerte des Fähigkeitsselbstkonzepts und der Wertüberzeugungen in Mathematik und Deutsch in Abhängigkeit von der Jahrgangsstufe, dem Geschlecht und der Schulform sind in Abb. 2 (für Mathematik) und Abb. 3 (für Deutsch) dargestellt.

Tab. 3 Deskriptive Statistiken für alle motivationalen Skalen in Abhängigkeit von Jahrgangsstufe und Messzeitpunkt
Tab. 4 Ergebnisse von Mehrebenen-Regressionsanalysen zur Vorhersage von Fähigkeitsselbstkonzept und Wertüberzeugungen in Mathematik durch Zeitpunkt, Jahrgangsstufe, Geschlecht und Schulform
Tab. 5 Ergebnisse von Mehrebenen-Regressionsanalysen zur Vorhersage von Fähigkeitsselbstkonzept und Wertüberzeugungen in Deutsch durch Zeitpunkt, Jahrgangsstufe, Geschlecht und Schulform
Abb. 2
figure 2

Geschätzte Werte für Fähigkeitsselbstkonzept und Wertüberzeugungen in Mathematik in Abhängigkeit von Jahrgangsstufe, Schulform und Geschlecht (aus dem Modell ohne Kovariaten)

Abb. 3
figure 3

Geschätzte Werte für Fähigkeitsselbstkonzept und Wertüberzeugungen in Deutsch in Abhängigkeit von Jahrgangsstufe, Schulform und Geschlecht (aus dem Modell ohne Kovariaten)

3.1 Fragestellung 1: Fähigkeitsselbstkonzept und Wertüberzeugungen in Abhängigkeit von der Jahrgangsstufe

In Mathematik zeigte sich bis auf die Wichtigkeit für alle motivationalen Konstrukte ein signifikanter Effekt des Zeitpunktes innerhalb von Personen, d. h. Schülerinnen und Schüler berichteten zum zweiten Zeitpunkt geringere Ausprägungen in Fähigkeitsselbstkonzepten und positiven Wertüberzeugungen bzw. stärker ausgeprägte Kosten. Dies ist im Einklang mit einer Abnahme der Motivation über die Zeit, wie sie auch in anderen längsschnittlichen Studien gefunden wurde. Dieser Effekt des Zeitpunktes variierte zudem (mit Ausnahme der Kosten) in Abhängigkeit von der Jahrgangsstufe, wobei ein positiver Koeffizient einer geringeren Abnahme in höheren Jahrgangsstufen entspricht. Ebenso fand sich im Vergleich der Kohorten ein negativer linearer Trend der Jahrgangsstufe für Fähigkeitsselbstkonzept und positive Wertüberzeugungen sowie ein positiver linearer Trend für die Kosten. Über beide Zeitpunkte hinweg berichteten also ältere Schülerinnen und Schüler geringere Ausprägungen in Fähigkeitsselbstkonzepten und positiven Wertüberzeugungen sowie stärker ausgeprägte Kosten. Zusätzlich zeigte sich für die Abnahme der Motivation in höheren Jahrgangsstufen ein quadratischer Trend für Fähigkeitsselbstkonzept und positive Wertüberzeugungen, d. h. eine weniger starke Abnahme bzw. teilweise sogar eine leichte Zunahme in höheren Jahrgangsstufen.

Auch im Fach Deutsch ergaben sich durchgängig signifikante Effekte des Zeitpunktes sowie lineare Trends der Jahrgangsstufe, die im Sinne einer abnehmenden Motivation in höheren Jahrgangsstufen gedeutet werden können. Zudem zeigten sich hier positive Interaktionseffekte des Zeitpunkts mit der Jahrgangsstufe für die Wichtigkeit und die Kosten sowie positive quadratische Trends der Jahrgangsstufe für den intrinsischen Wert, die Wichtigkeit, die Nützlichkeit und die Kosten. Eine Abnahme dieser Konstrukte zum zweiten Messzeitpunkt bzw. in höheren Kohorten war also in den älteren Kohorten weniger stark ausgeprägt. Die Effekte der Jahrgangsstufe wurden auch bei Kontrolle der Leistungen und des familiären Hintergrundes gefunden.

3.2 Fragestellung 2: Schulformunterschiede in Fähigkeitsselbstkonzept und Wertüberzeugungen und deren Entwicklung

In Mathematik fanden sich teilweise gegenläufige Schulformunterschiede für die untersuchten Variablen. Während Schülerinnen und Schüler an der Gemeinschaftsschule ein geringer ausgeprägtes Fähigkeitsselbstkonzept und höhere Kosten berichteten als Schülerinnen und Schüler am Gymnasium, wiesen sie zugleich höhere Werte für die Wichtigkeit und Nützlichkeit der Mathematik auf. Im Modell mit Kovariaten verkehrte sich der Effekt bezüglich des Fähigkeitsselbstkonzepts, d. h. Schülerinnen und Schüler an der Gemeinschaftsschule berichteten bei gleicher Mathematikleistung und gleichen Indikatoren des familiären Hintergrundes ein höheres Fähigkeitsselbstkonzept als am Gymnasium. Zudem zeigten sich im Modell mit Kovariaten im Vergleich zum Gymnasium neben höherer Wichtigkeit und Nützlichkeit auch ein höherer intrinsischer Wert. Der Unterschied bezüglich der Kosten reduzierte sich leicht, blieb aber statistisch signifikant. Für die Realschülerinnen und -schüler waren die Unterschiede im Modell ohne Kovariaten konsistent im Sinne einer ungünstigeren Ausprägung: Sie berichteten geringere Ausprägungen für Fähigkeitsselbstkonzept und intrinsischen Wert sowie höhere Kosten als Gymnasiastinnen und Gymnasiasten. Die Unterschiede in Fähigkeitsselbstkonzept und intrinsischem Wert verschwanden bei Kontrolle von Leistung und familiärem Hintergrund; der Unterschied in den Kosten reduzierte sich, blieb aber statistisch signifikant. In Deutsch berichteten Schülerinnen und Schüler an der Gemeinschaftsschule höhere Kosten als am Gymnasium. Dieser Unterschied reduzierte sich bei Kontrolle der Leistungen und des familiären Hintergrundes, blieb aber statistisch signifikant. Realschülerinnen und -schüler berichteten hier im Mittel ein geringer ausgeprägtes Fähigkeitsselbstkonzept, eine höhere Wichtigkeit und Nützlichkeit sowie höhere Kosten als Gymnasiastinnen und Gymnasiasten. Die Unterschiede in Fähigkeitsselbstkonzept und Kosten verschwanden unter Berücksichtigung der Kovariaten, zudem zeigten sich in diesem Modell neben höherer Wichtigkeit und Nützlichkeit auch ein höherer intrinsischer Wert an der Realschule.

In Mathematik unterschieden sich die Jahrgangsstufenunterschiede an der Gemeinschaftsschule nicht von denen am Gymnasium. Für die Realschule fand sich hingegen ein stärkerer negativer linearer Trend in Bezug auf intrinsischen Wert, Wichtigkeit und Nützlichkeit als am Gymnasium. Diese Wertüberzeugungen nahmen also im Vergleich zum Gymnasium mit zunehmender Jahrgangsstufe stärker ab. In Deutsch zeigten sich Interaktionen mit der Jahrgangsstufe für die Gemeinschaftsschule: Der lineare Trend der Jahrgangsstufe war für das Fähigkeitsselbstkonzept (im Unterschied zum Gymnasium) hier nicht signifikant (b = 0,03, p = 0,229) und für die Kosten (entgegen des positiven Trends am Gymnasium) negativ, d. h. diese nahmen in höheren Jahrgangsstufen ab (b = −0,06, p = 0,008). Zudem war der quadratische Trend (d. h. eine geringer werdende Abnahme in höheren Jahrgangsstufen) für den intrinsischen Wert an der Gemeinschaftsschule im Vergleich zum Gymnasium stärker ausgeprägt. An der Realschule zeigte sich für den intrinsischen Wert ein stärker negativer linearer Trend der Jahrgangsstufe als am Gymnasium, während der lineare Trend für die Kosten sich nicht als signifikant erwies (b = −0,01, p = 0,374). Die gefundenen Interaktionen zwischen Jahrgangsstufe und Schulform blieben unter Kontrolle der Kovariaten erhalten. Zudem wurde nun ein weiterer Interaktionsterm statistisch signifikant: Der quadratische Trend für den intrinsischen Wert in Mathematik war (unter Berücksichtigung der Kovariaten) im Unterschied zum Gymnasium an der Gemeinschaftsschule nicht vorhanden (b = 0,01, p = 0,685), d. h. hier flachte eine Abnahme nicht mit zunehmender Jahrgangsstufe ab.

3.3 Fragestellung 3: Geschlechterunterschiede in Fähigkeitsselbstkonzept und Wertüberzeugungen und deren Entwicklung

Durch die gewählte Kodierung der Schulformen mit dem Gymnasium als Referenzgruppe werden zunächst Geschlechterunterschiede innerhalb dieser Schulform betrachtet. In Mathematik berichteten Jungen hier höhere Ausprägungen für das Fähigkeitsselbstkonzept (d = 0,31), den intrinsischen Wert (d = 0,10) und die Wichtigkeit (d = 0,10) sowie geringer ausgeprägte Kosten (d = −0,13) als Mädchen. In Deutsch ergaben sich ebenfalls die erwarteten Geschlechterunterschiede: Jungen berichteten geringere Ausprägungen im Fähigkeitsselbstkonzept (d = −0,30) und den positiven Wertüberzeugungen (d = −0,32 bis d = −0,21) sowie stärker ausgeprägte Kosten (d = 0,31) als Mädchen.

In Mathematik ergaben sich signifikante Interaktionen mit der Jahrgangsstufe für die Nützlichkeit: Für Jungen war der lineare Trend schwächer ausgeprägt als für Mädchen, der quadratische Trend war zudem nur für Jungen signifikant (b = 0,03, p < 0,001 für Jungen, b = 0,00, p = 0,521 für Mädchen). Jungen wiesen also insgesamt eine weniger starke Abnahme der Nützlichkeit in höheren Jahrgangsstufen auf und Geschlechterunterschiede fanden sich nur in den höheren Jahrgangsstufen. In Deutsch fanden sich Interaktionen mit der Jahrgangsstufe in Bezug auf das Fähigkeitsselbstkonzept, den intrinsischen Wert und die Nützlichkeit. Jungen zeigten hier eine stärkere Abnahme mit zunehmender Jahrgangsstufe als Mädchen und Geschlechterunterschiede waren somit in den höheren Jahrgangsstufen stärker ausgeprägt. Die gefundenen Geschlechterunterschiede in beiden Fächern sowie die Interaktionen mit der Jahrgangsstufe blieben auch nach der Kontrolle individueller Leistungen und des familiären Hintergrundes erhalten.

3.4 Fragestellung 4: Geschlechterunterschiede in Fähigkeitsselbstkonzept und Wertüberzeugungen und deren Entwicklung in Abhängigkeit von der besuchten Schulform

In Mathematik waren die Geschlechterunterschiede im intrinsischen Wert an der Gemeinschaftsschule im Vergleich zum Gymnasium stärker ausgeprägt. Für die Nützlichkeit, für welche sich am Gymnasium keine signifikanten Geschlechterunterschiede (über Jahrgangsstufen hinweg) fanden, waren Geschlechterunterschiede zugunsten der Jungen an der Gemeinschaftsschule nachweisbar (b = −0,20, p < 0,001). An der Realschule zeigten sich ebenfalls stärkere Geschlechterunterschiede als am Gymnasium, hier waren die Interaktionen für den intrinsischen Wert und die Wichtigkeit signifikant.

Im Fach Deutsch waren die Geschlechterunterschiede in Bezug auf die Kosten an der Realschule stärker ausgeprägt als am Gymnasium. Zudem zeigte sich hier für die Gemeinschaftsschule eine signifikante Dreifachinteraktion zwischen Geschlecht, Jahrgangsstufe und besuchter Schulform für den intrinsischen Wert. Die Analyse der Simple Slopes zeigte, dass an der Gemeinschaftsschule der lineare Trend der Jahrgangsstufe nur für die Mädchen signifikant ausfiel (b = −0,09, p = 0,001), nicht jedoch für die Jungen (b = −0,03, p = 0,392). Somit wurden hier die Geschlechterunterschiede in höheren Jahrgangsstufen eher geringer, zeigten sich allerdings über die Jahrgangsstufen hinweg. Auch die Interaktionen zwischen Geschlecht und Schulform veränderten sich nicht durch die Hinzunahme der individuellen Leistungen und des familiären Hintergrundes ins Modell.

4 Diskussion

Ziel der vorliegenden Studie war die Untersuchung von Heterogenität in der Entwicklung von Fähigkeitsselbstkonzept und Wertüberzeugungen in Mathematik und Deutsch in der Sekundarschulzeit in Abhängigkeit von Jahrgangsstufe, Schulform und Geschlecht. Hierzu nutzten wir Daten einer wiederholten Befragung von Schülerinnen und Schülern der Jahrgangsstufen 5 bis 10 in Baden-Württemberg. Im Einklang mit früherer Forschung zeigte sich sowohl im längsschnittlichen Verlauf als auch im Vergleich der Kohorten, dass Schülerinnen und Schüler in höheren Jahrgangsstufen in beiden Fächern geringer ausgeprägte Fähigkeitsselbstkonzepte und positive Wertüberzeugungen sowie stärker ausgeprägte Kosten berichteten. Dieser Trend flachte mit dem Alter tendenziell ab. Zudem ergaben die Ergebnisse eine Reihe von Schulformunterschieden sowohl in Bezug auf das mittlere Niveau als auch die Jahrgangsstufenunterschiede, welche insgesamt die Bedeutung differentieller Lern- und Entwicklungsmilieus auch für die Motivation von Schülerinnen und Schülern unterstreichen (Baumert et al. 2006). Darüber hinaus fanden sich die erwarteten Geschlechterunterschiede im Einklang mit Geschlechterstereotypen: Jungen berichteten tendenziell ein stärker ausgeprägtes Fähigkeitsselbstkonzept und positivere Wertüberzeugungen in Mathematik als Mädchen, das umgekehrte Muster ergab sich in Deutsch. Für einen Teil der motivationalen Konstrukte verstärkten sich diese Geschlechterunterschiede in höheren Jahrgangsstufen, wie man es bei einer verstärkten Sozialisation von Geschlechterstereotypen in der Jugendzeit erwarten würde. Schließlich fanden sich an der Gemeinschaftsschule und Realschule teilweise stärkere Geschlechterunterschiede als am Gymnasium. Mit Ausnahme der Mittelwertsunterschiede zwischen Schulformen blieben alle gefundenen Unterschiede bei Kontrolle der individuellen Leistung und Indikatoren des familiären Hintergrunds stabil. Im Folgenden werden diese Ergebnisse in den Forschungsstand eingeordnet und ihre Implikationen für Theorie und Praxis diskutiert.

4.1 Entwicklung von Fähigkeitsselbstkonzept und Wertüberzeugungen: Unterschiede zwischen Zeitpunkten und Jahrgangsstufen

Die gefundenen Unterschiede über die Zeit und zwischen Jahrgangsstufen replizieren die Befunde zahlreicher Studien zur Abnahme der Motivation über Konstrukte, Schulfächer und Länder hinweg (Scherrer und Preckel 2019; Wigfield et al. 2015). In unserer Studie fand sich über die untersuchten motivationalen Konstrukte und Schulfächer hinweg eine ähnlich starke Abnahme in höheren Jahrgangsstufen, wobei die größten Effekte für die Nützlichkeit in Mathematik gefunden wurden (siehe auch Gaspard et al. 2017). Bislang weniger untersucht wurden in der bisherigen Forschung die wahrgenommenen Kosten. Hier konnten wir eine Zunahme der berichteten Kosten in höheren Jahrgangsstufen replizieren, wie sie bislang in einer einzigen Studie mit Schülerinnen und Schülern am Gymnasium in Deutschland berichtet wurde (Gaspard et al. 2017). Auch die gefundene Abschwächung dieser Abnahme in den Ausprägungen des Fähigkeitsselbstkonzepts und der Wertüberzeugungen in den höheren Jahrgangsstufen entspricht den Befunden früherer Forschung (Gaspard et al. 2017; Jacobs et al. 2002; Watt 2004). Hierzu könnten reifungsbedingte Entwicklungsprozesse, eine stabile schulische Umgebung, in der kein schulischer Übergang mehr zu gravierenden Einschnitten führt, sowie eine potenziell durch den für einen Teil der Schülerinnen und Schüler nahenden Schulabschluss erhöhte schulische Motivation beitragen.

Die gefundenen Effektstärken über ein Schuljahr bzw. im Vergleich von benachbarten Kohorten können im Sinne konventioneller Standards als klein bewertet werden (siehe auch Scherrer und Preckel 2019). Allerdings akkumulieren sich solche Effekte über die Zeit, so dass sich insgesamt eine substantielle Abnahme im Lauf der Sekundarschulzeit ergibt (vgl. Abb. 2 und 3). Die ähnlichen Effektstärken für Längs- und Querschnitt sprechen dafür, dass es sich um ein konsistentes Ergebnismuster handelt, welches weder durch Kohorteneffekte noch Testwiederholungseffekte stark beeinträchtigt zu sein scheint.

Da Fähigkeitsselbstkonzept und Wertüberzeugungen durch die schulische Lernumwelt und gezielte Interventionen beeinflusst werden können (Lazowski und Hulleman 2016; O’Mara et al. 2006), sprechen die Befunde insgesamt dafür, dass noch mehr Anstrengungen in eine motivationsförderliche Gestaltung der schulischen Umwelt investiert werden sollten. Auch wenn reifungsbedingte Entwicklungsprozesse sicherlich zu den gefundenen Jahrgangsunterschieden beitragen, hat sich gezeigt, dass eine entsprechende Gestaltung der Schulumwelt, insbesondere ein konstruktiv unterstützender und motivierender Unterricht, mit einer geringeren Abnahme der Motivation einhergehen (z. B. Lazarides et al. 2019; Parrisius et al. 2020).

4.2 Schulformunterschiede in Fähigkeitsselbstkonzept und Wertüberzeugungen

Zwischen den untersuchten Schulformen fanden sich einige Unterschiede in Bezug auf Fähigkeitsselbstkonzept und Wertüberzeugungen. Insgesamt erwiesen sich die Effekte als moderat ausgeprägt, wobei die hier untersuchten Bruttoeffekte sich durch verschiedene Faktoren wie Unterschiede in den Leistungen, dem Status der Schulform, der Komposition der Schülerschaft und den Curricula und Lehrkräften ergeben können, welche sich auch gegenseitig aufheben bzw. überlagern können. Unsere Ergebnisse weisen jedoch darauf hin, dass sich die gefundenen Mittelwertsunterschiede zwischen dem Gymnasium und den anderen beiden Schulformen in Bezug auf Fähigkeitsselbstkonzept, intrinsischen Wert und Kosten in erster Linie durch Leistungsunterschiede erklären lassen. Tatsächlich veränderten sich diese Schulformunterschiede deutlich unter Kontrolle der Leistungen (und des familiären Hintergrundes): In Bezug auf die Kosten wurden die Unterschiede reduziert, in Bezug auf das Fähigkeitsselbstkonzept und den intrinsischen Wert zeigte sich unter Kontrolle der berücksichtigten Kovariaten teilweise sogar eine höhere Motivation für die Schülerinnen und Schüler an weniger selektiven Schulformen. Dieses Ergebnis ist im Einklang mit Befunden zum BFLPE. Schulformen bieten den Schülerinnen und Schülern unterschiedliche Vergleichsmaßstäbe, die im Fall von mehr Möglichkeiten zu Abwärtsvergleichen ein stärker ausgeprägtes Fähigkeitsselbstkonzept, einen höheren intrinsischen Wert und niedrigere Kosten nach sich ziehen können (vgl. Trautwein et al. 2006). Ein anderes Befundmuster ergab sich für die Wichtigkeit und die Nützlichkeit, welche weniger stark durch Vergleiche der Leistungen geprägt sind (Gaspard et al. 2018): Hier zeigten sich die gefundenen höheren Werte für die wahrgenommene Wichtigkeit und Nützlichkeit im Fach Mathematik an der Gemeinschaftsschule und im Fach Deutsch an der Realschule sowohl mit als auch ohne Kontrolle der individuellen Leistung und der sozialen Herkunft. Ein möglicher Erklärungsansatz wäre eine höhere Alltagsnähe des Curriculums und damit einhergehend eine höhere subjektive Relevanz (vgl. Bruckmaier et al. 2018).

Von besonderem Interesse sind die untersuchten differentiellen Jahrgangsstufenunterschiede zwischen den Schulformen, die im Sinne von differentiellen Lern- und Entwicklungsmilieus interpretiert werden können und sich nicht über Unterschiede in den Leistungen und der sozialen Herkunft erklären ließen. Hier fanden sich an der Gemeinschaftsschule in Deutsch für das Fähigkeitsselbstkonzept und die Kosten nicht die typischen Jahrgangsstufenunterschiede, d. h. keine niedrigere Motivation in höheren Jahrgangsstufen. Diese differentielle Entwicklung im Vergleich zum Gymnasium könnte durch den Verzicht auf Noten und den Einsatz individualisierender und kooperativer Lernformen an der Gemeinschaftsschule zurückzuführen sein. Allerdings finden sich diese Unterschiede lediglich in Deutsch und nicht für das Fach Mathematik. Dies spricht dafür, dass die konkrete Ausgestaltung der strukturellen Maßnahmen wie bspw. die Nutzung individualisierender und kooperativer Lernformen in den einzelnen Fächern für die Auswirkungen auf die Motivationsentwicklung entscheidend ist. Potenziell könnten in Mathematik Leistungsunterschiede innerhalb von Lerngruppen auch trotz des Verzichts auf numerische Noten salienter sein als in Deutsch. An der Realschule zeigten sich hingegen für einzelne Wertüberzeugungen in beiden Fächern, insbesondere aber in Mathematik, stärkere Jahrgangsstufenunterschiede als am Gymnasium. Ein solches Muster widerspricht den Befunden früherer Forschung, in denen in Schulformen mit einer weniger leistungsstarken Schülerschaft im Einklang mit dem BFLPE eher positivere Entwicklungen gefunden wurden als in selektiveren Schulformen (Frenzel et al. 2010; Schwarzer et al. 1982). In diesem Sinne würde sich jedoch der Befund erklären lassen, dass die wahrgenommenen Kosten in Deutsch an der Realschule in höheren Klassenstufen nicht zunahmen. Die ansonsten eher negativere Entwicklung der Wertüberzeugungen an der Realschule im Vergleich zum Gymnasium könnte auch auf ein insgesamt zunehmendes Interesse der Realschülerinnen und Realschüler an außerschulischen Bereichen und eine demgegenüber abnehmende Relevanz akademischer Bereiche zurückzuführen sein.

Insgesamt lässt sich festhalten, dass die gefundenen Unterschiede zwischen besuchten Schulformen nur bedingt einheitlich für die untersuchten Konstrukte und Fächer waren. Neben den deutlichen Unterschieden zwischen den Schulformen in den Leistungen und dem familiären Hintergrund, die die Befunde nur teilweise erklären konnten, bedarf es weiterer Forschung zu proximalen Faktoren, die die unterschiedliche Entwicklung von Fähigkeitsselbstkonzept und Wertüberzeugungen an verschiedenen Schulformen erklären können, beispielsweise Unterschiede in Curriculum und Unterrichtsqualität.

4.3 Geschlechterunterschiede in Fähigkeitsselbstkonzept und Wertüberzeugungen

Die gefundenen Geschlechterunterschiede replizieren die Befunde früherer Forschung. Im Einklang mit der typischen Geschlechterkonnotation von Mathematik berichteten Jungen hier ein positiveres Fähigkeitsselbstkonzept und positivere Wertüberzeugungen, wobei sich die stärksten Unterschiede im Fähigkeitsselbstkonzept und keine signifikanten Unterschiede für die Nützlichkeit fanden (siehe auch Gaspard et al. 2015; Marsh et al. 2005; Watt 2004). Im Fach Deutsch zeigte sich das entgegengesetzte Muster, d. h. Mädchen berichteten ein stärker ausgeprägtes Fähigkeitsselbstkonzept sowie höhere Wertüberzeugungen, die Unterschiede waren hier etwas stärker ausgeprägt und konsistent über motivationale Konstrukte hinweg (siehe auch Gaspard et al. 2017; Schilling et al. 2006; Steinmayr und Spinath 2010). In beiden Fächern ließen sich diese Unterschiede in der Motivation nicht durch Unterschiede in den tatsächlichen Leistungen erklären, so dass vermutlich andere Faktoren wie eine geschlechterspezifische Sozialisation zu diesen Unterschieden führen (vgl. Eccles 2009).

Für einzelne Konstrukte zeigte sich eine Verstärkung von Geschlechterunterschieden in höheren Jahrgangsstufen. Dieser Befund ist im Einklang mit der Annahme einer verstärkten Sozialisation von Geschlechterrollen im Jugendalter (Eccles 1987; Hill und Lynch 1983), auch wenn zahlreiche frühere Studien stabile Geschlechterunterschiede fanden (Daniels 2008; Jacobs et al. 2002; Nagy et al. 2010; Watt 2004). Ähnlich wie in unserer Studie berichteten jedoch auch Gaspard et al. (2017) solche zunehmenden Geschlechterunterschiede insbesondere im Fach Deutsch sowie in Mathematik für die Nützlichkeit. Dass sich ein solches Muster in Deutsch besonders stark zeigt, könnte mit der ausgeprägten Stereotypisierung des Unterrichtsfachs im Vergleich zu anderen Fächern wie Mathematik zu tun haben (Lorenz et al. 2016; Steffens und Jelenec 2011) oder damit, dass in höheren Jahrgangsstufen in Deutsch insbesondere solche Inhalte behandelt werden (d. h. Literatur), bei denen Mädchen typischerweise eine höhere Motivation aufweisen (Henschel et al. 2013). Die in höheren Jahrgangsstufen verstärkt geschlechterspezifische Bewertung der Nützlichkeit in Alltag und Zukunft könnte auf eine verstärkte Reflexion dieser Relevanz (Wigfield 1994) und damit einhergehend ein verstärktes Zurückgreifen auf geschlechtsspezifische Präferenzen und berufliche Interessen (Gfrörer et al. 2021) zurückzuführen sein.

Weiterhin zeigten die explorativen Untersuchungen, dass das Ausmaß an Geschlechterunterschieden über die untersuchten Schulformen hinweg variierte. Insbesondere in Mathematik zeigte sich, dass Geschlechterunterschiede an Gemeinschaftsschulen und Realschulen höher ausfielen als am Gymnasium. Insofern scheint die Entstehung der geschlechtertypischen Unterschiede in Fähigkeitsselbstkonzept und Wertüberzeugungen auch von kontextuellen Einflussgrößen abzuhängen. Ein möglicher Faktor, der zu diesen Unterschieden beitragen könnte, ist ein unterschiedlicher familiärer Hintergrund der Schülerinnen und Schüler. Eine Sozialisation von Geschlechterrollenvorstellungen in Abhängigkeit vom sozioökonomischen Status oder Migrationshintergrund erscheint plausibel und wurde bereits teilweise empirisch bestätigt (Faber et al. 2011; Lühe et al. 2018). Allerdings zeigten sich die entsprechenden Interaktionen auch bei Kontrolle individueller Leistungen und Indikatoren des familiären Hintergrundes. Zur unterschiedlichen Geschlechtersozialisation an verschiedenen Schulformen könnten Unterschiede in der Stereotypisierung der Unterrichtsfächer durch Lehrkräfte und/oder die Unterrichtsmaterialien beitragen, aber auch ein unterschiedlicher von den Peers ausgehender Konformitätsdruck (vgl. Kessels 2005). Zudem könnte auch die vergleichsweise früher anstehende Berufswahl, deren Diskussion im Schulkontext und dadurch angestoßene Reflexionen mit einer vergleichsweise stärkeren Geschlechtersozialisation in den weniger selektiven Schulformen einhergehen (vgl. Gfrörer et al. 2021). Diese Mechanismen weiter zu eruieren, sollte ein wichtiges Anliegen künftiger Forschung sein.

4.4 Grenzen und zukünftige Forschung

Trotz der Verwendung eines großen, längsschnittlich angelegten Datensatzes hat unsere Studie verschiedene Limitationen, die bei der Interpretation der Befunde bedacht und durch zukünftige Forschung adressiert werden sollten. Erstens war der Datensatz nur teilweise längsschnittlich angelegt. Die Kombination eines Längsschnitt- und eines Kohortenansatzes ermöglichte es uns, die Effekte des Messzeitpunkts und der Jahrgangsstufe getrennt zu untersuchen. Allerdings wurden aufgrund des Schulwechsels (für die jüngste Kohorte) bzw. des möglichen Schulabschlusses (für die älteste Kohorte) nicht alle Kohorten mehrmals befragt, so dass von diesen nur Daten zu einem Messzeitpunkt vorlagen. Längsschnittliche Daten würden stärkere Schlüsse über die Entwicklung von Fähigkeitsselbstkonzept und Wertüberzeugungen erlauben und es zudem ermöglichen, über die Veränderung von Mittelwerten hinaus weitere Fragen zu beantworten, wie etwa zum Zusammenhang zwischen bestimmten motivationalen Entwicklungsverläufen und schulischen und beruflichen Outcomes.

Zweitens war die verwendete Stichprobe zwar groß und umfasste mehrere Schulformen, allerdings war diese auf Baden-Württemberg begrenzt und nicht repräsentativ. Zudem war die Stichprobe nicht gleich verteilt über Schulformen und Jahrgangsstufen, insbesondere Schülerinnen und Schüler der Gemeinschaftsschulen als neuer Schulform sowie der Jahrgangsstufe 10 als Abschlussjahrgang waren unterrepräsentiert.

Schließlich wurden in der vorliegenden Studie die Mechanismen, die die untersuchten Jahrgangsstufen‑, Geschlechter- und Schulformunterschiede bedingen, nicht umfassend untersucht. Somit können die gefundenen Unterschiede nur als Bruttoeffekte vermutlich mehrerer beitragender Faktoren interpretiert werden. Auch wenn sich in Bezug auf die gefundenen Schulformunterschiede zeigte, dass diese sich teilweise durch Ausgangsvoraussetzungen der Schülerinnen und Schüler erklären ließen, ist weitere Forschung notwendig um genauer zu erkunden, in welchem Ausmaß neben den individuellen Leistungen und dem familiären Hintergrund auch institutionelle Faktoren zur Entstehung solcher Unterschiede beitragen. Auch die Mechanismen, die Unterschiede in der motivationalen Entwicklung sowie in der Geschlechtersozialisation zwischen Schulformen erklären, sollten in Zukunft weiter erforscht werden.

4.5 Fazit

In der vorliegenden Studie wurde Heterogenität in der Motivation von Schülerinnen und Schülern anhand eines in Bezug auf die Größe der Stichprobe, die Kombination aus Quer- und Längsschnitt und die erfassten motivationalen Konstrukte einzigartigen Datensatzes detailliert untersucht. Dabei konnten die Ergebnisse früherer Forschung zu einer Abnahme von Fähigkeitsselbstkonzept und Wertüberzeugungen über die Sekundarschulzeit sowie zu typischen Geschlechterunterschieden in Mathematik und Deutsch repliziert werden. Zudem zeigte sich, dass Schulformen in Bezug auf die untersuchten motivationalen Konstrukte als differentielle Lern- und Entwicklungsmilieus fungieren. Unter Kontrolle der Leistungen und des familiären Hintergrundes wiesen Schülerinnen und Schüler an weniger selektiven Schulformen eine höher ausgeprägte Motivation auf als Schülerinnen und Schüler am Gymnasium, was auf die Bedeutsamkeit sozialer Vergleiche verweist. Auch Jahrgangsstufenunterschiede im Sinne einer Abnahme der Motivation über die Sekundarschulzeit variierten zwischen Schulformen: Diese waren an der Gemeinschaftsschule teilweise schwächer und an der Realschule größtenteils stärker ausgeprägt als am Gymnasium. Die Gemeinschaftsschule erwies sich somit im Einklang mit ihrer Konzeption als im Vergleich zum Gymnasium motivationsförderliche Lernumwelt, allerdings nur bedingt konsistent über die untersuchten Konstrukte und Fächer hinweg. Schließlich zeigten sich an beiden weniger selektiven Schulformen stärker ausgeprägte Geschlechterunterschiede insbesondere in Mathematik. Insgesamt bieten die Ergebnisse der Studie eine sehr umfassende Beschreibung der Motivation von Schülerinnen und Schülern unter besonderer Berücksichtigung von Jahrgangs‑, Fach‑, Schulform- und Geschlechterunterschieden. Daran anknüpfend sollte zukünftige Forschung die Ursachen dieser Unterschiede etwa in Bezug auf das Curriculum oder die Unterrichtsqualität genauer untersuchen.