1 Einleitung

Eine effiziente Klassenführung zählt zu den primären Qualitätsdimensionen lernförderlichen Unterrichts (Kunter et al. 2007, 2013; LePage et al. 2007). Obwohl Klassenführung eine notwendige Voraussetzung für einen lernförderlichen Unterricht darstellt (Emmer und Stough 2001; Klieme et al. 2001), klagen Lehrkräfte vor allem zum Berufseinstieg im Vorbereitungsdienst und den ersten Berufsjahren, zu wenig über Klassenführung zu wissen (Poznanski et al. 2018). Zudem scheinen sie zu wenige Strategien zum Umgang mit problematischen Schülerverhaltensweisen und Unterrichtssituationen zur Verfügung zu haben (Meister und Melnick 2003; Parsad et al. 2001). Auch aufgrund solcher Erfahrungen, aber auch wegen weiterer Gründe wie fehlender Unterstützung oder den allgemein herausfordernden Arbeitsbedingungen (Podolsky et al. 2016) erleben Lehramtsanwärter*innen (LAAs) die ersten Berufsjahre als belastend oder quittieren nicht selten den Dienst (Common Good 2004; Ingersoll 2002).

Um solchen Entwicklungen entgegenzusteuern, sollten Lehrkräfte so früh wie möglich entsprechendes Klassenführungswissen erwerben und in die Lage versetzt werden, das Wissen in praktisches Handeln umzusetzen. Zur Übersetzung von Wissen in Performanz werden nach Blömeke et al. (2015) situationsspezifische kognitive Fähigkeiten benötigt, die sich im Erkennen und theoriebasierten Interpretieren lernrelevanter Unterrichtsereignisse sowie im Entscheiden für situativ angemessene Unterrichtshandlungen äußern. Diese Kompetenz wird auch als professionelle (Unterrichts‑)Wahrnehmung bezeichnet (Barth 2017; Santagata und Guarino 2011; Sherin und van Es 2009). Die Förderbarkeit der professionellen Wahrnehmung in Bezug auf klassenführungsrelevante Unterrichtsereignisse in der universitären Lehramtsausbildung wurde bereits vielfach erfolgreich belegt (Gold et al. 2013, 2020; Hellermann et al. 2015; Prilop et al. 2020; Weber et al. 2018). Hinsichtlich ihrer Förderung zu Beginn des Vorbereitungsdienstes, wenn angehende Lehrkräfte kontinuierlich eigenen Unterricht geben und damit auch klassenführungsrelevante Unterrichtsereignisse erkennen und handhaben müssen, liegen unseres Wissens nach bislang aber kaum Studien vor.

In der vorliegenden Studie wurde daher eine videobasierte Intervention, die in der universitären Lehramtsausbildung die professionelle Wahrnehmung von Klassenführung erfolgreich fördern konnte (Gold et al. 2013, 2020; Hellermann et al. 2015; Prilop et al. 2020; Weber et al. 2018), für den Vorbereitungsdienst aufbereitet, implementiert und evaluiert. Ziel der Studie war es herauszufinden, inwiefern und unter welchen Bedingungen die Implementation einer solchen Intervention die klassenführungsspezifische professionelle Wahrnehmung der LAAs am effektivsten fördern kann.

2 Klassenführung

Klassenführung ist zentrales Qualitätsmerkmal effektiven Unterrichtens (Emmer und Stough 2001; Klieme et al. 2001) und hängt positiv mit der Lernmotivation (Kunter et al. 2007; Helmke 2007), der Leistung (Wang et al. 1990) und dem Kompetenzzuwachs (Baumert et al. 2003; Hattie 2012) der Lernenden zusammen.

Sie besteht aus verschiedenen Facetten, die sich in Monitoring (eher reaktiv), prozessuale Strukturierung sowie Regeln und Routinen (eher präventiv/proaktiv) einteilen lassen (Gold und Holodynski 2017; Harris 1991; Spoden und Fricke 2018). Präventive/proaktive Klassenführungsmaßnahmen haben den Vorteil, dass sie die Frequenz und Intensität von Störungen im Vorfeld minimieren. Treten jedoch Störungen des Unterrichts auf, hängt der weitere Unterrichtsverlauf mit der Angemessenheit der reaktiven Maßnahmen zusammen (Harris 1991).

Monitoring, zu dem die Unterfacetten Allgegenwärtigkeit, Überlappung und positive Präsenz zählen, umfasst die Art und Weise, wie Lehrkräfte das Geschehen im Unterricht wahrnehmen und wie sie darauf reagieren. Allgegenwärtigkeit beinhaltet dabei die fortwährende Wahrnehmungs- und Reaktionsfähigkeit bezüglich der Mitarbeit oder hinsichtlich des Störverhaltens von Schüler*innen (Kounin 1970). Zur Überlappung zählt die gleichzeitige Wahrnehmung und Regulierung simultan ablaufende Unterrichtsereignisse (ebd.; Simonsen et al. 2008). Mit positiver Präsenz ist gemeint, für die Kinder Interesse zu zeigen, wertschätzendes Feedback zu geben und sie für Lernerfolge sowie erwünschtes Verhalten zu loben (Everston und Emmer 2012).

Prozessuale Strukturierung fokussiert als zweite wesentliche Facette von Klassenführung auf die Sicherstellung eines steten Lernflusses (Anderson et al. 1979; Kounin 1970). Innerhalb einer Unterrichtsaktivität gehören dazu die Angemessenheit des Unterrichtstempos sowie des Anforderungsniveaus für die Schüler*innen. Zur Aufrechterhaltung einer hohen aktiven Mitarbeit haben sich Strategien der Gruppenmobilisierung und der Einforderung von Rechenschaft sowie eine qualifizierte Rückmeldung zum Lernen der Schüler*innen als wirksam erwiesen (Codding und Smyth 2008; Hine et al. 2015). Beim Übergang zwischen Unterrichtaktivitäten spielt dessen reibungslose Gestaltung eine wichtige Rolle (Anderson et al. 1979; Charles 2013; Kounin 1970).

Die Etablierung von Regeln und Routinen stellt die dritte Facette einer gelungenen Klassenführung dar (Everston und Emmer 1982; Emmer et al. 1980; Lester et al. 2017; Malone und Tietjens 2000). Etablierte Regeln und Routinen in Bezug auf einen schwungvollen Verlauf von Unterrichtsaktivitäten und deren reibungslose Übergänge erleichtern die prozessuale Strukturierung für die Lehrkraft und verschaffen ihr Zeit und Kapazität, sich um die Lernunterstützung und Regulierung einzelner Schüler*innen zu kümmern. Daher ist das Einführen und Einfordern solcher Regeln und Routinen bei Verstößen eine kontinuierliche Anforderung an die Lehrkraft auf dem Weg zu ihrer Etablierung (Elias und Schwaab 2006; Emmer und Gerwels 2006; Everston und Emmer 2012; Little und Akin-Little 2008; McGinnis et al. 1995).

3 Professionelle Wahrnehmung von Klassenführung

Um dieses Klassenführungswissen in entsprechendes Handeln umzusetzen, benötigen Lehrkräfte situationsspezifische Fähigkeiten (Blömeke et al. 2015; Meschede et al. 2017), die auch unter dem Begriff der professionellen Wahrnehmung zusammengefasst werden (Junker et al. 2020; Seidel und Thiel 2017; Sherin 2007; Sun und van Es 2015). Dass die Wahrnehmung von Lehrkräften mit entsprechenden Handlungsweisen oder sogar der Schülerleistung zusammenhängt, zeigten bereits einige Studien (Kersting et al. 2010, 2012; König und Kramer 2016; Roth et al. 2011). Zudem ist bekannt, dass zwischen Novizen und Experten deutliche Unterschiede hinsichtlich ihrer Wahrnehmung bestehen, was die Bedeutung der professionellen Wahrnehmung für den Professionalisierungsprozess unterstreicht (Wolff et al. 2017).

Die professionelle Wahrnehmung umfasst mehrere miteinander verbundene Fähigkeitsfacetten (Barth 2017). Im Allgemeinen unterscheiden Sherin und van Es (2009) hierbei zwei Facetten: das Erkennen sowie das theoriebasierte Begründen der lernrelevanten Unterrichtsereignisse. Das Begründen lässt sich wiederum in vier Subfacetten unterteilen. Dazu gehören (a) eine Beschreibung des Wahrgenommenen, (b) die eigentliche Interpretation des Wahrgenommenen auf der Basis des eigenen Professionswissens, (c) das situationsangemessene Bewerten, hinsichtlich der Lernförderlichkeit des Unterrichtsverlaufs sowie (d) die Fähigkeit, angemessene Handlungsalternativen generieren und gegeneinander abwägen zu können (Junker et al. 2020).

Personen, die Klassenführung professionell wahrnehmen, müssten also die oben beschriebenen Klassenführungsfacetten im Unterrichtsverlauf erkennen, beschreiben, interpretieren, bewerten und Handlungsalternativen modellieren können. Eine solche professionelle Unterrichtswahrnehmung könnte dann dazu genutzt werden, den eigenen Unterricht unter Klassenführungsgesichtspunkten prospektiv, simultan und retrospektiv zu optimieren.

4 Förderung der professionellen Wahrnehmung von Klassenführung durch Selbstvideographie

Die Wirksamkeit von Selbstvideographie mit anschließender Videoanalyse hinsichtlich der Förderung der professionellen Wahrnehmung von Klassenführung oder Klassenführungshandeln ist bereits vielfach belegt. Sherin und van Es (2009, 2010) konnten anhand von sogenannten Videoclubs für berufstätige Lehrkräfte zeigen, dass die Analyse des eigenen Unterrichts die professionelle Unterrichtswahrnehmung fördert. Gold et al. (2020) konnten in einer Interventionsstudie für Lehramtsstudierende zudem belegen, dass die Analyse des eigenen Unterrichts die professionelle Wahrnehmung von Klassenführung stärker verbesserte als die Analyse fremden Unterrichts.

Die positive Wirkung der Selbstvideographie auf die Klassenführung zeigte sich auch in einer Interventionsstudie mit LAAs im Vorbereitungsdienst aus der Sekundarstufe (Piwowar et al. 2016), bei der auf die Verbesserung ihrer Klassenführungsperformanz im Unterricht abgezielt wurde. Allerdings war die Stichprobe mit einem n = 43 eher klein, und es wurden auch weitere Methoden wie Micro-Teachings angewendet. Die LAAs verbesserten sich im Selbstbericht und im Fremdbericht von Unterrichtsbeobachter*innen hinsichtlich ihrer Klassenführung, nicht jedoch in den Berichten der unterrichteten Schüler*innen. Nicht analysiert wurde, inwiefern sich durch die Intervention auch die professionelle Unterrichtswahrnehmung bezüglich klassenführungsrelevanter Unterrichtsereignisse verbessert hatte.

Neben der Videoanalyse des eigenen Unterrichts durch die Akteure selbst scheint auch das Feedback Dritter, sei es von Lehrenden oder Peers, eine wesentliche Rolle zu spielen.

Dabei förderte ein Feedback zum eigenen videographierten Unterricht durch die Lehrenden, also Personen mit Unterrichtsexpertise, die professionelle Wahrnehmung von Lehramtsstudierenden in stärkerem Maße als ein Feedback durch Peers, und ein Feedback zu ihrem videographierten Unterricht erwies sich als effektiver als ein Face-to-Face-Feedback im Anschluss an einen klassischen Unterrichtsbesuch (Prilop et al. 2020; Weber et al. 2018, 2020).

Da Lehrkräfte mit einer professionelleren Unterrichtswahrnehmung letztendlich auch eine bessere Klassenführung zeigen (Bruckmaier et al. 2016; Kersting et al. 2012; König und Kramer 2016; Roth et al. 2011), sprechen die genannten Ergebnisse auch dafür, die professionelle Unterrichtswahrnehmung von LAAs im Vorbereitungsdienst mit Selbstvideographie und entsprechendem Feedback zu trainieren. Hierbei sollte die Wirksamkeit der videobasierten Analyse und Reflexion des eigenen Unterrichts geprüft werden. Vor allem, weil es bislang im Vorbereitungsdienst gängige Praxis ist, die Unterrichtsreflexion ausschließlich auf der Basis einer teilnehmenden Beobachtung während eines Unterrichtsbesuchs der Seminarleitungen und einem anschließenden Unterrichtsgespräch mit der bzw. dem LAA durchzuführen (Schubarth et al. 2007; Werner-Bentke 2010; Wyss 2008), ohne die Vorzüge videobasierter Unterrichtsanalysen für die Unterrichtsreflexion zu nutzen.

Beim Transfer dieser Erkenntnisse zur Selbstvideographie und zum Feedback auf den Vorbereitungsdienst sollte also die Analyse des eigenen Unterrichts auf einer konzeptuellen Einführung in die wesentlichen Facetten der Klassenführung (inklusive der Nutzung eines entsprechenden Maßnahmenkatalogs/Kodiermanuals) und einer Schulung der videobasierten Unterrichtsanalyse beruhen. Im Nachgang sollten die LAAs ihre Videoanalysen mit Peers bzw. den Kernseminarleitungen (KSL) reflektieren und entsprechendes Feedback erhalten.

5 Implementation von Innovationen in den Vorbereitungsdienst

Der Vorbereitungsdienst für das Lehramt soll die angehenden Lehrkräfte darin qualifizieren, grundlegende Kompetenzen in den Bereichen Unterrichten, Erziehen, Beurteilen und Innovieren zu erwerben und zu festigen (Drüge et al. 2014). Speziell zu den Bereichen Unterrichten und Erziehen gehört auch der Erwerb einer effektiven Klassenführung, die eine professionelle Wahrnehmung klassenführungsrelevanter Unterrichtsereignisse voraussetzt.

Während die grundsätzliche inhaltliche Ausrichtung der zweiten Ausbildungsphase in Form des jeweiligen Kerncurriculums (z. B. MSW NRW 2016) und des Referenzrahmens für Schulqualität (z. B. MSB NRW 2020) vorgegeben sind, kann die konkrete und methodische Ausgestaltung der verschiedenen Studienseminare durch die Ausbildungsstandorte in Abstimmung mit den zuständigen Schulbehörden relativ eigenständig vorgenommen werden. Dadurch können auch Innovationen aus der universitären Lehramtsausbildung in den Vorbereitungsdienst implementiert und evaluiert werden. Dies erfordert jedoch eine intensive Kommunikation und Absprache zwischen den Akteuren der universitären Lehre und denen der Studienseminare (Schneider 2019; Slavin 2020; Souvignier 2021; Spiel 2020). Inwiefern die Interaktion zwischen Hochschule und Studienseminar eine erfolgreiche Implementation der Innovation zur Folge hat, lässt sich nach Grimshaw et al. (2006) sowie Michie et al. (2005, 2009) anhand von acht Indikatoren erheben, nämlich Akzeptanz, Übernahme, Angemessenheit, Machbarkeit, Wiedergabetreue, Kosten, Durchdringung und Nachhaltigkeit. (1) Akzeptanz wird als Ansicht der Beteiligten verstanden, dass eine Intervention passend und erfolgreich ist bzw. sein wird. (2) Übernahme ist die Intention, eine Intervention wirklich in der Praxis umzusetzen. (3) Angemessenheit wird als Zusammenpassen der Intervention und des vorgesehenen Kontextes definiert. (4) Unter Machbarkeit wird der erfolgreiche Einsatz der Intervention im vorgesehenen Kontext verstanden, wohingegen als (5) Wiedergabetreue die Umsetzung der Intervention entsprechend vorher gesetzter Vorgaben gesehen wird. (6) Kosten beziehen sich auf die inkrementellen sowie implementationsbedingten Aufwände, die mit einer Intervention einhergehen. (7) Durchdringung beschreibt die Einbeziehung der Maßnahme in eine spezifische Einrichtung, die üblicherweise anhand des prozentualen Anteiles der teilnehmenden Akteure festgestellt wird. (8) Nachhaltigkeit wird zuletzt definiert als der Umfang der dauerhaften strukturellen Verankerung einer Intervention in eine Institution (Petermann 2014).

Diese Überlegungen sind auch bei der Implementation einer Lehrinnovation zur Selbstvideographie im Vorbereitungsdienst zu berücksichtigen. Obwohl unseres Wissens diesbezüglich noch keine empirischen Studien vorliegen, ist aufgrund der oben erwähnten Indikatoren zu erwarten, dass Standorte, bei denen die Seminarleitungen sowie die institutionellen Kontextbedingungen eine höhere Ausprägung der genannten Implementationsindikatoren zeigen, eine Schulung der professionellen Wahrnehmung der LAAs erfolgreicher sein wird als bei einer niedrigeren Ausprägung.

6 Ziele der Studie

Die vorliegende Studie verfolgt auf der Grundlage der vorangegangenen Überlegungen drei Fragestellungen hinsichtlich der Implementation einer videobasierten Intervention zur Förderung der professionellen Wahrnehmung von Klassenführung im Vorbereitungsdienst.

Fragestellung 1

Welchen Effekt hat videobasiertes Feedback im Vorbereitungsdienst auf die professionelle Wahrnehmung von Klassenführung im Vergleich zu traditionellen Unterrichtsnachbesprechungen?

Hypothese 1

Es wird angenommen, dass sich die professionelle Wahrnehmung von LAAs in stärkerem Maße verbessert, wenn sie eine eigene Unterrichtsstunde videographieren, das Video anhand von Klassenführungskategorien analysieren und dazu Feedback von ihren Peers oder ihrer KSL erhalten, als wenn sie von ihr nur Feedback direkt im Anschluss an eine durchgeführte und von ihr beobachtete Unterrichtsstunde erhalten. Letzteres Feedback kann nur auf der Basis von Erinnerungen und Mitschriften gegeben werden. Demgegenüber ermöglicht eine videobasierte Analyse eine wiederholte und vertiefte Analyse des realen Unterrichtsgeschehens, die eine stärker situierte Wahrnehmung fördert (Gold et al. 2020; Weber et al. 2020).

Fragestellung 2

Welchen Effekt hat videobasiertes Experten-Feedback im Vorbereitungsdienst auf die professionelle Wahrnehmung von Klassenführung im Vergleich zu videobasiertem Peer-Feedback?

Hypothese 2

Angelehnt an die Studien von Prilop et al. (2020) sowie Weber et al. (2018) wird angenommen, dass KSL aufgrund ihrer größeren Expertise gegenüber Peers ein effizienteres Feedback geben können als Peers mit der Folge, dass sich die professionelle Wahrnehmung von Klassenführung in der Gruppe mit Expertenfeedback stärker verbessert als in der Gruppe mit Peerfeedback.

Fragestellung 3

Welchen Effekt hat die Güte der Implementation auf die Effektivität der Klassenführungsintervention im Vorbereitungsdienst?

Hypothese 3

Es wird erwartet, dass Standorte, die eine höhere Implementationsgüte im Sinne der in Abschn. 4 beschriebenen Indikatoren (Grimshaw et al. 2006; Michie et al. 2005, 2009) zeigen, zu einer erfolgreicheren Förderung der professionellen Unterrichtwahrnehmung beitragen als Standorte mit einer geringeren Implementationsgüte.

7 Methode

7.1 Stichprobe

Bezüglich der Förderung der professionellen Wahrnehmung wurde auf der Grundlage bisheriger Studienergebnisse in den drei Gruppenvergleichen (Fragestellung 1–3) von mittleren (f = 0,25) bis großen Effektstärken (f = 0,40) ausgegangen (also im Mittel f = 0,33, Cohen 1992). Dafür war bei einer ANOVA mit Messwiederholung (between factors) nach G*Power-Berechnung (power = 0,95) eine Stichprobe von 92 LAAs notwendig. Da 121 LAAs für die Studie akquiriert werden konnten entsprach dies den Empfehlungen von G*Power. Die LAAs wurden aus dem Grundschullehramt rekrutiert und absolvierten an drei unterschiedlichen nordrheinwestfälischen Zentren für schulpraktische Lehrerbildung (ZfsL) ihren Vorbereitungsdienst. Diese Zentren erfüllen die Funktion eines Studienseminars und stellen im Rahmen eines 18-monatigen Vorbereitungsdienstes den institutionellen Rahmen für die zweite Phase der Lehrerbildung zur Verfügung.

Die Gruppe der LAAs bestand aus 109 weiblichen und 12 männlichen Teilnehmenden, die im Durchschnitt 26,32 Jahre alt waren (SD = 2,84). Dies entsprach 95 % der gesamten Kohorte an LAAs der drei teilnehmenden ZfsL für Grundschulen. Der Anteil der männlichen Lehrkräfte lag mit ca. 10 % in der Stichprobe in etwa so hoch wie in der Gesamtpopulation an Grundschullehrkräften (ca. 9 %, DESTATIS 2019).

Im Prätest gaben die LAAs an, dass sie bereits mittelmäßige Kenntnisse im Bereich der Klassenführung (M = 2,98; SD = 0,96) und der Videoanalyse (M = 2,45; SD = 1,17) auf einer Skala von 1 bis 5 besaßen. Die berichtete bisherige Unterrichtspraxis wies eine extreme Spanne von 0 bis 1500 Unterrichtsstunden bei einer sehr linkssteilen Verteilung auf. Das erste Quartil der LAAs (0–25 %) gab bis zu 17 h Unterrichtspraxis an, das zweite Quartil (25–50 %) bis zu 30 h und das dritte Quartil (50–75 %) bis zu 80 h an.

Bezüglich der Gruppenverteilungen, die im folgenden Abschnitt genauer beschrieben wird, waren hinsichtlich Fragestellung 1 (alle Teilnehmenden, außer Dropouts) 55 LAAs der Selbstvideographiegruppe und 26 LAAs der Unterrichsbesuchsgruppe zugeordnet. Hinsichtlich Fragestellung 2 (nur Selbstvideographiegruppe) waren 33 LAAs der Peer-Gruppe und 20 LAAs der KSL-Gruppe zugewiesen. Bezüglich Fragestellung 3 (alle Teilnehmenden, außer Dropouts) stammten 50 LAAs aus Implementationstyp-A-Gruppe und 31 LAAs aus Implementationstyp-B-Gruppe.

7.2 Untersuchungsdesign und Intervention

Untersuchungsgruppen

Die vorliegende Studie wurde im ersten Jahr des Vorbereitungsdienstes als Intervention durchgeführt und mit Hilfe eines (quasi-)experimentellen Prä-Post-Kontrollgruppen-Designs (hinsichtlich Fragestellung 1 und 2) evaluiert. Die Zuordnung zu den beiden Interventionsgruppen (videobasiertes Feedback zum eigenen Unterricht durch die KSL versus durch den Peer-Tandempartner) erfolgte in randomisierter Weise. Nur die Zuordnung zur Unterrichtsbesuchsgruppe, die als Kontrollgruppe fungierte, konnte nicht randomisiert umgesetzt werden, da sie durch jene LAAs gebildet wurde, deren Schulleitungen die Selbstvideographie aufgrund datenschutzrechtlicher Bedenken nicht gestatteten. Da diese Zuweisung durch die Entscheidung der jeweiligen Schulleitung und nicht der jeweiligen LAAs verursacht war, wurde von keinem systematischen Selektionseffekt ausgegangen. Die Unterrichtsbesuchsgruppe erhielt Feedback zur gleichen Anzahl an Unterrichtsstunden wie die Selbstvideographiegruppe (bestehend aus Peer-Gruppe und KSL-Gruppe), nur in Form der üblichen Einsichtnahme in den Unterricht, bei der die KSL den Unterricht beobachtete und anschließend mit den LAAs reflektierte.

Beschreibung der Intervention

Das Training der Untersuchungsgruppen, das als eine einjährige Intervention für die LAAs angekündigt wurde, gliederte sich in drei Teile.

Teil 1: erste Unterrichtsaufnahme. Der erste Teil (nur Peer-Gruppe und KSL-Gruppe) bestand, nach Einholung der Einverständniserklärungen von Schulleitung, Eltern und Ministerium, aus der audiovisuellen Aufnahme einer selbst durchgeführten Unterrichtsstunde.

Teil 2: Vorbereitungsblöcke. Der zweite Teil (alle drei Gruppen) bestand aus zwei vierstündigen Vorbereitungsblöcken mit den sechs einzelnen Kernseminaren, die im Abstand von etwa zwei Wochen stattfanden. Im ersten Vorbereitungsblock erhielten die LAAs aller Untersuchungsgruppen eine Einführung in die Facetten der Klassenführung (Monitoring, Strukturierung und Etablierung von Regeln und Routinen) anhand einer Materialsammlung von Texten und Anleitungen (abrufbar unter https://go.wwu.de/ye3da). Das Lernziel war, die LAAs mit der Analyse und Reflexion von Klassenführung im Unterricht anhand videographierter Unterrichtsvideos vertraut zu machen. Dazu enthielten sie ein validiertes Kodiermanual zur Klassenführung im Unterricht (abrufbar unter https://go.wwu.de/4bxe2) und zu den vier Analyseschritten der professionellen Wahrnehmung (Beschreibung, Interpretation und Bewertung der ausgewählten Unterrichtsereignisse sowie die Formulierung einer begründeten Handlungsalternative zum beobachteten Lehrerverhalten) (s. unten). Daran schlossen sich videobasierte Analyseübungen im Plenum und in Tandems an, und zwar von bis zu sieben ausgewählten Unterrichtsclips aus dem Sach- und Mathematikunterricht der Grundschule, die mit Hilfe des Kodiermanuals und den vier Schritten der Unterrichtswahrnehmung hinsichtlich der Klassenführung der Lehrkraft analysiert wurden. Im zweiten vierstündigen Vorbereitungsblock analysierten die LAAs der ZfsL 1 und 2 in Tandemgruppen vier weitere Fremdvideos, die sie aus einem Pool an Videoclips nach Bedarf und Interesse auswählen konnten. Im ZfsL 3 erhielten die LAAs wie in der universitären Intervention die Möglichkeit, ihren eigenen Unterricht in Tandemgruppen probeweise zu analysieren (Abb. 1).

Abb. 1
figure 1

Ablauf der Intervention in den drei Untersuchungsgruppen. (Der Begriff „KSL“ steht für die Kernseminarleitungen, die das Kernseminar der Lehramtsanwärter*innen in der zweiten Phase ihrer Ausbildung leiten. Das Wort „Peer“ steht für Lehramtsanwärter*innen in der gleichen Phase des Ausbildungsprozesses)

Teil 3: zweite Unterrichtsaufnahme und zwei Reflexionsgespräche. Der dritte Teil der Intervention (nur Peer-Gruppe und KSL-Gruppe) dauerte bis zu 10 Monate und umfasste die Unterrichtsreflexion der anfangs videographierten Unterrichtsstunde sowie einer weiteren videographierten Unterrichtsstunde in der Mitte des Vorbereitungsdienstes. Dazu sollten die LAAs ihre videographierten Stunden anhand der eingesetzten Unterrichtsaktivitäten (Instruktion, Unterrichtsgespräch, Einzelarbeit, Partnerarbeit etc.) segmentieren und mit Hilfe des im ersten Vorbereitungsblock eingeführten Kodiermanuals bzgl. der beobachteten Klassenführungsfacetten beschreiben, interpretieren, auf ihre Angemessenheit hin bewerten und begründete Handlungsalternativen zu ihrem gezeigten Lehrerverhalten formulieren. Die schriftliche Dokumentation dieser Analyse wurde dann (gemeinsam mit dem Unterrichtsvideo) dem Reflexionspartner (KSL oder Peer-Tandempartner) über ein geschütztes Cloudsystem (https://hochschulcloud.nrw/) für die gemeinsame Reflexion zur Verfügung gestellt.

Wenn die LAAs ihre Analyse mit einem Peer-Tandempartner reflektierten, gehörte zur Vorbereitung auf das Reflexionsgespräch auch die Rezeption und Evaluation der Analyse des Tandempartners. Die Reflexionsgespräche fanden in Präsenz statt und wurden auf der Grundlage eines strukturierten Impulsfragenkataloges zu den Facetten Monitoring, Strukturierung sowie Etablierung von Regeln und Routinen (s. Supplement) durchgeführt. Zudem enthielt der Fragenkatalog eine Frage zur Gesamteinschätzung der Klassenführung sowie zur Einleitung nächster Schritte bezüglich der eigenen Kompetenzentwicklung. Für das Gespräch standen 60 min zur Verfügung, wobei die Zeit im Rahmen der Peergespräche auf 30 min pro Person aufgeteilt wurde.

Im Nachgang des ersten Reflexionsgespräches fand in den darauffolgenden drei Monaten eine weitere Unterrichtsaufnahme statt, welche dann unter den gleichen Bedingungen reflektiert wurde. In der Unterrichtsbesuchsgruppe wurden in derselben Zeit zwei reguläre Unterrichtsbesuche mit personenzentrierter Unterrichtsnachbesprechung durchgeführt. Insgesamt umfasste die Lernzeit der zwei Videographiegruppen etwa 14 h (2 × 4 h Vorbereitungsblock, 2 × 1 h Unterrichtsdurchführung, 2 × 1 h videobasierte Unterrichtsanalyse, 2 × 1 h Unterrichtsreflexion). Demgegenüber betrug die Lernzeit der Unterrichtsbesuchsgruppe etwa 12 h (2 × 4 h Vorbereitungsblock, 2 × 1 h Unterrichtsdurchführung, 2 × 1 h Unterrichtsreflexion).

Implementationsgüte

Da die Intervention in bereits bestehende Strukturen des Vorbereitungsdienstes implementiert wurde, wurde die Implementationsgüte mitbetrachtet. Dabei zeigten die drei ZfsL ein unterschiedliches Maß (Fragestellung 3). Bei der Bewertung der Implementationsgüte wurden (bis auf Akzeptanz) alle Implementationskriterien berücksichtigt.

Bezüglich der Angemessenheit der Inhalte und Methoden des Förderkonzepts wurde von allen ZfsL-Mitarbeitenden in protokollierten Gruppendiskussionen eine Passung, Kompatibilität und Aktualität der Klassenführungsthematik und der Selbstvideographie festgestellt. An den Standorten 1 und 2 wurde jedoch im Gegensatz zu Standort 3 im Rahmen von protokollierten Fokusgruppen die formale Kompatibilität der Intervention aufgrund der fehlenden Freiwilligkeit zur Studienteilnahme und der geringen zeitlichen Ressourcen der LAAs kritisch bewertet.

Bezüglich der Machbarkeit zeigte sich eine vergleichbare Differenz zwischen den Standorten. Aufgrund der geringen Zeitressourcen auf Seiten der LAAs und konkurrierenden Aufgaben schätzten die Mitarbeitenden in ZfsL 1 und 2 die Machbarkeit in den Gruppendiskussionen insgesamt weniger gut ein als ZfsL 3.

Zur Übernahme des Förderkonzepts ergaben sich korrespondierende Unterschiede, die anhand von organisatorischen und konzeptionellen Indikatoren nachvollzogen wurden. Alle drei ZfsL übernahmen die beiden Vorbereitungsblöcke. ZfsL 3 integrierte darüber hinaus die Analysekategorien mit dem ausgearbeiteten Materialpaket als Grundlage für ihr Kernseminarcurriculum, während ZfsL 1 und 2 ihr Kernseminarcurriculum diesbezüglich unverändert ließen.

Hinsichtlich der Wiedergabetreue der beiden Vorbereitungsblöcke ergaben sich in protokollierten Gruppendiskussionen der ZfsL-Mitarbeitenden aufgrund unterschiedlicher Einschätzungen der Machbarkeit die folgenden standortspezifischen Anpassungen: In den ZfsL 1 und 2 wurde der aus der universitären Lehrerbildung stammende, bewährte erste Vorbereitungsblock mit Fremdvideoanalysen in das Kernseminarcurriculum des Vorbereitungsdienstes implementiert. Der zweite Vorbereitungsblock mit Eigenvideoanalysen musste jedoch aus Machbarkeitserwägungen ohne die Eigenvideos der LAAs auskommen und wurde daher ebenfalls mit Fremdvideoanalysen angereichert. In ZfsL 3 wurde der zweite Vorbereitungsblock originalgetreu mit der Analyse des Eigenvideos angeleitet.

Der Grad der Durchdringung wurde anhand der LAAs, die eine Selbstvideographie anfertigten, gemessen. Er war in ZfsL 3 mit 82 % wesentlich höher war als in ZfsL 1 (21 %) und 2 (38 %). Standortbezogene Kosten waren nach Angaben der ZfsL-Mitarbeitenden in den Gruppendiskussionen für alle ZfsL gleich gering, da die Infrastruktur (Kamera-Equipment und gesicherter Clouddienst für die gespeicherten Videoaufnahmen) und Fortbildner*innen durch die Universität gestellt wurde. Im Sinne der Nachhaltigkeit wurde an allen Standorten die freiwillige Möglichkeit geschaffen, dass LAAs ihren Unterricht videographieren und mit ihren KSL reflektieren konnten.

Auf der Grundlage des kriterienbasierten Standortvergleichs ließen sich zwei verschiedene Implementationstypen (A und B) identifizieren. Da die LAAs bereits vor dem Feststellen der Implementationsgüte einem spezifischen ZfsL zugeordnet waren, konnte keine randomisierte Zuordnung realisiert werden. Daher wurden die in Abschn. 7.4.2 beschriebenen personenbezogenen Variablen erfasst und zur Kontrolle der quasi-experimentellen Gruppenzugehörigkeit genutzt. Abb. 2 verdeutlicht die Zugehörigkeit der LAAs zu den Untersuchungsgruppen und den Implementationstypen.

Abb. 2
figure 2

Verteilung der LAAs auf die drei Untersuchungsgruppen in den Zentren für schulpraktische Lehrerbildung (ZfsL) und die beiden Implementationstypen. („ZfsL“ wird als Abkürzung für die in Nordrhein-Westfalen befindlichen Studienseminare mit der Bezeichnung „Zentren für schulpraktische Lehrerbildung“ verwendet. Der Begriff „KSL“ steht für die Kernseminarleitungen, die das Kernseminar der Lehramtsanwärter*innen in der zweiten Phase ihrer Ausbildung leiten. Das Wort „Peer“ steht für Lehramtsanwärter*innen in der gleichen Phase des Ausbildungsprozesses)

7.3 Messinstrumente

Eine Woche nach Beginn des Vorbereitungsdienstes nahmen die LAAs aller Gruppen im Rahmen des Prätests an einer 90-minütigen Online-Befragung über Unipark (www.unipark.com) teil, bei der die unten beschriebenen Instrumente zur Erfassung der relevanten Konstrukte eingesetzt wurden. Nach der Intervention, das heißt nach 12 Monaten und noch vor Beginn des Prüfungsblocks im Vorbereitungsdienst, wurde die Online-Befragung erneut als Posttest durchgeführt.

7.3.1 Professionelle Wahrnehmung von Klassenführung

Zur Online-Befragung gehörte die Erhebung der professionellen Wahrnehmung von Klassenführung. Um diese mit den vier Analysefacetten zu erfassen, wurde der videobasierte Test von Hörter et al. (im Druck) eingesetzt, dessen Konstruktvalidität in einer umfangreichen Validierungsstudie bestätigt wurde. Der Test besteht aus einem durch Expert*innen validierten Unterrichtsclip, den die Proband*innen in einem offenen Antwortformat anhand der vier Analysefacetten der Unterrichtswahrnehmung analysierten. Im Gegensatz zu einem geschlossenen Antwortformat eröffnet ein offenes Antwortformat die Möglichkeit, nicht nur den Schritt der Interpretation der klassenführungsrelevanten Unterrichtsereignisse, sondern auch die anderen drei Schritte, nämlich das Erkennen klassenführungsrelevanter Unterrichtsereignisse, die Bewertung ihrer Angemessenheit sowie die Formulierung angemessener Handlungsalternativen, zu erfassen (Junker et al. 2020).

Auswahl des Videoclips und die Validierung des Expertenratings

Der verwendete Clip stammt aus dem Videoportal ProVision (https://www.uni-muenster.de/ProVision/), hat eine Länge von 4:31 min und besteht aus einem Zusammenschnitt einer Mathematikstunde in einer ersten Jahrgangsstufe zu Rechenmauern, die mehrere Unterrichtsaktivitäten mit Übergängen beinhaltet. Dazu gehört eine einführende Aufmerksamkeitsfokussierung, ein Unterrichtsgespräch und eine Lehrerinstruktion mit anschließender Partnerarbeit. Die klassenführungsrelevanten Unterrichtsereignisse wurden mit Hilfe eines Expertenratings (in Anlehnung an Blömeke et al. 2015; Gold und Holodynski 2017; Seidel et al. 2010) kodiert und das Rating durch sechs Expert*innen validiert (vier ausgewiesene Unterrichtsforscher*innen und zwei erfahrene Lehrkräfte), welche die identifizierten klassenführungsrelevanten Unterrichtsereignisse und Interpretationen anhand des Videos überprüften, bestätigten, gegebenenfalls zurückwiesen und/oder ergänzten. Im Ergebnis wurden 14 der 84 Interpretationen überarbeitet.

Durchführung des offenen, videobasierten Tests

Im Rahmen der Befragung sahen die LAAs den Videoclip zweimal. Beim ersten Durchgang wurde der Clip zur Orientierung ohne Instruktion gezeigt, anschließend lasen sie eine Beschreibung der Klassenführungsfacetten und sahen dann den Clip ein zweites Mal. Anschließend hatten sie 45 min Zeit, in einem offenen Antwortformat (1) zu beschreiben, welche klassenführungsrelevanten Unterrichtsereignisse sie wahrgenommen hatten, (2) diese Ereignisse mittels der beschriebenen Klassenführungskategorien zu interpretieren, (3) das Lehrerhandeln hinsichtlich seiner Angemessenheit zu bewerten sowie (4) sinnvolle Handlungsalternativen zu generieren. Auf diese Weise entstanden offene Videoanalysen, die sich jeweils auf selbst ausgewählte Unterrichtssequenzen des Videoclips bezogen.

Auswertung der offenen Videoanalysen

Die Analysen der LAAs im Prä- und Posttest wurden mit Hilfe einer strukturierten qualitativen Inhaltsanalyse ausgewertet (Mayring 2015), die dem Auswertungsmanual von Junker et al. (2020) folgte. Jede analysierte Unterrichtssequenz wurde anhand des Expertenratings nach folgendem Schema ausgewertet: (1) Für die Beschreibungsfacette erhielten die LAAs einen Punkt für jedes beschriebene Unterrichtsereignis, das im Expertenrating als klassenführungsrelevant eingestuft wurde. (2) Die Interpretationsfacette wurde auf einer Skala von 0 (fehlende Analyse) bis 4 (Analyse stimmte mit dem Expertenrating überein, die zutreffenden Fachbegriffe wurden verwendet, eine Begründung angeführt) eingestuft. (3) Die Bewertungsfacette wurde auf einer Skala von 0 (fehlende Bewertung) bis 3 (die zutreffenden Fachbegriffe wurden verwendet, eine Begründung angeführt) eingeschätzt und (4) die Facette der formulierten Handlungsalternativen auf einer Skala von 0 (fehlende Handlungsalternative) bis 5 (die zutreffenden Fachbegriffe wurden verwendet, eine Begründung angeführt, ein Themenbezug hergestellt, mehrere Optionen diskutiert). Aus dieser Auswertung wurden pro LAAs die folgenden Maße für die Güte der professionellen Wahrnehmung berechnet: (1) die Anzahl an klassenführungsrelevanten Beschreibungen, (2) die gemittelte Güte der Interpretationen (0 bis 4 Punkte), (3) die gemittelte Güte der Bewertungen (0 bis 3 Punkte) und (4) die gemittelte Güte der Handlungsalternativen (0 bis 5 Punkte).

Objektivität und Reliabilität der Analysen

Drei trainierte Beurteiler*innen schätzten die offenen Videoanalysen von 30 zufällig ausgewählten LAAs (25 % der Stichprobe) anhand des beschriebenen Auswertungsmanuals in randomisierter Reihenfolge ein, ohne Wissen über die Zugehörigkeit zum Prä- und Posttest sowie zu den Untersuchungsgruppen. Sowohl für den Prä- als auch für den Posttest lagen dabei gute bis sehr gute Beurteilerübereinstimmungen vor (Fleiss’ Kappa: Anzahl erkannter relevanter Ereignisse prä = 0,96, post = 0,90; Intraklassenkoeffizienten (ICC): Interpretationsgüte prä = 0,93, post = 0,87; Bewertungsgüte prä = 0,98, post = 0,95; Güte der Handlungsalternativen prä = 0,99, post = 0,94) (Koo und Li 2016; Landis und Koch 1977).

Bezüglich der Reliabilität wiesen die vier Schritte der professionellen Wahrnehmung von Klassenführung zum Prätest und Posttest eine gute interne Konsistenz auf (Cronbachs α = 0,78 (Prätest); 0,82 (Posttest)) auf.

7.3.2 Variablen zur Kontrolle individueller Unterschiede in den Ausgangsbedingungen

Da die Zuweisung der LAAs zu den Implementationsbedingungen nicht randomisiert erfolgen konnte, wurden personenbezogene Variablen erfasst. Dabei wurden dispositionale Variablen (Motivation, Ambiguitätstoleranz, Vorwissen der LAAs) und Prozessvariablen (Umfang und subjektiv bewerteter Nutzen der Videoanalysen) miteinbezogen.

Intrinsische Motivation zur Teilnahme

Die Motivation zur Teilnahme an der Studie wurde mit Hilfe der Kurzskala zur intrinsischen Motivation (Wilde et al. 2009) erfragt, bei der die LAAs zwölf Items wie z. B. „Das Ausbildungsmodul zur Klassenführung wird mir Spaß machen“ auf einer Skala von 1 (stimmt gar nicht) bis 5 (stimmt völlig) einschätzten. Hiermit sollten Selbstselektionseffekte der Gruppenzugehörigkeit und damit verbundene potenzielle höhere Lernzuwächse kontrolliert werden. Die interne Konsistenz der Skala lag im zufriedenstellenden Bereich (Cronbachs α = 0,80).

Ambiguitätstoleranz

Die Skala zur Ambiguitätstoleranz wurde miteinbezogen, weil davon auszugehen war, dass die Akzeptanz differierender Perspektiven, wie sie auch bei einer gemeinsamen Analyse von eigenen Unterrichtsvideos durch die LAAs und die KSL bzw. Peers auftreten können, eine Rolle bei der Förderbarkeit der professionellen Wahrnehmung durch Feedback zur Selbstvideographie spielen könnte. Eine geringe Ambiguitätstoleranz könnte demnach den subjektiv empfundenen Nutzen einer Videoanalyse beeinträchtigen, da sich manche Unterrichtsereignisse nicht eindeutig interpretieren lassen. Die Ambiguitätstoleranz (Kirton 1981) wurde durch die Zustimmung zu sieben Items wie z. B. „Ein Experte, der nicht mit einer eindeutigen Antwort auf eine Frage reagiert, weiß wahrscheinlich nicht sehr viel“ (negative Polung) auf einer Skala von 1 („stimme ganz und gar nicht zu“) bis 9 („stimme voll und ganz zu“) erfragt. Die interne Konsistenz der Skala lag im akzeptablen Bereich (Cronbachs α = 0,72).

Vorwissen zu den Themen Klassenführung und Erfahrungen mit Videoanalysen

Da davon ausgegangen wurde, dass das Vorwissen und Analysefähigkeiten den Lernprozess fördern könnten, wurde einerseits das Vorwissen zum Thema „Klassenführung“ mit einem Item erfragt: „Ich habe mich bereits im Studium eingehend mit dem Thema Klassenführung beschäftigt.“ Andererseits wurde mit dem Item „Ich habe im Studium bereits viele Unterrichtsvideos analysiert.“ geprüft, inwiefern sich die LAAs schon mit der Analyse von Videos auseinandergesetzt hatten. Die Items wurden auf einer Skala von 1 („trifft gar nicht zu“) bis 5 („trifft voll und ganz zu“) eingeschätzt.

Zeitlicher Umfang und Ertrag der Videoanalysen

Die LAAs sollten den zeitlichen Umfang angeben, den sie für jede Analyse ihrer Unterrichtsaufnahmen benötigten („Wie viele Zeitstunden haben Sie in etwa in die Analyse investiert?“). Daraus wurde ein Summenwert der Videoanalysezeit gebildet. Zudem wurde nach dem Ertrag der Videoanalyse gefragt („Wie gewinnbringend war die Reflexion der [ersten/zweiten] Aufnahme für Ihre Klassenführung?“). Aus den beiden Angaben wurde der Mittelwert errechnet. Es wurde gemutmaßt, dass jenseits der Gruppenzugehörigkeit (Peer-Gruppe vs. KSL-Gruppe) sowohl der Zeitumfang als auch der subjektive Ertrag der Videoanalysen direkten Einfluss auf den Lernerfolg haben können.

7.4 Datenauswertung

Bezüglich eines möglichen selektiven Stichprobenausfall vom Prä- zum Posttest wurde einerseits überprüft, ob der vorhandene Stichprobenausfall mit relevanten Untersuchungsvariablen zusammenhing. Dazu wurden zum Prätest t‑Tests zwischen der Gruppe, die am Prä- und Posttest teilgenommen hatte, und der Gruppe, die nur am Prätest teilgenommen hatte, gerechnet. Andererseits wurde mit Hilfe eines Chi-Quadrat-Tests kontrolliert, ob es in den drei Untersuchungsgruppen ein unterschiedliches Ausmaß an Dropouts gab. Die gruppenbezogenen Veränderungen der professionellen Wahrnehmung wurden mit Hilfe von Varianzanalysen mit Messwiederholung analysiert. Alle Berechnungen wurden mit dem Programms IBM SPSS Statistics 25 (IBM 1983–2017) durchgeführt. Die p-Werte wurden je Testreihe bzw. je Hypothese nach Bonferroni-Holm-Korrektur modifiziert, um einer α‑Fehler-Kumulierung entgegenzuwirken (Holm 1979).

8 Ergebnisse

8.1 Selektiver Stichprobenausfall

Von den 121 LAAs bearbeiteten 81 den Prä- und Posttest. Dies entspricht einem Dropout von 33 %. Es zeigte sich insofern ein leichter systematischer Stichprobenausfall, dass die LAAs, die auch den Posttest ausfüllten („Remainer“), im Vergleich zu denen, die ihn nicht ausfüllten („Dropouts“), beim Prätest bereits mehr Vorwissen im Umgang mit Videoanalysen sowie mehr Beschreibungen von Unterrichtsereignissen im offenen Unterrichtswahrnehmungstest aufwiesen. Ebenso beschrieben die „Remainer“ mehr Ereignisse, bewerteten jedoch weniger als die „Dropouts“. Keiner dieser Unterschiede war jedoch signifikant (Tab. 1).

Tab. 1 Mittelwertsunterschiede zu Beginn der Untersuchung zwischen den Proband*innen, die nur den Prätest bzw. Prä- und Posttest bearbeiteten

Es zeigten sich aber selektive Stichprobenausfälle vor allem in der Gruppe, die reguläre Unterrichtsbesuche erhielt im Gegensatz zur Gruppe, die sich selbst videographierte (χ2 = 29,07, p < 0,01). Ein ebenfalls erhöhter Dropout zeigte sich in der Implementationstyp-A-Gruppe im Unterschied zur Implementationstyp-B-Gruppe (χ2 = 5,69, p = 0,16). Ein systematischer Dropout zwischen den Feedbackgruppen bestand nicht (χ2 = 0,29, p = 1,00). Die selektiven Dropouts in den ersten beiden Gruppenvergleichen können nicht auf signifikante motivationale Unterschiede der Teilnehmenden zum Prätest der Intervention zurückgeführt werden (Unterrichtsbesuch vs. Selbstvideographie: t (118) = 1,49, p = 0,42, Implementationstyp A vs. Implementationstyp-B-Gruppe: t (118) = 0,03, p = 1,00).

Der Stichprobenausfahl hatte Einfluss auf die Power der drei folgenden Analysen. Trotz der Akquise einer entsprechenden Anzahl von LAAs konnte dadurch nur bei der Analyse von Fragestellung 3 das Mindestmaß an Power erreicht werden (power > 0,80, Cohen 1988). Aus deskriptiven Gründen werden nachfolgend jedoch auch die Ergebnisse der Fragestellungen 1 und 2 berichtet.

8.2 Vergleich zwischen Selbstvideographie- und Unterrichtsbesuchsgruppe

Zum Prätest ließen sich keine Unterschiede zwischen der Selbstvideographiegruppe und der Unterrichtsbesuchsgruppe beobachten, und zwar hinsichtlich aller Kontrollvariablen: intrinsische Motivation (t (118) = 1,49, p = 0,56), Ambiguitätstoleranz (t (118) = 0,71, p = 1,00), Vorwissen zum Thema Klassenführung (t (118) = 0,28, p = 1,00) und Vorwissen zur Analyse von Videos (t (118) = −0,60, p = 1,00). Somit ist, wie erwartet, von keiner systematischen Selbstselektion bezüglich der Untersuchungsgruppen zum Prätest auszugehen.

Tab. 2 zeigt, inwiefern die professionelle Wahrnehmung von Klassenführung durch die regulären zwei Unterrichtsbesuche gegenüber den beiden Selbstvideographien gefördert werden konnte. Demnach zeigten sich keine der erwarteten Interaktionseffekte zwischen Messzeit und Interventionsgruppe. Die Güte der Handlungsalternativen verringerte sich sogar signifikant bei den Personen, die die Selbstvideographie durchgeführt hatten, im Unterschied zu denen der Unterrichtsbesuchsgruppe, die sich nicht veränderte.

Tab. 2 Mittelwerte (M) und Standardabweichungen (SD) der professionellen Wahrnehmung in der Unterrichtsbesuchs- und Selbstvideographiegruppe zum Prä- und Posttest sowie die Interaktionseffekte zwischen Messzeit und Gruppe

Ein signifikanter Haupteffekt des Messzeitpunkts zeigte sich in Bezug auf die Güte der Interpretationen (F (1,73) = 13,57, p > 0,001, ηp2 = 0,16). Demnach verbesserte sich die Güte der Interpretationen vom Prä- zum Posttest in beiden Gruppen.

8.3 Vergleich zwischen Peerfeedback und Expertenfeedback

Im Prätest zeigten sich beim Vergleich der Gruppe mit Peerfeedback und der mit Expertenfeedback keine signifikanten Unterschiede in den Kontrollvariablen, nämlich bezüglich der Motivation (t (57) = 0,36, p = 1,00), Ambiguitätstoleranz (t (57) = −1,05, p = 1,00), dem Vorwissen zum Thema „Klassenführung“ (t (57) = 0,45, p = 1,00), zur Analyse von Unterrichtsvideos (t (57) = −1,28, p = 1,00) und hinsichtlich des wahrgenommenen Ertrags der Videoanalyse (t (57) = −2,20, p = 1,00). Jedoch war die Videoanalysezeit (t (61) = −3,75, p = 0,003) bei der Gruppe mit Expertenfeedback signifikant größer als bei der Gruppe mit Peerfeedback. Daher wurde diese Variable bei den nachfolgenden Varianzanalyse als Kovariate miteinbezogen.

Wie in Tab. 3 zu sehen ist, konnten zwischen den beiden Feedbackgruppen hinsichtlich der aller Schritte der professionellen Wahrnehmung keine signifikanten Unterschiede ausgemacht werden.

Tab. 3 Mittelwerte (M) und Standardabweichungen (SD) der professionellen Wahrnehmung in der KSL- und der Peer-Gruppe zum Prä- und Posttest sowie die Interaktionseffekte zwischen Messzeit und Gruppe mit Videoanalysezeit als Kovariate

Auch in diesem Gruppenvergleich zeigte sich ein signifikanter Haupteffekt des Messzeitpunkts in Bezug auf die Güte der Interpretationen (F (1,51) = 13,89, p > 0,001, ηp2 = 0,21) sowie der Handlungsalternativen (F (1,26) = 9,96, p > 0,01, ηp2 = 0,28). Demnach verbesserten sich die Interpretationen vom Prä- zum Posttest in beiden Gruppen, während die Güte der Handlungsalternativen leicht abnahm.

Insgesamt analysierten die LAAs durchschnittlich 1,75 h lang Ihren Unterricht (SD = 2,42 h), wobei sie die Analysen auf einer Skala von 1–5 mit einem mittleren Lernertrag assoziierten (M = 2,89, SD = 0,98).

8.4 Vergleich zwischen den Implementationstypen

Auch beim Vergleich der Implementationstypen zeigten sich zum Prätest keine systematischen Unterschiede in den Kontrollvariablen intrinsische Motivation (t (118) = 0,03, p = 1,00), Ambiguitätstoleranz (t (118) = 0,04, p = 1,00), Vorwissen zum Thema Klassenführung (t (118) = −0,39, p = 1,00) und zur Analyse von Unterrichtsvideos (t (118) = −1,59, p = 0,66). Bezüglich der Videoanalysezeit (t (58) = 1,04, p = 1,00) und des wahrgenommenen Ertrags der Videoanalyse (t (58) = 0,67, p = 1,00) gab es unter den Probanden, die sich selbst videographiert hatten, ebenfalls keine signifikanten Gruppenunterschiede.

Wie Tab. 4 zu entnehmen ist, nahmen die Interpretationsgüte und die Bewertungsgüte in der Implementationstyp-B-Gruppe vom Prä- zum Posttest mit einem großen Effekt signifikant zu, während sie in der Implementationstyp-A-Gruppe gleichblieben. Die Veränderung in der Güte der Handlungsalternativen zeigte einen Trend mit mittlerem Effekt ebenfalls zu Gunsten der Implementationstyp-B-Gruppe.

Tab. 4 Mittelwerte (M) und Standardabweichungen (SD) der professionellen Wahrnehmung in den Implementationsgruppen zum Prä- und Posttest sowie die Interaktionseffekte zwischen Messzeit und Gruppe

9 Diskussion

Ziel der vorliegenden Studie war es herauszufinden, ob und falls ja, unter welchen Interventionsbedingungen sich die professionelle Wahrnehmung von Klassenführung auch im Vorbereitungsdienst der Lehramtsausbildung gezielt fördern lässt.

Wirksamkeit videobasierter Unterrichtsreflexionen

Unterrichtsreflexionen anhand eigener Unterrichtsvideos führte dabei gegenüber Unterrichtsreflexionen anhand von Unterrichtsbesuchen zumindest auf deskriptiver Ebene zu keiner stärkeren Verbesserung der professionellen Unterrichtswahrnehmung (Fragestellung 1). Die professionelle Unterrichtswahrnehmung konnte auch durch ein videobasiertes Expertenfeedback der KSL nicht mehr gefördert werden als durch ein videobasiertes Peer-Feedback (Fragestellung 2).

Damit konnte der positive Effekt der Selbstvideographie auf die Förderung der professionellen Unterrichtswahrnehmung, welcher von Sherin und van Es (2009) bei Lehrkräften sowie von Gold et al. (2020), Prilop et al. (2020) sowie Weber et al. (2020) bei Lehramtsstudierenden gefunden wurde, deskriptiv nicht repliziert werden. Auch steht das Ergebnis der Studie im Kontrast zu den Studien von Prilop et al. (2020) sowie Weber et al. (2018), die bei Lehramtsstudierenden im Praktikum bzw. Praxissemester noch signifikante Effekte des Expertenfeedbacks gegenüber dem Peerfeedback nachweisen konnten.

Die mangelnde Wirksamkeit der Selbstvideographie-Bedingung könnte durch zwei Faktoren begründet sein. Einerseits könnte sie mit dem Stichprobenausfall und damit einhergehende verminderte Teststärke zusammenhängen. Um eine entsprechende statistische Power zu erreichen, müssten die Teilnehmenden in Folgestudien demnach stärker für den Posttest motiviert werden. Optional wäre die Akquise weiterer LAAs sinnvoll, um bei einem Stichprobenausfall einer zu starken Divergenz der Gruppengrößen, wie sie hier vorlag, vorzubeugen.

Andererseits könnte die fehlende Wirksamkeit der Selbstvideographie-Bedingung aber auch mit der Relation zwischen dem Interventionseffekt und dem allgemeinen Effekt des Vorbereitungsdienstes zusammenhängen. Der längsschnittliche Vergleich zwischen Prä- und Posttest ergab nämlich, dass die Güte der Interpretationen von klassenführungsrelevanten Unterrichtsereignissen im Laufe des Vorbereitungsdienstes insgesamt mit großer Effektstärke zunahm. Dies lässt wiederum vermuten, dass der Interventionsinput der Selbstvideographie im Vergleich zum Input des gesamten Vorbereitungsdienstes zu klein gewesen war, um sich im Kontext der zahlreichen Praxiserfahrungen und Rückmeldungsgelegenheiten sowie hinsichtlich der Länge des Vorbereitungsdienstes ausreichend durchsetzen zu können. Eine kürzere Abfolge des beiden Vorbereitungsblöcke und der beiden videobasierten Unterrichtsreflexionen, die einen massierten Interventionsinput ergeben hätte, konnte im eng getakteten Zeitplan des Vorbereitungsdienstes (Drüge et al. 2014) nicht implementiert werden. Dies war eine der grundsätzlichen Restriktionen bei der Implementation der Selbstvideographie. Diese Überlegung wird dadurch unterstrichen, dass die Studie von Piwowar et al. (2016), in der die Intervention, die aus 17 h thematischer Einführung, videobasierte Fallarbeit, Microteaching und Videozirkel bestand, auf nur ein halbes Jahr begrenzt war und im Gegensatz zu der vorliegenden Studie deutlich positivere Effekte der Selbstvideographie feststellte. Möglicherweise war aber die Implementation in der Studie von Piwowar et al. (2016) auch deshalb effektiver, weil sie nicht durch unterschiedliche Implementationsbedingungen beeinflusst war. So ist zu vermuten, dass die Selbstvideographiebedingung durch das Vorhandensein von Implementationsbedingung A, im Gegensatz zu universitären Interventionen (Gold et al. 2020; Prilop et al. 2020; Weber et al. 2020) oder der Studie von Piwowar et al. (2016) in leicht abgeschwächter Form durchgeführt wurde, was zu einer zusätzlichen Minderung des Selbstvideographie-Effekts auf die professionelle Wahrnehmung geführt haben könnte.

Einfluss der Implementationsbedingungen

Insgesamt konnte nämlich hinsichtlich des Einflusses der Implementationsbedingungen auf die Förderung der professionellen Wahrnehmung (Fragestellung 3) ein starker positiver Effekt der Implementationstyp-B-Gruppe (mehr Angemessenheit, Machbarkeit, Wiedergabetreue und Durchdringung) gegenüber der Implementationstyp-A-Gruppe auf die Förderung der professionellen Unterrichtswahrnehmung bezüglich der Güte der Interpretation, Bewertung und tendenziell auch der generierten Handlungsalternativen gezeigt werden.

Dies dürfte auf vier Gründe zurückgeführt werden können: Zum ersten können die Erwägungen der Seminarleitungen zur Angemessenheit und Machbarkeit der Implementation indirekt verstärkend oder schwächend auf die positive Einstellung der LAAs zur Selbstvideographie gewirkt haben. Dies könnte die Wichtigkeit der Einschätzungen der Implementation spezifischer Innovationen durch Leitungspersonen unterstreichen (Bunger et al. 2019; Yang et al. 2020). Zweitens mag dies auf die originalgetreue Übernahme des zweiten Vorbereitungsblocks zurückzuführen sein, in dem bereits die Analyse eines Eigenvideos trainiert wird. Somit hätte der zweite Vorbereitungsblock als effektive Prä-Trainingseinheit für die Selbstvideographie gedient (Magnusson und Viswesvaran 2010). Drittens mag die Übernahme des Begriffs- und Konstruktverständnisses in das Curriculums, welches die erlebte inhaltliche Kohärenz zwischen dem Interventionsinput zur videobasierten Unterrichtsreflexion und den klassenführungsbezogenen Inhalten des Kernseminarcurriculums erheblich steigert, von Bedeutung gewesen sein. Dies würde für die Wichtigkeit der curricularen Kohärenz (Jin et al. 2019) im Vorbereitungsdienst sprechen. Viertens ist die höhere Durchdringung der Implementationstyp-B-Gruppe mit Selbstvideographie möglicherweise ein Motivationstreiber für die Verbesserung der professionellen Unterrichtswahrnehmung gewesen. Nach dieser Annahme würde wiederum die Durchdringung oder Diffusion einer Intervention den bedeutenden Unterschied bei der Implementation machen (Buddenberg 2014).

Insgesamt spricht das Ergebnis der dritten Hypothese jedoch für Wichtigkeit der Angemessenheit, Machbarkeit, Wiedergabetreue und Durchdringung bei der Implementation von Lehrinnovationen in den Vorbereitungsdienst. Gleichzeitig führt es vor Augen, dass Innovationen auch im Vorbereitungsdienst auf bereits vorhandene soziale Strukturen stoßen (Euler und Sloane 1998; Rogers 2003) und sie einen wesentlich höheren Lernertrag für die Lernenden erzielen können, wenn sie in institutionsübergreifendem kokonstruktivem Austausch geformt und kohärent zu den bisherigen Lernstrukturen und -inhalten bei gleichzeitiger Wiedergabetreue integriert werden. Von diesem Effekt berichtet auch Gräsel (2010) in Bezug auf die Anregung von Schulentwicklungsprozessen.

Limitationen der Studie

Die Studie weist einige Limitationen auf, die bei der Interpretation der Ergebnisse ebenfalls zu berücksichtigen sind.

So liegen über die Qualität der angefertigten videobasierten Unterrichtsanalysen der LAAs und der Unterrichtsreflexionen mit den Expert*innen und den Peers keine näheren Informationen vor, sodass an dieser Stelle keine Einschätzung der Wiedergabetreue getroffen werden kann. Jedoch ist zumindest festgestellt worden, dass der Zeitumfang der angefertigten Videoanalysen nicht signifikant mit der Veränderung der professionellen Wahrnehmung zusammenhing. Die eingeschränkte Einsicht in die Reflexionen war der vereinbarten Vertraulichkeit dieser Inhalte gegenüber den Evaluator*innen geschuldet, die eine Vorbedingung für die Mitwirkung war.

Neben den oben genannten Auswirkungen auf die Teststärke könnte sich der Stichprobenausfall als limitierender Faktor auch nachteilig auf die Interpretation der Ergebnisse ausgewirkt haben, da zum Posttest ein systematische Stichprobenausfall in der Unterrichtsbesuchs- und der Implementationstyp-A-Gruppe vorlag. Zwar haben sich hinsichtlich des Dropout-Effektes keine signifikanten motivationalen, Vorwissens- oder Wahrnehmungsunterschiede zwischen Gruppen zum Prätest finden können; es ist aber vor allem bei diesem Umfang nicht gänzlich auszuschließen (Schulz und Grimmes 2002), dass die positiven Effekte der Implementationstyp-B-Gruppe im Gegensatz zur A‑Gruppe durch den vermehrten Ausstieg derjenigen Teilnehmenden in der A‑Gruppe geprägt war, die im Vergleich zu den verbliebenden Teilnehmenden größere Lernfortschritte gemacht hätten.

Zuletzt kann die Außerachtlassung von Eigenschaften der videographierten Lerngruppen als limitierendes Moment genannt werden. So hätte beispielsweise das Alter der aufgezeichneten Schüler*innen als Kovariate dienen können. Unter Umständen könnte man nämlich erwarten, dass klassenführungsrelevante Ereignisse vornehmlich an den niedrigsten Jahrgangsstufen erprobt werden können und somit die professionelle Wahrnehmung bei jenen LAAs stärker gefördert werden kann, die ein entsprechendes Video aufnehmen und analysieren. Schüler*innen müssen sich vor allem im ersten Schuljahr mit den erhöhten Erwartungen hinsichtlich der Einhaltung von Verhaltensregeln, der dauerhaften Aufmerksamkeit und der sozialen Integration (Kellam et al. 1998; Perry und Weinstein 1998) vor allem beim Auftreten von Konflikten (Kim-Cohen et al. 2005; Pianta und Stuhlman 2004) auseinandersetzen.

Trotz limitierender Faktoren liefert die vorliegende Studie erste Erkenntnisse bezüglich der Wirksamkeit von Selbstvideographie im Vorbereitungsdienst der Lehramtsausbildung. Gleichzeitig verdeutlicht sie vor dem Hintergrund der bestehenden Strukturen der zweiten Phase der Lehrkräftebildung die Wichtigkeit, auch bei zukünftigen Forschungsanliegen die spezifischen Implementationsbedingungen der durchgeführten Intervention miteinzubeziehen.