Einleitung

Über die Bedeutung und Notwendigkeit naturwissenschaftlicher Bildung herrscht aufgrund des (noch immer) höchstens mittelmäßigen Abschneidens der Schüler*innen in Deutschland in internationalen Vergleichsstudien wie PISA und TIMSS gesamtgesellschaftlich sowie bildungspolitisch weitgehend Konsens. Auch durch eine zunehmende Technisierung des Alltags und allgemein veränderte Lebenswelten von Kindern und Jugendlichen sowie die Transformation in Richtung einer wissenschaftlichen Gesellschaft (Labudde und Möller 2012; Schiepe-Tiska et al. 2019) ist ein Paradigmenwechsel für den naturwissenschaftlichen Unterricht angestoßen worden: weg von einer Lernziel- und hin zu einer Kompetenzorientierung sollten problem- und anwendungsorientiertes Lernen und naturwissenschaftliche Denk- und Arbeitsweisen verstärkt Einzug in den naturwissenschaftlichen Unterricht finden (Müller et al. 2013; Prenzel und Ostermeier 2003; Raidt 2010; Rönnebeck et al. 2010).

Experimente als eine zentrale naturwissenschaftliche Erkenntnismethode sind besonders geeignet, diesen Forderungen nachzukommen. Mit dem übergeordneten Rahmen der naturwissenschaftlichen Grundbildung/Scientific Literacy (Bybee und McCrae 2011) kann das Experimentieren Bildungs- und Erkenntnisprozesse im naturwissenschaftlichen Bereich initiieren und ermöglicht es die Verwirklichung problemorientierten und forschenden Lernens im Unterricht. Potenziale von Experimenten für Lernprozesse und die Lernergebnisse der Schüler*innen zeigen sich bei einer Einbindung der Schüler*innen in die entsprechenden naturwissenschaftlichen Denk- und Arbeitsweisen durch den Anstoß eines tiefen Verständnisses und eines flexibel anwendbaren (naturwissenschaftlich-geographischen) Wissens, nicht zuletzt über das Wesen der (Geographie als) Naturwissenschaft (Barzel et al. 2012; Kremer et al. 2019; Lethmate 2006; Otto und Mönter 2015; Wilhelmi 2012). Als „didaktischer Königsweg“ (Prenzel und Parchmann 2003) in den Naturwissenschaften bietet das Experimentieren eine Bandbreite didaktischer Möglichkeiten, kann unter anderem zum Aufbau methodischer Fähigkeiten beitragen und Neugier und Interesse an den Naturwissenschaften wecken (Otto und Mönter 2015; Schubert 2016; Tesch und Duit 2004; Wilhelmi 2012). Darüber hinaus sind die in PISA im Rahmen der naturwissenschaftlichen Grundbildung erhobenen Kompetenzen direkt dem Experimentieren zuzuordnen und werden auch explizit zu geographischen und geowissenschaftlichen Inhalten erhoben (Schiepe-Tiska et al. 2019). Darauf basierend wird für den Geographieunterricht argumentiert, dass der Einsatz von Experimenten naturwissenschaftliche Grundbildung fördert und vielfältige Lernprozesse anstoßen kann (Lethmate 2006; Otto 2009; Otto und Mönter 2015). Im Fach Geographie sind experimentelle Arbeitsweisen fest verankert; sie nehmen einen wichtigen Platz in Lehrplänen und Bildungsstandards ein (DGfG 2020) und ihr Stellenwert wird in der hohen Anzahl entsprechender Publikationen in geographiedidaktischen Zeitschriften in Form konzeptioneller und empirischer Arbeiten sowie von Unterrichtsbeispielen in entsprechenden Themenheften deutlich (z. B. Peter und Sprenger 2014; Schubert und Höhnle 2016).

Das Experiment wird in der Geographiedidaktik als „planmäßige, grundsätzlich wiederholbare Beobachtung […] unter künstlich hergestellten, möglichst veränderbaren Bedingungen“ (Otto 2009, S. 4) definiert und ist damit im Kern vergleichbar mit dem Begriffsverständnis in den Fächern Chemie, Physik und Biologie. Ebenfalls gemeinsam ist dem Experimentieren in diesen Fächern das Ziel des Erkennens von Ursache-Wirkungs-Beziehungen und allgemeinen Gesetzmäßigkeiten. Diese beziehen sich für die Fächer Chemie, Physik und Biologie jedoch vornehmlich auf natürliche Phänomene, während geographische Fragestellungen als Ausgangspunkt des Experimentierens außerdem „Wechselwirkungen zwischen naturgeographischen Gegebenheiten und menschlichen Aktivitäten“ (DGfG 2020, S. 5), also Beziehungen zwischen Mensch und Umwelt, einbeziehen können (DGfG 2020; Otto et al. 2010; Wilhelmi 2012).

Für das Experimentieren im Geographieunterricht wird für dessen verschiedene Teilkompetenzen (Fragestellung formulieren, Hypothesen generieren, Experiment planen und Daten auswerten) von Defiziten und einem daraus abgeleiteten großen Förderbedarf bei Schüler*innen berichtet (Peter und Sprenger 2014). In der Realität werden Experimente nur selten im Geographieunterricht berücksichtigt (Hemmer und Hemmer 2010), was im deutlichen Widerspruch zu dem seit Jahrzehnten hohen Interesse von Schüler*innen an der Arbeitsweise (Hemmer und Hemmer 2002, 2010, 2021) sowie dessen großen didaktischen Potenzialen steht und eine über Jahrzehnte bestehende Diskrepanz zum Vorschein bringt. Der Einsatz von Experimenten im Unterricht stellt bezüglich der Vorbereitung sowie unterrichtlichen Einbettung und Gestaltung hohe Anforderungen an Lehrpersonen (Fögele et al. 2020; Otto und Mönter 2015). Vor diesem Hintergrund rücken die Geographielehrpersonen in den Fokus. Deren subjektive Überzeugungen (Beliefs) gelten – neben anderen Komponenten professioneller Handlungskompetenz wie z. B. dem fachdidaktischen Wissen – als besonders wichtiger Prädiktor für die Gestaltung von Unterricht sowie unterrichtliches Handeln (Fives und Buehl 2012; Nespor 1987; Pajares 1992; Reusser und Pauli 2014) und somit auch für den Einsatz methodischer Großformen wie Experimente. Um den tatsächlichen Zusammenhang zwischen Beliefs von Lehrpersonen und deren unterrichtlichem Handeln sowie das Zusammenspiel mit weiteren beeinflussenden Faktoren im konkreten Fall des Experimentierens im Geographieunterricht herausarbeiten zu können, müssen in einem ersten Schritt deren Beliefs erfassbar gemacht werden.

Theoretische und empirische Grundlegung

Professionelle Handlungskompetenz von Lehrpersonen

Für die Gestaltung von Lehr- und Lernprozessen im unterrichtlichen Geschehen, der zeitlichen, inhaltlichen und sozialen Struktur von Unterricht, nehmen Lehrpersonen eine Schlüsselrolle ein. Die Qualität ihres unterrichtlichen Handelns und ihre eigene Qualifikation spielen dabei eine besonders wichtige Rolle für das Gelingen von Unterricht und die Leistungen der Schüler*innen (Bromme 1997; Hattie 2009; Terhart 2011). Als wichtige Prädiktoren für ihr Handeln und somit die Qualität von Unterricht gelten die professionellen Handlungskompetenzen von Lehrpersonen (Baumert und Kunter 2006; Steinmann und Oser 2012). Diese befähigen sie zur erfolgreichen Bewältigung der zentralen Anforderungen bei der Planung, Inszenierung und Gestaltung von Unterricht (Kleickmann 2017).

Die professionelle Handlungskompetenz von Lehrpersonen umfasst als komplexes System nicht-hierarchisch aufgebauter Komponenten neben den kognitiven Leistungsdispositionen des Professionswissen zusätzlich die damit verbundenen Komponenten der motivationalen Orientierungen, selbstregulativen Fähigkeiten sowie Überzeugungen (Beliefs) und Wertehaltungen (Baumert und Kunter 2006). Im deutschsprachigen Bereich werden oftmals schwerpunktmäßig die rein kognitiven Komponenten resp. das Professionswissen untersucht. Für ein umfassendes Modell professioneller Handlungskompetenz müssen jedoch auch weitere Komponenten und ihre Wirksamkeit auf das unterrichtliche Handeln berücksichtigt werden, scheint das Wissen allein nicht ausreichend für dessen Anwendung im Unterricht zu sein (Strauß et al. 2019). Insbesondere den professionellen Überzeugungen/Beliefs von Lehrpersonen wird dabei eine konkret handlungsregulative Bedeutung zugeschrieben (Nespor 1987; Pajares 1992).

Teacher Beliefs – Begriffsklärung und praktische Bedeutung

Als „messy construct“ (Pajares 1992) betitelt, herrscht bis heute kein Konsens bezüglich des Beliefs-Konstrukts und dessen Definition (Fives und Buehl 2012). In der Forschung, so auch in groß angelegten Studien zu Kompetenzen von Lehrkräften (z. B. TEDS‑M und MT21), wird oftmals auf Richardson (1996) rekurriert. Sie beschreibt Beliefs als „psychologically-held understandings, premises or propositions about the world that are felt to be true“ (Richardson, S. 103). Baumert und Kunter (2006) beziehen sich in ihrer Definition von Beliefs („Überzeugungen“) ebenfalls unter anderem auf Richardson und beschreiben Beliefs in Abgrenzung zu Wissen darüber hinaus als Konzeptionen, die subjektiv für wahr gehalten werden und somit weder diskursiver Validierung noch Widerspruchfreiheit und argumentativer Rechtfertigung bedürfen, sodass der persönliche Richtigkeitsglaube einer Lehrperson für die Wirksamkeit im Handeln genügt.

Weiterhin gliedern Baumert und Kunter Teacher Beliefs in epistemologische, die Natur des Wissens und der Wissensgenese und somit eine übergeordnete Ebene betreffende, und lehr- und lerntheoretische Überzeugungen. Letztere beinhalten unter anderem unterrichtliche Prozesse und Zielvorstellungen und gelten als direkter handlungsleitend (Leuchter et al. 2006). Teacher Beliefs betreffen jeweils unterschiedliche Kontexte und Inhalte (Fives und Buehl 2012; Mansour 2009) und variieren folglich je nach untersuchter Spezifitätsebene (Gimbel et al. 2018): „[b]ei Lehrpersonen beziehen sich Beliefs beispielsweise auf die Art, wie Kinder lernen, welche Unterrichtsmethoden wirksam sind, was Mathematik (oder ein anderer Fachinhalt) ist, welche Rolle die Aktivität der Schüler und Schülerinnen spielt etc.“ (Oser und Blömeke 2012, S. 415–416). Bestimmte Beliefs werden abhängig von den Anforderungen einer bestimmten Situation stark kontextualisiert aktiviert, sodass ihnen insbesondere für konkrete didaktische und methodische Entscheidungen eine hohe Bedeutung zukommt. Speziell für Beliefs ist dieser Zusammenhang aufgrund der beschriebenen stark handlungs- und orientierungsleitenden Funktion wesentlich stärker empirisch belegt als für rein kognitive Komponenten der professionellen Kompetenz, was die Notwendigkeit, Beliefs möglichst fach- und anforderungsspezifisch zu operationalisieren, verdeutlicht (Blömeke et al. 2008; Fives und Buehl 2012; Petermann und Vorholzer 2022).

Dennoch ist die Befundlage zur praktischen Wirksamkeit von Teacher Beliefs teilweise uneinheitlich. Einerseits wird argumentiert, dass die praktische Bedeutung ihrer Erforschung in ihrem starken Einfluss auf das professionelle Handeln von Lehrpersonen begründet liegt. Pajares (1992, S. 307) bezeichnet Beliefs als „the best indicator of the decisions individuals make throughout their lives“ und spricht von „a strong relationship between teachers’ educational beliefs and their planning, instructional decisions, and classroom practices“ (Pajares, S. 326). Die Beliefs von Lehrpersonen werden folglich gewissermaßen als Vorhersage für das Handeln von Lehrpersonen gesehen (Buehl und Beck 2015), gleichzeitig gehen Veränderungen der Beliefs mit Veränderungen im Handeln von Lehrpersonen einher (Mansour 2009; Shulman 1986). Andererseits können einige Studien einen solchen Zusammenhang jedoch nicht nachweisen (z. B. Lederman 1999; Mellado et al. 2007; Saad und BouJaoude 2012; Savasci und Berlin 2012). Zum einen vermuten Fives und Buehl (2012), dass dies auf den Grad an Spezifität, mit dem Beliefs untersucht werden, zurückgehen könnte. Zum anderen wird dieses uneindeutige Bild auf eine Reihe von Faktoren zurückgeführt, welche moderierend auf die Kongruenz zwischen den Beliefs von Lehrpersonen und ihrem unterrichtlichen Handeln wirken, also der Ausübung ihrer Beliefs im Unterricht entgegenstehen oder sie unterstützen können (Buehl und Beck 2015; Fang 1996; Fives und Buehl 2012; Mansour 2009).

Teacher Beliefs zum Experimentieren im Unterricht – Forschungsstand

Für Naturwissenschaftslehrpersonen zeigt sich in diversen Studien, dass ihre Beliefs zum forschenden Lernen und der Laborarbeit ein wichtiger Prädiktor für ihr tatsächliches unterrichtliches Handeln sind (Cheung 2011; Crawford 2007; Lucero et al. 2013; Mansour 2009; Wallace und Kang 2004; Wilkins 2008). Auch für Beliefs in diesen Bereichen wird jedoch von Faktoren berichtet, welche die Konsistenz zwischen Beliefs und ihrem Handeln beeinflussen. Dies sind einerseits interne Faktoren wie widersprüchliche und zueinander konkurrierende Beliefs des eigenen Beliefs-Systems, Bereiche des Professionswissens sowie Selbstwirksamkeitsüberzeugungen von Lehrpersonen und andererseits externe Faktoren wie verschiedene Rahmenbedingungen des Unterrichtens, beispielsweise eine mangelhafte Ausstattung und wahrgenommener Bewertungsdruck (Crawford 2007; DiBiase und McDonald 2015; Mansour 2009; Siorenta und Jimoyiannis 2008; Wallace und Kang 2004). Auch wenn das Experimentieren eng mit Anforderungen bei der allgemeinen Laborarbeit und dem forschenden Lernen verbunden ist, ist unklar, inwieweit die aufgeführten Erkenntnisse auf das Experimentieren (im Geographieunterricht) übertragbar sind. Jedoch zeigt sich auch für das Experimentieren im Geographieunterricht, dass angehende Lehrpersonen als Hindernisse für den Einsatz von Experimenten insbesondere organisatorisch-formale Rahmenbedingungen wie „eine zu große Stofffülle des Lehrplans“, „den hohen Zeitaufwand während des Unterrichts“ und die didaktisch-methodische Qualifikation der Lehrkräfte wahrnehmen (Schubert und Höhnle 2016). Darüber hinaus wirken aus Sicht von Geographielehrpersonen der ungewisse Ausgang und Ablauf von Experimenten sowie unzureichende Vorkenntnisse und mangelndes Interesse von Schüler*innen hinderlich auf deren Einsatz im Unterricht (Miener und Köhler 2013).

Angehende und im Beruf befindliche Lehrpersonen scheinen überwiegend positive Überzeugungen gegenüber der generellen Arbeit im Labor (z. B. Aka 2016; Cheung 2011; Siorenta und Jimoyiannis 2008; Wallace und Kang 2004) sowie dem forschenden Lernen (z. B. Bevins et al. 2019; DiBiase und McDonald 2015; Gavora und Wiegerová 2019; Wilkins 2008) im naturwissenschaftlichen Unterricht zu besitzen und von Potenzialen in diesen Bereichen überzeugt zu sein. In einer Studie von Wallace und Kang (2004) zu den Beliefs von sechs Naturwissenschaftslehrpersonen zum forschenden Lernen und deren Umsetzung in die Unterrichtspraxis nennen die untersuchten Lehrpersonen als Potenziale der Laborarbeit unter anderem die veranschaulichende Funktion experimenteller Arbeitsweisen sowie eine Entwicklung problemlösender Fähigkeiten und ein erleichtertes Verständnis naturwissenschaftlicher Phänomene bei den Schüler*innen. Unerwartete Ergebnisse und das Auftauchen von Fehlern empfanden einige der befragten Lehrpersonen dabei als gehaltvoll für den Lernerfolg. Gleichzeitig wurden die Voraussetzungen der Schüler*innen zum Teil als beschränkende Faktoren gesehen, was sich auch in weiteren Studien in Bezug auf Beliefs zum forschenden Lernen zeigt (Bevins et al. 2019; DiBiase und McDonald 2015). Auch Cheung (2011) berichtet, dass Chemielehrpersonen überwiegend vom Wert von Laborexperimenten im Unterricht überzeugt sind. Dabei neigen jedoch insbesondere diejenigen Lehrpersonen, welche selten oder gar keine Laborexperimente in ihrem Unterricht implementieren, zu der Überzeugung, dass Schüler*innen weder die motivationalen Voraussetzungen zum Experimentieren noch die Voraussetzung, Experimente selbst zu entwickeln, mitbringen.

Auch für den deutschsprachigen Raum nennen Physiklehrpersonen als Ziele, welche sie mit dem Experimentieren im Unterricht verbinden, unter anderem das Einüben experimenteller Arbeitsweisen, das Schulen aufmerksamen Beobachtens, ein erleichtertes Erlernen von Fachinhalten sowie die Strukturierung des Unterrichts (Jonas-Ahrend 2004; Welzel et al. 1998). Dunker (2015, 2016) zeigt anhand von Videographien und Interviews von sieben deutschen Grundschullehrpersonen, dass deren Beliefs zum Experimentieren im Sachunterricht meist insbesondere den Handlungsaspekt und weniger den erkenntnistheoretischen Aspekt des Experimentierens in den Vordergrund stellen. Experimente werden vorwiegend als „handelndes Tun“ betrachtet, während der individuelle Erkenntnisprozess eine eher untergeordnete Rolle spielt. Für Geographielehrpersonen gelten darüber hinaus das erleichterte Verständnis von Fachinhalten, eine Förderung von Kompetenzen beim naturwissenschaftlichen Erkenntnisgewinn, die Motivierung der Schüler*innen sowie die Anschaulichkeit und Vielfalt an Methoden im Unterricht als Chancen des Experimentierens (Miener und Köhler 2013)Footnote 1.

Zu Kompetenzen von Schüler*innen beim Experimentieren im Geographieunterricht liegen mittlerweile Erkenntnisse sowie ein entsprechendes Kompetenzmodell vor (Peter und Sprenger 2014). Für angehende und im Beruf befindliche Geographielehrkräfte fehlen bisher jedoch weitgehend Forschungsergebnisse zu Kompetenzaspekten bzw. -modellen beim Einsatz von Experimenten im Unterricht (Rosendahl et al. 2020), so auch zu deren Beliefs. Insbesondere Beliefs zu konkreten geographiedidaktischen Ansätzen sowie Methoden und Medien des Geographieunterrichts sind bisher wenig erforscht; auch in anderen Fachdidaktiken ist die Untersuchung von Teacher Beliefs meist auf übergeordnete Aspekte in Form von Beliefs zum (überfachlichen) Lehr- und Lernverständnis bezogen. Angesichts der stark kontextualisierten Wirkung von Beliefs ist jedoch gerade ein fach- und anforderungsspezifischer Blick von besonderem Interesse (Fives und Buehl 2012; Petermann und Vorholzer 2022). Existieren im Bereich der im Beruf befindlichen und angehenden Naturwissenschaftslehrpersonen zwar Messinstrumente zu zuvor genannten benachbarten Bereichen naturwissenschaftlicher Bildung (forschendes Lernen z. B. Gavora und Wiegerová 2019; Marshall et al. 2009; generelle Arbeit im Labor z. B. Aka 2016; Cheung 2011), fehlen zudem entsprechende Messinstrumente für Beliefs speziell zum Experimentieren sowie fachspezifisch für Geographielehrpersonen.

Zielstellung und Forschungsfragen

Teacher Beliefs wird eine besondere Wirkung auf konkrete methodische Entscheidungen von Lehrpersonen sowie deren konkrete Ausgestaltung des Unterrichts zugeschrieben. Vor diesem Hintergrund sowie hinsichtlich des skizzierten Desiderats an Messinstrumenten zur Erfassung der Beliefs einerseits fachspezifisch von Geographielehrpersonen und andererseits anforderungsspezifisch Methoden, Medien und Arbeitsweisen betreffend ergibt sich das folgende Ziel: Es soll ein quantitatives Instrument zur Erhebung der Beliefs angehender Geographielehrpersonen zum Experimentieren im Unterricht entwickelt und pilotiert werden, anhand dessen verschiedene Aspekte hinderlicher und förderlicher Beliefs Lehramtsstudierender des Fachs Geographie zum Experimentieren im Geographieunterricht identifiziert werden können. Konkret sollen diese Beliefs durch ein zeitökonomisch handhabbares Messinstrument in Form eines standardisierten Fragebogens empirisch erfassbar gemacht werden. Zugleich liefert der vorliegende Beitrag ein Beispiel für die anforderungsspezifische Erfassung fachspezifischer Beliefs von Geographielehrpersonen. Daraus ergibt sich die zentrale Fragestellung des vorliegenden Beitrags: Können verschiedene Bereiche von Beliefs angehender Lehrpersonen zum Experimentieren im Geographieunterricht anhand des entwickelten Fragebogens reliabel erhoben werden?

Die im Rahmen der Pilotierung stattfindende Datenerhebung liefert zusätzlich erste Hinweise auf die Ausprägung der Beliefs der angehenden Geographielehrpersonen, sodass im vorliegenden Beitrag zusätzlich der folgenden weiteren Fragestellung nachgegangen wird: Wie sind die Beliefs zum Experimentieren im Geographieunterricht bei angehenden Lehrpersonen ausgeprägt?

Methodik

Skalenkonstruktion

Das Ziel unseres Forschungsvorhabens ist die Entwicklung eines Instruments zur zeitökonomischen Erfassung der Beliefs anhand eines geschlossenen, itembasierten Formats. Auf dem Weg dorthin wurde im Sinne einer Offenheit zunächst eine Re-Analyse zweier qualitativer Interviewstudien von Miener und Köhler (2013) sowie Bußfeld (2013)Footnote 2 mit Geographielehrpersonen zum Experimentieren im Unterricht durchgeführt. In diesen problemzentrierten Interviews wurden Geographielehrpersonen unter anderem dazu befragt, welche Ziele sie mit dem Einsatz von Experimenten im Unterricht verfolgen, welche Potenziale sie dem Experimentieren im Geographieunterricht zuschreiben und welche Barrieren sie für deren Einsatz wahrnehmen. Anhand der in den zusammenfassenden Inhaltsanalysen dieser Studien entwickelten Kategorien wurden mögliche Themenbereiche des Experimentierens im Geographieunterricht identifiziert und innerhalb dieser ein umfangreiches Itemset an potenziellen Beliefs ausformuliert. In Kombination dazu wurde eine Literaturanalyse geographie- und naturwissenschaftsdidaktischer Veröffentlichungen zum Experimentieren im Geographieunterricht (u. a. Arning und Lethmate 2003; DGfG 2020; Lethmate 2006; Mönter und Hof 2012; Otto 2009; Otto und Mönter 2015; Peter 2014; Schubert und Höhnle 2016; Wilhelmi 2012) sowie in weiterem naturwissenschaftlichen Unterricht (u. a. Barzel et al. 2012; Duit et al. 2010; Dunker 2015, 2016; Jonas-Ahrend 2004; Schiepe-Tiska et al. 2019; Welzel et al. 1998) durchgeführt und der Entwurf um weitere Themenbereiche und entsprechende Items erweitert. Dieses Vorgehen diente zunächst nicht der Skalenbildung, sondern als Grundlage für eine inhaltlich möglichst breite Ausformulierung der Items zu Teacher Beliefs zum Experimentieren.

Dieser erste Entwurf des Fragebogens wurde an einer kleineren studentischen Stichprobe (N = 46) im Jahr 2018 getestet. Dies diente primär dazu, die aus den zusammenfassenden Inhaltsanalysen der qualitativen Vorarbeiten (Miener und Köhler 2013)Footnote 3 und Literaturrecherchen entwickelten Items hinsichtlich ihrer grundsätzlichen Eignung anhand von Itemkennwerten (Itemtrennschärfe und Itemschwierigkeiten) zu prüfen. Auf dieser Grundlage wurde der Fragebogen in Form einer Selektion geeigneter Items sowie von Umformulierung und Ergänzung durch neue Items und Themenbereiche nach erneuter Literaturdurchsicht stark modifiziert (Kelava und Moosbrugger 2020). Ein daraus entstandener zweiter Entwurf wurde im Jahr 2020 in einem Team von Geographiedidaktiker*innen und Geographielehrpersonen mit unterrichtspraktischer Erfahrung im Bereich Experimentieren für jedes Item auf Verständlichkeit und Eindeutigkeit untersucht. Zusätzlich wurden das Messinstrument bzw. die identifizierten Themenbereiche und entwickelten Items im Rahmen dieser Expert*innenurteile auf eine inhaltliche Breite hin überprüft, diskutiert und entsprechend um weitere Items und Themenbereiche erweitert, um eine gute inhaltliche Validität zu gewährleisten. Dieses Vorgehen wurde in Form offener Diskussionen mit den jeweils angepassten und erweiterten Versionen mehrmals wiederholt. Die neu entstandene und in diesem Beitrag vorgestellte veränderte zweite Fragebogenversion enthielt 50 Items innerhalb von zwölf Themenbereichen zu möglichen Zielen, Voraussetzungen und Hindernissen beim Experimentieren im Geographieunterricht: kognitiv-methodische Ziele, kognitiv-inhaltliche Ziele, motivationale Ziele, motorische Ziele, kritisches Denken als Ziel, konzentriertes Arbeiten als Ziel, motivationale Lernvoraussetzungen, kognitive Lernvoraussetzungen, motorische Lernvoraussetzungen, Potenziale für die Unterrichtsgestaltung, Klassenmanagement und Wichtigkeit von Offenheit.

Die einzelnen Items waren auf einer fünfstufigen Likert-Skala (1 = „stimme gar nicht zu“ bis 5 = „stimme vollkommen zu“) zu beantworten, welche eine grafische Unterstützung zur Darstellung der Äquidistanz der Items enthielt. Für die Analysen wurden negativ formulierte Items rekodiert. Zur Minimierung unerwünschter Reihenfolgeeffekte wurden die 50 Items in zufälliger Reihenfolge angeordnet. Nach Rokeach (1969) wurden die Belief-Items anhand der Stämme „Ich denke/glaube/meine/halte …; Ich bin überzeugt/der Meinung …; Aus meiner Sicht …; Meiner Meinung nach …; Für mich …“ gebildet.

Zusätzlich zu den 50 Items enthielt der Fragebogen allgemeine Angaben zu soziodemographischen Daten (Alter, Geschlecht, Fachsemester, studierte Schulform), einen knappen Informationsblock zu naturwissenschaftlichen Arbeitsweisen im Geographieunterricht (Lethmate 2006) sowie den Hinweis, sich bei der Beantwortung der Items erstens auf die angeführte Definition von Experimenten und zweitens speziell auf das Experimentieren im Geographieunterricht zu beziehen („Denken Sie bitte an die unten angeführte Definition von Experimenten und beziehen Sie sich bei der Beantwortung der Aussagen nur auf das Experimentieren im Geographieunterricht“).

Stichprobe

An der Befragung nahmen N = 198 Lehramtsstudierende mit dem Schulfach Geographie teil. Die Daten wurden anhand eines Online-Fragebogens mit der Software SoSciSurvey erhoben, indem den Studierenden ein Link zur freiwilligen Teilnahme an der Studie zugänglich gemacht wurde. Von den befragten Studierenden waren 67 % weiblich (n = 131), das Durchschnittsalter der Studierenden lag bei 22 (SD = 3,4). An der Befragung nahmen Studierende zwischen dem ersten und neunten Fachsemester teil (M = 3,45, SD = 1,87). 42 % der Befragten studierten Grundschullehramt, 33 % Gymnasiallehramt und jeweils 13 bzw. 12 % Mittel- bzw. Realschullehramt, sodass 58 % der Studierenden dem Sekundarschullehramt zuzuordnen waren.

Statistische Analysen

Die zugrundeliegende faktorielle Struktur des entwickelten Messinstruments wurde nach einem iterativen Konstruktionsprozess (Inhaltsvalidität) anhand einer explorativen Faktorenanalyse ermittelt. Diese Vorgehensweise wurde gewählt, da zunächst theoriegenerierend insbesondere Kenntnisse über die Dimensionalität des zu erfassenden Beliefs-Konstrukts gewonnen werden sollten (Rost 2013) und exploriert werden sollte, welche Struktur bezüglich der in den Re-Analysen der qualitativen Interviewstudien und Literaturanalysen identifizierten Themenbereiche zu Beliefs zum Experimentieren im Geographieunterricht vorliegt. Anhand des Kolmogorov-Smirnov- und des Shapiro-Wilk-Tests wurden die Items auf multivariate Normalverteilung geprüft, für einen großen Teil der Items lag eine linksschiefe Verteilung vor. Die Analyse fehlender Werte brachte nach Ausschluss von drei Proband*innen nur bei weiteren drei Proband*innen Datenlücken hervor. Diese traten nach Little’s MCAR-Test (χ2 = 110,28; df = 102; p > 0,05) zufällig auf, sodass von Missings At Random ausgegangen werden kann. Fehlende Werte wurden daher mittels Erwartungs-Maximierungs-Algorithmus imputiert. Dieses Verfahren toleriert die Verletzung der Normalverteilungsannahme und ist zudem für Faktoren- sowie Reliabilitätsanalysen gut geeignet (Graham 2009; Lüdtke et al. 2007). Weder Kaiser-Meyer-Olkin-Koeffizient (KMO = 0,800), noch Bartlett-Test (χ2 = 3766,85; df = 1225; p < 0,001), noch die Anti-Image-Matrix sprachen gegen die Eignung der Korrelationsmatrix für eine Faktorenanalyse (Backhaus et al. 2018; Bühner 2011).

Als Extraktionsmethode wurde die Hauptachsen-Faktorenanalysen (PFA) verwendet, welche im Falle einer Verletzung der Normalverteilung empfohlen wird (Backhaus et al. 2018; Brown 2015). Als Entscheidungskriterium für die Anzahl der Faktoren wurden der optische Scree-Test, die Parallelanalyse und der Minimum-Average-Partial-Test herangezogen. Während die beiden zuerst genannten, von Fabrigar et al. (1999) empfohlenen Analysen die Extraktion von sechs Faktoren vorschlugen, empfahl der MAP-Test fünf Faktoren. Da die Extraktion zu vieler Faktoren weniger Fehler produziert als die Wahl zu weniger Faktoren, wurden sechs Faktoren extrahiert. Als Rotationsmethode wurde die gebräuchliche Varimax-Rotation gewählt (Backhaus et al. 2018; Pituch und Stevens 2016), da diese eine erleichterte Interpretierbarkeit der Faktoren ermöglicht und da zudem angesichts der niedrigen Anzahl an extrahierten Faktoren von überwiegend voneinander unabhängigen Faktoren ausgegangen wurde. Für die Interpretation der Faktorladungen wurde nach Tabachnick und Fidell (2007) ein cut-off Wert von λ > 0,45 gewählt.

Zur Überprüfung des Modells wurden auf Ebene der Faktoren Cronbachs-Alpha und die Split-Half-Reliabilität mit dem Spearman-Brown-Koeffizient sowie auf Einzelitemebene die Item-Skala-Korrelation berechnet. Für Cronbachs-Alpha wurde analog zur Argumentation von Rabe et al. (2012) ein relativ niedriger Wert von α > 0,6 als akzeptabel festgelegt, da „es sich erstens nicht um Leistungsvariablen handelt, die generell einfacher präzise zu messen sind als affektive Konstrukte und zweitens bei fehlender Alternative ein Instrument mit niedrigem ac [Cronbachs-Alpha] sinnvoller ist als der vollständige Verzicht auf ein passendes Instrument“ (Rabe et al. 2012, S. 307).

Bezüglich des Umgangs mit einzelnen entwickelten Items wurden neben den statistischen Kennwerten immer auch inhaltliche Überlegungen miteinbezogen (Rabe et al. 2012).

Für die statistischen Analysen der Daten auf manifester Ebene (klassische Item- und Skalenanalyse) sowie für die explorative Faktorenanalyse wurde die Software IBM SPSS Statistics 26 genutzt.

Ergebnisse

Faktorenextraktion

Innerhalb der sechs in der explorativen Faktorenanalyse extrahierten Faktoren ergaben sich fünf theoretisch-inhaltlich sinnvoll interpretierbare Faktoren, welche von mindestens drei Variablen (Brandt 2020) dargestellt wurden. Auf Basis dieser anfänglichen Lösung wurden 16 der 50 Items aufgrund niedriger Primärladungen (λ < 0,45) und/oder mehr als einer Nebenladung und drei Items aufgrund von Sekundärladungen (λ > 0,45) aus dem Fragebogen ausgeschlossen. Solche Sekundärladungen trafen auf vier weitere Variablen zu, diese wurden jedoch auf Basis inhaltlicher Überlegungen und da die Sekundärladung zum Teil auf methodische Effekte (invers formulierte Items) zurückgeführt wurde, eindeutig einem Faktor zugeordnet. Zudem konnte deren Einfachstruktur anhand des Fürntratt-Kriteriums bestätigt werden; der den Items zugewiesene Faktor nahm jeweils einen Anteil von über 50 % der jeweiligen Itemkommunalität ein (Fürntratt 1969). Mit den verbleibenden 31 Items wurde nach den Empfehlungen für das Vorgehen bei explorativen Faktorenanalysen von Brown (2015) die explorative Faktorenanalyse mit fünf Faktoren innerhalb der gleichen Stichprobe wiederholt. Im Rahmen dieser zweiten explorativen Faktorenanalyse (siehe Tab. 1) wurde ein weiteres Item („Für mich ist eine verlässlich-konzentriert arbeitende Klasse Voraussetzung für das Experimentieren.“) mit niedriger Primärladung eliminiert, zwei Items mit Sekundärladungen konnten sowohl inhaltlich als auch auf Basis des Fürntratt-Kriteriums erneut eindeutig einem Faktor zugeordnet werden, eine Einfachstruktur ist demnach weiterhin gegeben. In der finalen Version des Fragebogens verblieben somit 30 Items innerhalb der fünf Faktoren. Diese Lösung konnte anfänglich 48 % der Gesamtvarianz aufklären.

Tab. 1 Rotierte Matrix der Varimax-rotierten wiederholten Hauptachsen-Faktorenanalyse sowie Reliabilitätskennzahlen und Mittelwerte der Skalen und Items

Skalenbeschreibung

Die erste Skala (Potenziale für Schüler*innen (1); Items 1–15) beschreibt das Potenzial des Experimentierens, bei den Schüler*innen verschiedene Kompetenzen zu fördern – sowohl auf motivationaler als auch auf kognitiver und motorischer Ebene bzw. sowohl im Bereich der hands-on als auch der minds-on Akvititäten. In Abgrenzung dazu wird innerhalb der zweiten Skala (Potenziale für die Unterrichtsstrukturierung (2); Items 16–18) das Potenzial für die Strukturierung und Gestaltung des Unterrichtsablaufs durch das Experimentieren dargestellt. Items 19–23 bilden (3) kognitive und motorische Lernvoraussetzungen und Items 24–26 (4) motivationale Lernvoraussetzungen der Schüler*innen mit Blick auf das Experimentieren ab. Die fünfte Skala (Items 27–30) beleuchtet die (5) Wichtigkeit von Offenheit bezüglich des Ablaufs sowie der Ergebnisse beim Experimentieren. Eine hohe Ausprägung der Skala (invertiert) bedeutet, dass die angehenden Lehrpersonen bereit sind, sich auf divergierende Ergebnisse und individuelle Lösungswege der Schüler*innen einzulassen.

Deskriptive Statistiken

Die internen Konsistenzen und Split-Half-Reliabilitäten (Spearman-Brown-Koeffizienten) der Skalen lagen im akzeptablen bis sehr guten Bereich (Rabe et al. 2012) (Tab. 1), wobei niedrigere Werte vor allem auf die relativ niedrige Anzahl der Items der Skalen (3–4 Items/Skala) sowie auf methodische Effekte (positiv und negativ formulierte Items in einer Skala) zurückgeführt wurden (Gäde et al. 2020).

Für alle Skalen ergaben sich relativ hohe Zustimmungswerte. Die höchste Zustimmung erhielten die Skalen motivationale Lernvoraussetzungen (M = 4,49; SD = 0,57) und Potenziale für Schüler*innen (M = 4,29; SD = 0,48), die niedrigste Zustimmung hingegen die Skala Potenziale für die Unterrichtsstrukturierung (M = 3,38; SD = 0,79) (Tab. 1). Auf Einzelitemebene lagen die Itemschwierigkeiten zwischen P = 0,58 und P = 0,89, alle Items lagen über der Skalenmitte (M = 3,30–4,57; SD = 0,63–1,10). 14 der 18 Items aus den Skalen Potenziale für Schüler*innen und motivationale Lernvoraussetzungen überstiegen somit den von Döring und Bortz (2016) vorgeschlagenen Bereich zwischen P = 0,20 und P = 0,80. Die Item-Skala-Korrelationen lagen für alle Items zwischen rit = 0,44 und rit = 0,63 und waren somit als mittelmäßig bis hoch zu bewerten (Cohen 1988). Eine Ausnahme bildete das Item 19 mit einer Item-Skala-Korrelation von rit = 0,33. Auch hier wurde der niedrigere Wert auf methodische Effekte durch Invertierung zurückgeführt.

Zwischen den beiden die Potenziale beim Experimentieren (Potenziale für Schüler*innen und Potenziale für die Unterrichtsstrukturierung) und den beiden die Lernvoraussetzungen beim Experimentieren (kognitive & motorische Lernvoraussetzungen und motivationale Lernvoraussetzungen) betreffenden Skalen waren jeweils signifikante mittlere Zusammenhänge festzustellen (Tab. 2). Für die Skala Potenziale für die Unterrichtsstrukturierung war keine weitere signifikante Korrelation vorhanden. Die Skala Potenziale für Schüler*innen korrelierte weiterhin signifikant mit den beiden die Lernvoraussetzungen der Schüler*innen betreffenden Skalen (kognitive & motorische Lernvoraussetzungen und motivationale Lernvoraussetzungen). Für die Skala Wichtigkeit von Offenheit ergab sich ein signifikanter mittlerer Zusammenhang mit der Skala kognitive und motorische Lernvoraussetzungen.

Tab. 2 Skaleninterkorrelationen

Diskussion der Ergebnisse

Ziel der vorliegenden Studie war die Entwicklung und Pilotierung eines Fragebogens zu den Beliefs angehender Lehrpersonen zum Experimentieren im Geographieunterricht. Mit dem entwickelten Fragebogen liegt erstmals ein Instrument zur Erhebung der Ausprägungen der Beliefs angehender Geographielehrpersonen zum Experimentieren mit belastbaren Hinweisen auf seine Reliabilität vor. Anhand des Messinstruments können mehrere Aspekte hinderlicher und förderlicher Beliefs für angehende Geographielehrpersonen identifiziert werden. Der Fragebogen stellt durch seine Ausrichtung auf ein spezifisches Fach sowie auf eine spezifische Methode sowohl für die Geographiedidaktik als auch die Naturwissenschaftsdidaktiken eine Neuheit dar.

Ermittlung der zugrundeliegenden Struktur des Messinstruments

Bei der Entwicklung des Fragebogens wurde auf Grundlage von Re-Analysen qualitativer Erhebungen sowie von Literaturrecherchen zunächst ein inhaltlich stark ausdifferenziertes Itemset von Beliefs zum Experimentieren im Geographieunterricht formuliert. Im Rahmen der explorativen Faktorenanalyse zur Ermittlung der zugrundeliegenden faktoriellen Struktur bzw. Exploration der Dimensionalität des Fragebogens konnten aus dem entwickelten Inventar fünf theoretisch-inhaltlich sinnvolle Faktoren identifiziert werden: (1) Potenziale für Schüler*innen, (2) Potenziale für die Unterrichtsstrukturierung, (3) kognitive & motorische Lernvoraussetzungen, (4) motivationale Lernvoraussetzungen, (5) Wichtigkeit von Offenheit. Innerhalb der Faktoren (1) Potenziale für Schüler*innen und (3) kognitive und motorische Lernvoraussetzungen scheinen die befragten Studierenden nicht zwischen verschiedenen Aspekten (resp. methodische Kompetenzen sowie kognitive, motorische (minds-on und hands-on) und fachlich-inhaltliche Aspekte) des Experimentierens zu differenzieren. Innerhalb des Faktors (1) Potenziale für Schüler*innen findet außerdem keine Differenzierung mit motivationalen Aspekten statt. Ob eine solche Faktorenstruktur auch für im Beruf oder Vorbereitungsdienst befindliche Lehrpersonen vorliegt, gilt es weiterführend zu überprüfen.

Bei Betrachtung der Korrelationen zwischen den identifizierten Faktoren zeigt sich, dass zwischen den die Beliefs zu Potenzialen beim Experimentieren (Potenziale für Schüler*innen und Potenziale für die Unterrichtsstrukturierung) und Lernvoraussetzungen (kognitive & motorische Lernvoraussetzungen und motivationale Lernvoraussetzungen) betreffenden Skalen jeweils positive, mittlere Zusammenhänge festzustellen waren. Gleiches galt für die drei die Schüler*innen direkt thematisierenden Skalen (Potenziale für Schüler*innen, kognitive & motorische Lernvoraussetzungen, motivationale Lernvoraussetzungen). Studierende, die von der Möglichkeit der Förderung von Kompetenzen durch das Experimentieren überzeugt sind, sind folglich ebenso von dem Vorhandensein der kognitiven, motorischen und motivationalen Lernvoraussetzungen der Schüler*innen für das Experimentieren sowie der Möglichkeit, Unterricht durch das Experimentieren zu gestalten und zu strukturieren, überzeugt. Weiterhin scheinen Studierende, die davon überzeugt sind, dass Schüler*innen die Lernvoraussetzungen zum Experimentieren besitzen, einer Offenheit von Experimenten bzw. von dessen Ablauf und Ergebnissen Bedeutung beizumessen.

Hinweise auf Ausprägungen der Beliefs angehender Lehrpersonen zum Experimentieren im Geographieunterricht

Wenn auch das primäre Ziel der vorliegenden Studie in der Entwicklung und Pilotierung des Beliefs-Fragebogens lag, konnte anhand dessen zusätzlich eine erste Beschreibung verschiedener Aspekte hinderlicher und förderlicher Beliefs zum Experimentieren im Geographieunterricht vorgenommen werden. Die befragten Studierenden besitzen insgesamt positive Beliefs zum Experimentieren, sie sind von großen fachdidaktisch relevanten Chancen durch den Einsatz von Experimenten im Geographieunterricht überzeugt. Dabei sehen sie die motivationalen Lernvoraussetzungen der Schüler*innen und die Eignung des Experimentierens zur Förderung von Kompetenzen (Potenziale für Schüler*innen) als gegeben an. Trotz einer relativ hohen Heterogenität der Stichprobe in Bezug auf das Fachsemester und die studierte Schulform herrscht insgesamt und insbesondere bei diesen beiden Skalen eine relativ geringe Varianz in den Beliefs der angehenden Lehrpersonen (SD = 0,48–0,79), was darauf hindeutet, dass die Beliefs in der untersuchten Stichprobe recht homogen sind. Auf Ebene einzelner Items ergeben sich besonders hohe Mittelwerte innerhalb der Skala Potenziale für Schüler*innen für solche Items, welche Potenziale beim Experimentieren bezüglich der Motivierung der Schüler*innen (Item 15 und Item 9) und des erleichterten Verständnisses von Fachinhalten (Item 7) betreffen. Gleiches gilt für Items zur Förderung motorischer Kompetenzen, welche sich also insbesondere auf die praktische Durchführung von Experimenten und entsprechende hands-on Aktivitäten beziehen (Items 10 und 12). Bei Items, welche die Kompetenzen „Fragestellungen formulieren“ und „Hypothesen generieren“ thematisieren (Items 5 und 6), also sich vor allem auf experimentelle Denkweisen beziehen, zeigen sich vergleichsweise niedrigere Mittelwerte. Dies deckt sich mit den Ergebnissen von Dunker (2015, 2016), welche zeigt, dass die von ihr befragten Grundschullehrpersonen beim Experimentieren im Sachunterricht besonders das „handelnde Tun“ und weniger den erkenntnistheoretischen Aspekt in den Vordergrund stellen. Auch bezüglich der Potenziale, welche die von Wallace und Kang (2004) befragten Lehrpersonen im Zuge der Laborarbeit beim forschenden Lernen im Unterricht nennen, und Ziele, welche Physiklehrpersonen mit dem Experimentieren im Unterricht verbinden (Jonas-Ahrend 2004; Welzel et al. 1998), zeigen sich ähnliche Gewichtungen. Vergleichsweise weniger positive Beliefs besitzen die befragten Studierenden gegenüber der Möglichkeit der Unterrichtsstrukturierung durch das Experimentieren, der Wichtigkeit von Offenheit bzw. von Unvorhergesehenem beim Ablauf und den Ergebnissen beim Experimentieren sowie den Lernvoraussetzungen der Schüler*innen. Letztere werden von Lehrpersonen auch in Bezug auf das forschende Lernen (Bevins et al. 2019; DiBiase und McDonald 2015; Wallace und Kang 2004) als beschränkende Faktoren für dessen Umsetzung im naturwissenschaftlichen Unterricht genannt.

Die Gewichtungen dieser Skalen decken sich teilweise mit den Befunden der im Zuge der Itementwicklung re-analysierten qualitativen Interviewstudien (Miener und Köhler 2013)Footnote 4, in denen die befragten Geographielehrpersonen insbesondere die Förderung von Kompetenzen und die Motivation der Schüler*innen für das Experimentieren als Chance, deren unzureichende Voraussetzungen und den ungewissen Ausgang von Experimenten jedoch als Barrieren gegen den Einsatz nennen. Jedoch nehmen einzelne von Miener und Köhler (2013) befragte Lehrkräfte die mangelnde Motivation der Schüler*innen als eine weitere Barriere gegen das Experimentieren im Geographieunterricht wahr, wohingegen die hier befragten Studierenden die motivationalen Lernvoraussetzungen der Schüler*innen als gegeben ansehen. Entgegen der Ergebnisse unserer Studie, in der die Skala Potenziale für die Unterrichtsstrukturierung die niedrigsten Zustimmungswerte aufzeigt, wurde in den Vorstudien sowie auch bei Jonas-Ahrend (2004) außerdem von den im Beruf befindlichen befragten Lehrpersonen die Möglichkeit der Gestaltung der Unterrichtsplanung durch das Experimentieren als Chance genannt.

Existieren zwar speziell zu den Beliefs angehender und im Beruf befindlicher Geographielehrpersonen zum Experimentieren bisher keine weiteren Forschungsergebnisse, decken sich die gefundenen insgesamt positiven Beliefs der Studierenden weiterhin mit den aus benachbarten Bereichen stammenden vorgestellten empirischen Befunden zu förderlichen Beliefs von Studierenden gegenüber dem Einsatz von Labormaterialien (z. B. Aka 2016) sowie von Naturwissenschaftslehrpersonen gegenüber übergeordneten verwandten Konzepten wie dem forschenden Lernen und der Laborarbeit im Unterricht (z. B. Cheung 2011; DiBiase und McDonald 2015).

Grenzen des gewählten Ansatzes

Gleichzeitig sind die hohen Zustimmungswerte zu einzelnen Skalen und ein möglicher Deckeneffekt als kritisch zu betrachten. Diesbezüglich sollte diskutiert und bezüglich einer Weiterentwicklung des Messinstruments berücksichtigt werden, inwieweit die Formulierungen der Items einen Einfluss auf die gefundenen Gewichtungen haben. Für eine Beurteilung dessen sollten im Zuge weiterer Erhebungen unter anderem die Zustimmungswerte von im Beruf befindlichen Lehrkräften vergleichend herangezogen werden. Weiterhin vermuten wir, dass die Beliefs der Studierenden zu einzelnen Aspekten beim Experimentieren wie dem Lernpotenzial und den motivationalen Lernvoraussetzungen der Schüler*innen möglicherweise als überpositiv bzw. „unrealistisch“ einzuordnen sein könnten. Dies könnte einerseits auf eine mangelnde praktische Berufserfahrung der Studierenden und andererseits auf einen von diesen möglicherweise noch nicht erfolgten Perspektivwechsel – von einer Schüler*innen- hin zu einer Lehrendenperspektive – zurückzuführen sein. Auch unzureichendes fachdidaktisches Wissen könnte die Beliefs der Studierenden beeinflussen, sodass ein Treatment in Form eines geographiedidaktischen Seminars, welches auch die Grenzen und Herausforderungen des Experimentierens thematisiert, so zu „realistischeren“ und somit weniger positiven Beliefs führen könnte.

Durch die statistisch begründete Auswahl von 30 der zuvor 50 Items geht zwar ein Informationsverlust einher, dennoch stellen die Skalen eine vergleichsweise spezifische Beschreibung von Potenzialen, die im Experimentieren gesehen werden, bzw. Hindernissen, die der fachspezifischen Ausgestaltung geographischen Experimentierens entgegenstehen, dar. Mit einer Ausnahme konnte aus jedem zuvor theoretisch entwickelten Themenbereich mindestens ein Item im Fragebogen verbleiben, sodass auch nach Ausschluss von 20 Items eine inhaltliche Breite des Messinstruments gewährleistet werden kann. Außerdem wurde sich bei der Entwicklung der Items, wenngleich nicht als zentrale Dokumente, unter anderem auch an Modellen zu Kompetenzen von Schüler*innen beim Experimentieren (im Geographieunterricht) orientiert (z. B. Peter 2014; Schiepe-Tiska et al. 2019). Durch die Schritte der Itemanalyse und -auswahl im Zuge der explorativen Faktorenanalyse wurden einige davon jedoch entfernt, weshalb sich diese Modelle nicht mehr klar in den Items wiederspiegeln. Das hat den Nachteil, dass direkte Vergleiche zwischen den Schüler*innen-Kompetenzmodellen und den Beliefs der Lehrpersonen nicht unmittelbar möglich sind. Zugleich liegt der Fokus auf der Entwicklung eines Instruments zu den Beliefs von Lehrpersonen, sodass diese Einschränkung in Kauf genommen wurde.

Eine zentrale Limitierung findet unser Vorgehen für die Erfassung der Beliefs in dem Format des entwickelten Instruments mit geschlossenem Antwortformat. Als Grundlage für die Formulierung der Items wurde deshalb zunächst eine Re-Analyse qualitativer Interviewstudien zu Chancen und Barrieren des Experimenteinsatzes im Geographieunterricht durchgeführt, deren Erkenntnisse in Kombination mit Literaturrecherchen in ein geschlossenes Format überführt wurden. Dieses Vorgehen war insbesondere notwendig, da bisher wenig Kenntnisse über das Konstrukt Beliefs zum Experimentieren vorliegen. Um trotz geschlossenem Antwortformat den subjektiven und unterbewussten Charakter der Beliefs zu betonen, wurde einerseits nach Rokeach (1969) ein für die Erhebung von Beliefs geeigneter Itemstamm gewählt und andererseits auf eine rasche, intuitive Beantwortung der Items hingewiesen. Durch die Wahl dieses Erhebungsformates muss in Kauf genommen werden, dass anhand des Fragebogens nur Ausschnitte der Beliefs der Studierenden zum Experimentieren abgebildet werden können. Insbesondere mit Blick auf die Skala „Potenziale für die Unterrichtsstrukturierung“ ist dabei kritisch zu beleuchten, ob die Skala mit drei Items den entsprechenden Bereich tatsächlich abzudecken vermag und im Zuge einer Weiterentwicklung des Messinstruments weitere Items, beispielsweise bezüglich Aspekten des Grads an Eigenständigkeit der Schüler*innen und didaktischer Kriterien (entdeckend – erarbeitend – sichernd) und deren Bedeutung für die Unterrichtsstruktur, aufgenommen werden sollten. Gleichzeitig war das geschlossene Fragebogenformat für die Realisierung unseres zentralen Ziels – der Entwicklung eines quantitativen und zeitökonomischen Instruments zur Erfassung von Beliefs zum Experimentieren im Geographieunterricht – notwendig.

Zudem fokussiert das entwickelte Messinstrument mit den Beliefs zunächst auf nur eine Teilkomponente professioneller Handlungskompetenz – wenn auch unser langfristiges Ziel ist, weitere Komponenten in den Blick zu nehmen. Vor diesem Hintergrund können auf Grundlage der vorgestellten Ergebnisse keine belastbaren Vorhersagen über das (zukünftige) unterrichtliche Handeln der angehenden Lehrpersonen getroffen werden, zumal hierfür wie anfangs skizziert möglicherweise weitere Faktoren in den Blick genommen werden müssen.

Implikationen und Ausblick

Im Zuge unserer statistisch begründeten Auswahl von Items resultierte ein zeitökonomisch handhabbarer Fragebogen, welcher die empirische Erfassung der Beliefs angehender Lehrpersonen zum Experimentieren im Geographieunterricht ermöglicht. Somit eignet sich das entwickelte Instrument mit den angeführten Skalen im geographiedidaktischen Bereich der universitären Lehrer*innenbildung für die Erhebung der Beliefs von Studierenden zur Diagnose von Lernausgangslagen sowie weiterführend als Diskussionsanlass in Seminarveranstaltungen. Dies gewinnt insbesondere an Bedeutung, da Teacher Beliefs stark durch die eigenen Lehr- und Lernerfahrungen der Lehrperson geprägt sind, sodass bereits vorhandene Beliefs die Interpretation und Umsetzung des in der Aus- und Fortbildung Gelernten als eine Art Filter beeinflussen (Maier et al. 2013). Die empirische Erfassung durch den Fragebogen ermöglicht den Teilnehmenden einen introspektiven Zugang zu eigenen Beliefs und kann somit didaktische (Selbst‑)Reflexion ermöglichen, insbesondere da für die Veränderung der Beliefs vor allem solche Methoden, „welche eine aktive Auseinandersetzung mit den eigenen Beliefs beinhalten“ (Steinmann und Oser 2012, S. 442), gewinnbringend zu sein scheinen (Blömeke 2003; Fives und Buehl 2012; Reusser und Pauli 2014; Richardson 1996). Solche potenziellen Veränderungen könnten weiterführend mithilfe des entwickelten Instruments in Seminar- und Fortbildungsveranstaltungen untersucht werden. Auch eine Übertragung eines entsprechend sprachlich angepassten Fragebogens auf angehende Lehrpersonen weiterer naturwissenschaftlicher Fächer halten wir für möglich, sodass ein solcher Fragebogen auch für die Lehrer*innenbildung in diesen Bereichen geeignet sein könnte.

War die Entwicklung und Exploration der Dimensionalität des Beliefs-Fragebogens ein erster Schritt in unserem Forschungsvorhaben, soll die ermittelte zugrundeliegende Struktur nun zunächst nach den Empfehlungen von Brown (2015) zur Konstruktvalidierung konfirmatorisch anhand einer größeren unabhängigen Stichprobe Studierender geprüft werden. In diesem Zuge soll auch mit Blick auf die relativ hohe Heterogenität der Stichprobe die Messinvarianz des entwickelten Instruments über die untersuchten Gruppen von Studierenden (z. B. Schulform, Geschlecht) hinweg überprüft und ergänzend Unterschiede zwischen diesen Untergruppen betrachtet werden.

Zudem ist geplant, den Fragebogen für im Vorbereitungsdienst und im Beruf befindliche Lehrpersonen zu validieren. Dies ermöglicht die vergleichende Betrachtung der Beliefs von Lehrkräften in verschiedenen Phasen der Lehrerbildung und liefert in einem nächsten Schritt Erkenntnisse über Zusammenhänge von Beliefs und tatsächlichem unterrichtlichen Handeln von Lehrpersonen beim Experimentieren im Geographieunterricht. Dabei sollen auch weitere Faktoren wie Selbstwirksamkeitsüberzeugungen und (ungünstige) Rahmenbedingungen einbezogen werden.

Darüber hinaus liefert der vorliegende Beitrag ein Beispiel für die fach- und anforderungsspezifische Erfassung der Beliefs von (angehenden) Lehrpersonen. Ein solches Messinstrument ist insbesondere von Bedeutung, da Beliefs, wie anfangs skizziert, stark kontextualisiert aktiviert werden (Fives und Buehl 2012; Mansour 2009) und je nach betrachteter Spezifitätsebene variieren (Gimbel et al. 2018). Gleichzeitig werden Beliefs sowie deren Zusammenhänge mit dem unterrichtlichen Handeln von Lehrpersonen meist auf einer übergeordneten Ebene (beispielsweise zum überfachlichen Lehr- und Lernverständnis) betrachtet, was neben Einflüssen von weiteren internen und externen Faktoren ein Grund für das teilweise uneindeutige Bild dieses Zusammenhangs sein könnte (Fives und Buehl 2012; Petermann und Vorholzer 2022). Unsere geplanten weiterführenden Untersuchungen der Zusammenhänge zwischen Beliefs und dem tatsächlichen unterrichtlichen Handeln beim Experimentieren im Geographieunterricht auf fach- und anforderungsspezifischer Ebene sollen dieser Forschungslücke begegnen.

Die in diesem Beitrag vorgestellte Entwicklung und Pilotierung des Fragebogens zu den Beliefs von Geographielehrpersonen kann also als erster und zugleich notwendiger Schritt angesehen werden, das komplexe Zusammenspiel von Aspekten professioneller Kompetenzen, schulischen Rahmenbedingungen und unterrichtlichem Handeln bezüglich des Experimentierens im Geographieunterricht aufklären zu können.