7.1 Einleitung

Der Einsatz digitaler Technologien in der Schulpraxis hat durch die finanzielle Unterstützung des DigitalPakts Schule einen entscheidenden Anschub erfahren (Huwer & Banerji, 2020). Zusätzlich wurden durch die Corona-Pandemie der Bedarf und die Nachfrage nach digitalen Werkzeugen für den Fern-, aber auch für den Präsenzunterricht offensichtlich. Gleichzeitig rufen viele Schulen die bereitgestellten Mittel nicht ab, da z. B. keine ausreichenden Digitalkonzepte bestehen (Kuhn, 2021).

Während der Pandemie fehlten insbesondere digitale Werkzeuge, die eine Begleitung der Lernenden ermöglichen. Schülerinnen und Schülern fehlt im Fernunterricht ein individuelles Coaching (Wößmann et al., 2021). HyperDocSystems (HDS, Fitting & Hornung, 2021) ist ein digitales Werkzeug, das entwickelt wurde, um genau in diese Lücke zu stoßen und besonders die Differenzierung in den Blick zu nehmen. Damit können Lehrkräfte Lernumgebungen mit multimedialen Zugängen erstellen und mit gestuften Zusatzinformationen ausstatten. Gleichzeitig kann die Nutzung dieses Differenzierungsangebots nachverfolgt werden.

Ziel der Studie: HyperDocs (HD) wurden im Rahmen einer Interventionsstudie im Regelunterricht des Fachs Chemie in der Mittel- und Oberstufe mehrerer Gymnasien und Gesamtschulen in einer vierstündigen Unterrichtsreihe eingesetzt. Dabei wurde die Wirksamkeit von HD gegenüber analogen Materialien bezüglich des Interesses betrachtet. Den zweiten Untersuchungsschwerpunkt bildete die Usability.

7.2 Theoretischer Hintergrund

7.2.1 Interesse, intrinsische Motivation und Self-Determination Theory

In der aktuellen Interessensforschung spielt die Theorie der Person-Gegenstand-Konzeption von Interesse eine wichtige Rolle. Hierbei wird Interesse als eine Erscheinung der Interaktion zwischen einer Person und ihrer „gegenständlichen“ Umwelt (Krapp, 1998) beschrieben. Im schulischen Kontext ist der Interessensgegenstand durch spezielle Themengebiete eines Schulfaches oder bestimmte Tätigkeiten im Unterricht definiert. Die Schülerin oder der Schüler besitzt anfänglich ein starkes oder schwaches Wissen über den Gegenstand. Während der weiteren Auseinandersetzung zwischen Person und Gegenstand werden neue Erfahrungen und Kompetenzen erworben, womit der Gegenstand bzw. Inhaltsbereich erschlossen wird (Krapp, 1998). Das Interessenskonzept steht in Zusammenhang mit anderen Motivationstheorien, wie z. B. der Selbstbestimmungstheorie (Deci & Ryan, 1985). Die Entwicklung von Interesse verläuft zunächst über situationales Interesse, welches z. B. durch einen interessanten Lernkontext gefördert wird. Aus diesem situationalen Interesse kann anschließend ein langfristiges individuelles Interesse entstehen. Dabei führt nicht jedes situationale Interesse zwangsläufig zu einem individuellen Interesse. Mitchell (1993) unterscheidet in diesem Zusammenhang zwischen Catch- und Hold-Faktoren. Während Catch-Faktoren (z. B. Computereinsatz, Gruppenarbeit) das anfängliche Interesse eines Lernenden wecken können, sorgen Hold-Faktoren (sinnstiftender Kontext, Eingebundenheit) für ein andauerndes situationales Interesse am Gegenstand (Mitchell, 1993).

Es bestehen zum Teil unterschiedlich starke Interessensentwicklungen zwischen den Fächern und innerhalb der Fächer (Großmann et al., 2021). Insgesamt scheint das Interesse an den naturwissenschaftlichen Fächern bei Schülerinnen stärker abzunehmen als bei Schülern (Krapp, 1998).

Personen werden durch intrinsische und extrinsische Faktoren zu einer Handlung bewegt. Dabei hat sich gezeigt, dass intrinsisch motivierte Menschen oftmals mehr Interesse, Selbstsicherheit und Freude erzeugen, wodurch eine höhere Performanz der Handlung und Kreativität erreicht werden (Deci & Ryan, 1991). Die Selbstbestimmungstheorie (engl. Self-Determination Theory, SDT) legt einen differenzierteren Blick auf das Konstrukt Motivation und versucht einzelne Facetten der Motivation zu ergründen (Ryan & Deci, 2000).

Das Interesse kann als ein Hauptindikator der intrinsischen Motivation angesehen werden. Digitale Medien können in diesem Zusammenhang die Motivation und den Lernzuwachs beim Lernen erhöhen. Dabei zeigen insbesondere digitale Werkzeuge (z. B. Tutoring-Systeme) große Effekte, die zu einem größeren Autonomie- und Kompetenzerleben beitragen (Hillmayr et al., 2020).

7.2.2 Usability

In Verbindung mit digitalen Werkzeugen sowie dem Interesse und Lernerfolg spielt die Usability eine wichtige Rolle (Karapanos et al., 2018). Der Begriff der Usability ist ins Deutsche am zutreffendsten mit Benutzerfreundlichkeit oder Benutzbarkeit zu übersetzen. Ein weiterer Ausdruck ist die User Experience (Benutzererfahrung). Teilweise werden diese Begriffe gleichbedeutend verwendet, wobei die User Experience neben der Funktionalität technischer Systeme auch deren Ästhetik und Design in den Blick nimmt (Richter & Flückiger, 2016).

Die Benutzbarkeit eines Softwaresystems umfasst Aspekte wie die Einfachheit des Erlernens der Nutzung oder die Effizienz, mit der Aufgaben erledigt werden können. Gleichzeitig müssen passende Funktionen vorhanden sein, um diese Aufgaben zielgerichtet abschließen zu können. Die ISO-Norm 9241–11 bestimmt zur Gebrauchstauglichkeit eines Produkts dessen Effektivität, Effizienz und Zufriedenheit in einem bestimmten Aufgabenkontext (Richter & Flückiger, 2016). Die Usability kann über verschiedene Methoden, wie z. B. Fragebögen, erfasst werden (Holzinger, 2005; Richter & Flückiger, 2016).

In einer Studie von Karapanos et al. (2018) konnte ein signifikanter Zusammenhang zwischen der Usability eines Systems und dem Lernerfolg in einem Biologieleistungskurs gezeigt werden. Die Autorinnen und Autoren begründen diesen Zusammenhang anhand der Cognitive Load Theory (Sweller, 1988), wodurch eine schlechtere Usability zu einem höheren Extraneous oder Intrinsic Cognitive Load und damit zu einem geringen Lernzuwachs führt. Auch zeigt sich in dieser Studie ein schwacher positiver Zusammenhang zwischen der Benutzerfreundlichkeit und dem Interesse, wobei dieser Effekt durch eine positive Erwartungshaltung gegenüber dem Produkt verstärkt werden kann (Karapanos et al., 2018; Raita & Oulsavirta, 2011). Zu einem ähnlichen Ergebnis kommen Meiselwitz und Sadera (2008). Sie weisen darauf hin, dass für eine dauerhafte Verwendung von elektronischen Lernumgebungen die Bedienbarkeit eine zentrale Rolle spielt.

7.3 HyperDocSystems (HDS)

Es existieren verschiedene digitale Werkzeuge, um multimedial angereicherte Lernmaterialien zu erstellen. Ein Beispiel hierfür sind iBooks (Seibert et al., 2020), mit denen sich E-Book-ähnliche digitale Bücher mit verschiedenen Erweiterungen (Videos, Lernhilfen, …) erstellen lassen. Eine Limitation der iBooks ist die Voraussetzung eines Apple-Gerätes zum Erstellen und Nutzen dieser Medien (Seibert et al., 2020). Mit HDS können Lehrkräfte digitale Arbeitsmaterialien mit einem ähnlichen Funktionsumfang wie iBooks erstellen. Die browserbasierte (Mozilla Firefox, Google Chrome, Microsoft Edge, Apple Safari) und frei verfügbare Anwendung von HDS ist dabei betriebssystemunabhängig. Dadurch lässt sich HDS auf allen Endgeräten nutzen. Der Begriff HyperDoc setzt sich aus Hyperlink und Document zusammen, da Nutzerinnen und Nutzer verschiedene Hilfen und Vertiefungsaufgaben innerhalb des Dokuments über vordefinierte Felder öffnen können (Abb. 7.1). Das System wurde Ende 2019 fertiggestellt und wird seitdem erprobt.

Abb. 7.1
figure 1

Übersicht eines HyperDocs mit verschiedenen Funktionen

Beim Einsatz von HDS bieten sich folgende Vorteile: Die Bearbeitung der Dokumente erfolgt über die Tastatur oder Stylus (z. B. Apple Pencil) und Lehrkräfte können die Bearbeitungen online einsehen. Über eine Monitoring-Funktion erhalten Lehrende Informationen darüber, welche multimedialen Zugänge (Text, Bild, Video, Audio) die Lernenden aus dem Angebot der zur Verfügung gestellten Hilfen auswählen und wie oft diese Hilfen aufgerufen werden.

Einordnung des Beitrags in die dargestellte Theorie

Bei HDS handelt es sich um eine Applikation, die mit der Intention der einfachen Umsetzung der digitalen Binnendifferenzierung im Schulunterricht konzipiert wurde. Durch seine Beschaffenheit als digitales Werkzeug gehen bestimmte Anforderungen, wie z. B. eine hohe Benutzerfreundlichkeit (Usability), einher, die sich wiederum auf den Lernerfolg und das Interesse auswirken können. Gleichzeitig bietet das Medium im Sinne der Interessensentwicklung eine Möglichkeit, als Catch-Komponente die Interessensbildung am Lerngegenstand anzustoßen.

Es werden folgende Fragestellungen untersucht:

  1. 1.

    Wie bewerten Schülerinnen und Schüler die Usability von HDS und bestehen dabei Unterschiede zwischen den Geschlechtern und dem Alter?

  2. 2.

    Existiert ein Zusammenhang zwischen der Usability und dem Interesse?

  3. 3.

    Existieren signifikante Unterschiede im Interesse zwischen der erstmaligen Nutzung von HDS und einer analogen Variante und kann demnach die Applikation als Catch-Faktor dienen?

7.4 Methodisches Vorgehen

7.4.1 Beschreibung der Stichprobe und Intervention

Bei der vorliegenden Studie handelt es sich um eine quasiexperimentelle Feldstudie (Rost, 2013). Die Intervention fand im Zeitraum zwischen Sommer und Winter 2020 statt. Die Kontrollgruppe konnte aufgrund der Pandemie erst im Sommer 2021 und folglich an anderen Schulen erhoben werden. Die Stichprobe umfasst in der Summe 666 Schülerinnen und Schüler, wovon 468 der Interventionsgruppe und 198 der Kontrollgruppe zugeordnet sind (Tab. 7.1 und 7.2).

Tab. 7.1 Stichprobe der Interventionsgruppe. Insgesamt wurde die Stichprobe von fünf Schulen gewonnen. Das Durchschnittsalter der Mittelstufe beträgt 14.75 und der Oberstufe 16.90 Jahre
Tab. 7.2 Stichprobe der Kontrollgruppe. Insgesamt wurde die Stichprobe aus fünf Gymnasien gewonnen. Das Durchschnittsalter der Mittelstufe beträgt 15.24 und der Oberstufe 16.64

Beide Gruppen nahmen im regulären Klassen- bzw. Kursverband an der Erhebung teil. Die teilnehmenden Schulen besitzen keinen speziell ausgeprägten Schwerpunkt, wie z. B. digitale Schule oder Ähnliches, und stammen alle aus Rheinland-Pfalz.

Die Interventionsgruppe arbeitete innerhalb der vierstündigen Unterrichtsreihe im Regelunterricht ausschließlich mit HD, die Kontrollgruppe mit analogen Arbeitsblättern und Hilfen. Sie wurden bei der Kontrollgruppe in Umschlägen an jedes Arbeitsblatt angeheftet. Video- und Audiodateien verschiedener Hilfen konnten folglich in der analogen Variante nicht eingesetzt werden.

Bei der Unterrichtsreihe für die Mittelstufe, mit Ausnahme der Einführungsstunde, handelte es sich um eine adaptierte und erprobte Unterrichtsreihe von Czubatinski et al. (2020). Die Inhalte der Arbeitsmaterialien wurden in HD integriert und mit einem multimedialen Differenzierungsangebot (Hilfen und Vertiefungsaufgaben) angereichert. In der ersten Stunde erfolgte eine Einführung in den Umgang mit Tablets. In der Kontrollgruppe wurde die Einführung in die Nutzung des analogen Differenzierungsangebots anhand des gleichen Themas erprobt. Ab der zweiten Stunde begann die Unterrichtsreihe zum Thema Farbstoffe in Lebensmitteln. Die Unterrichtsreihe der Oberstufe wurde von Nieß et al. (2020) adaptiert und nach dem gleichen Verfahren wie oben angepasst. Sie behandelte den gleichen Kontext mit einer anderen Akzentuierung (Abb. 7.2).

Abb. 7.2
figure 2

Übersicht der Unterrichtsreihe der Interventionsgruppe und Kontrollgruppe (mit Ausnahme Stunde 1; siehe oben) für die Mittel- und Oberstufe

7.4.2 Methode der Datenerhebung und Datenauswertung

Die gesamte Erhebung wurde vom Studienleiter selbst durchgeführt, um lehrpersonenabhängige Effekte auszuschließen. Nach jeder Stunde wurde begleitend zur Intervention ein Fragebogen eingesetzt. Das Interesse wurde durch eine Subskala des Intrinsic Motivation Inventory (IMI, CSDT, 2020) und die Usability nach Lund (2001) erhoben. Er unterteilt in drei bis vier verschiedene Skalen: Nützlichkeit (Usefulness), Zufriedenheit (Satisfaction), Einfachheit des Lernens der Nutzung (Ease of Learning) und Einfachheit der Nutzung (Ease of Use)USE. Die beiden Letzten werden teilweise auch zu einer Skala vereint. Das originale Instrument umfasst 30 Items, wobei manche Items eine geringe Faktorladung aufweisen (Lund, 2001). Für den Unterricht wurde eine gekürzte Fassung des USE erstellt, für die zunächst die Items mit hohen Faktorladungen übersetzt und geeignete Items mit einer einfachen verständlichen Formulierung ausgewählt wurden.

Da in der hier vorliegenden Studie mit HDS eine reduzierte Anzahl an Items des ursprünglichen USE und eine übersetzte Version eingesetzt wurden, wurde eine konfirmatorische Faktorenanalyse mit dem R-Paket lavaan (Rosseel, 2012) durchgeführt. Aufgrund der fehlenden multivariaten Normalverteilung wurde sich für einen robusten MLM-Schätzer entschieden. Dabei konnte ein akzeptables bis gutes Modell (Hu & Bentler, 1999) bestehend aus den ursprünglichen drei Faktoren Zufriedenheit, Nützlichkeit, Einfachheit des Lernens (Modell 1) oder Einfachheit der Nutzung (Modell 2) gebildet werden. Das Faktorenmodell verschlechtert sich hingegen etwas, wenn alle vier Faktoren in die Analyse miteinbezogen werden (Modell 3), da unter anderem eine hohe Korrelation zwischen den Items der zuletzt genannten Faktoren und damit Kreuzladungen vorliegen. Eine Zusammenlegung der Faktoren Einfachheit des Lernens und Einfachheit der Nutzung führte zum schlechtesten Modell (Modell 4). Da Lund (2001) sowohl von einem Modell mit drei als auch mit vier Faktoren ausgeht, wurde sich aufgrund des geringeren AIC für das Modell 3 entschieden, da die Zusammenlegung der Faktoren Ease of Learning und Ease of Use zum schlechtesten Modell führte (Tab. 7.3).

Tab. 7.3 Robuste Parameter der einzelnen Modelle

In Tab. 7.4 sind die Reliabilitäten der einzelnen Instrumente dargestellt. Bei allen Instrumenten wurden fünfstufige Items vom Likert-Typ eingesetzt, wobei ein höherer Wert (1–5) eine größere Zustimmung ausdrückt.

Tab. 7.4 Übersicht der Reliabilität, Itemschwierigkeit und Trennschärfe der verwendeten Instrumente

Es wurden nur Individuen in die Auswertung miteinbezogen, die im Fall der Usability in zwei der vier Stunden oder im Fall des Interesses in allen vier Stunden anwesend waren. Fehlende Werte wurden durch den EM-Algorithmus mittels der R-Bibliothek norm2 (Schafer, 2021) ersetzt. Zuvor wurden Fälle ausgeschlossen, bei denen die Bearbeitung von mehr als 50 % der Items pro Skala fehlten. Auf den gesamten Fragebogen bezogen lag der Anteil der fehlenden Werte auf einem niedrigen Niveau (< 1 %). Die Gruppenunterschiede wurden mittels eines Welch-Tests (geringe Varianzhomogenität) und gepaarten t-Tests verglichen. Die Normalverteilung war in keiner Skala erfüllt, was allerdings nach Kubinger et al. (2009) keine notwendige Voraussetzung für den Welch-Test darstellt. Ausreißer wurden bewusst nicht aus den Datensätzen entfernt, da der Stichprobenumfang groß war und zudem die gesamte Breite an Rückmeldungen einbezogen werden sollte. Insgesamt war die Anzahl der starken Ausreißer (1. Quartil – 3*Interquartilabstand, 3. Quartil + 3*Interquartilabstand) über alle Faktoren jedoch gering (Usability: < 3 %; Motivation: < 1 %). Die Zusammenhangsanalysen wurden nach Pearson bestimmt.

7.5 Ergebnis

7.5.1 Usability

Der Vergleich zwischen der Mittel- und Oberstufe der Interventionsgruppe nach der erstmaligen Nutzung (Testzeitpunkt 1: TZP 1) zeigte einen signifikanten Unterschied in der Bewertung der Nützlichkeit des Systems (US_N) und der Zufriedenheit (US_Z), der auch bestehen bleibt, wenn nur Gymnasiastinnen und Gymnasiasten betrachtet werden (Tab. 7.5).

Tab. 7.5 Ergebnisse des Welch-Tests zwischen Mittelstufe (MIT) und Oberstufe (OB) zum TZP 1

Demnach bewerteten Lernende der Oberstufe die Usability bezüglich dieser beiden Faktoren schlechter. Unterschiede zwischen den Geschlechtern wurden bezüglich dieser Fragestellung sowohl in der Mittelstufe (US_N: p = .52, US_Z: p = .07, US_EN: p = .88, US_EL: p = .91) als auch in der Oberstufe (US_N: p = .67, US_Z: p = .79, US_EN: p = .55, US_EL: p = .08) nicht festgestellt.

In der Mittelstufe gab es keine signifikanten Unterschiede zwischen den Schulformen (US_N: p = .53, US_Z: p = .60, US_EN: p = .15, US_EL: p = .29). Für die Oberstufe sind in diesem Zusammenhang nicht genügend Datenpunkte für die Gesamtschule vorhanden, weshalb auf einen Vergleich verzichtet wurde.

Auch am Ende der Unterrichtsreihe (TZP 2) existieren signifikante Unterschiede hinsichtlich der Nützlichkeit des Systems und der Zufriedenheit zwischen der Mittel- und Oberstufe (Tab. 7.6).

Tab. 7.6 Ergebnisse des Welch-Tests zwischen Mittelstufe (MIT) und Oberstufe (OB) zum TZP 2

Sowohl in der Mittel- als auch in der Oberstufe schätzten die Schülerinnen die Nützlichkeit des Systems zum TZP 2 schlechter ein als die Schüler. Dieser Effekt ist in der Mittelstufe ausgeprägter. Das Signifikanzniveau wird nur knapp nicht erreicht (US_N: M(w.) = 3.77 (1.14), M(m.) = 3.98 (.99), t(342.54) = 1.86, p = .06, d = .2). In der Mittelstufe bewerteten die Lernenden des Gymnasiums die Zufriedenheit, Einfachheit der Nutzung und Einfachheit des Lernens (der Nutzung) signifikant besser (Tab. 7.7). Für die Oberstufe sind nicht genügend Datenpunkte in der Gesamtschule vorhanden.

Tab. 7.7 Ergebnisse des Welch-Tests zwischen Gesamtschule (GES) und Gymnasium (GYM) zum TZP 2

Bei Betrachtung der Unterschiede zwischen der ersten Erhebung, nach erstmaliger Nutzung des Systems, und nach der zweiten Erhebung, am Ende der Unterrichtsreihe, zeigt sich eine signifikante Abnahme der Einschätzung der Usability über alle Gruppen hinweg (Abb. 7.3). Unter Betrachtung der gesamten Stichprobe nimmt diese bezüglich aller Faktoren signifikant ab (Tab. 7.8).

Abb. 7.3
figure 3

Usability von HDS nach einmaliger (TZP 1) und mehrmaliger Nutzung (TZP 2) in der Mittel- und Oberstufe (n = 468)

Tab. 7.8 Ergebnisse des gepaarten t-Tests zwischen TZP 1 und TZP 2

7.5.2 Interesse

Ein Vergleich zwischen Kontroll- und Interventionsgruppe zeigt zum TZP 1 in der Mittelstufe und Oberstufe ein signifikant geringeres Interesse in der Kontrollgruppe als in der Interventionsgruppe (Tab. 7.9).

Tab. 7.9 Ergebnisse des Welch-Tests zwischen Interventionsgruppe (IG) und Kontrollgruppe (KG) in der Mittelstufe (INT_M) und Oberstufe (INT_O) zum TZP 1

Unterschiede zwischen den Schulformen bestehen in der Interventionsgruppe nicht (Mittelstufe: p = .22; Oberstufe: p = .24). Signifikante Unterschiede hinsichtlich des Interesses zwischen den Geschlechtern sind lediglich in der Mittelstufe (Kontrollgruppe) zu finden (M(m.) = 3.39 (.91), M(w.) = 2.83 (1.04), t(139.52) = 3.52, p = .001, d = .58).

Ein Vergleich zwischen den Gruppen über alle vier Messzeitpunkte wird zu einem späteren Zeitpunkt veröffentlicht. Einen ersten Ausblick liefert Abb. 7.4.

Abb. 7.4
figure 4

Mittelwert der Skala Interesse für die Mittelstufe und Oberstufe im Vergleich zwischen Interventions- und Kontrollgruppe über vier Unterrichtsstunden

7.5.3 Zusammenhänge zwischen Usability und Interesse

Um die Daten der Einschätzung der Usability mit denen des Interesses zu vergleichen, wurde ein Matching beider Datensätze durchgeführt (Mittelstufe: n = 314, Oberstufe: n = 101, Geschlechter gleich verteilt).

Bei Betrachtung der Korrelation über alle Nutzergruppen besteht zwischen dem Interesse und der Einschätzung der Usability nach dem erstmaligen Einsatz von HDS ein mittlerer bis starker signifikanter Zusammenhang (Tab. 7.10).

Tab. 7.10 Ergebnisse der Zusammenhangsanalyse zwischen Usability und Interesse. (P) steht für TZP 2. **p < .001

Die Effektstärken sind für die Mittel- und Oberstufe sowie für die Geschlechter in etwa gleich. Nach der letzten Unterrichtsstunde blieben die Korrelationen mit einer mittleren bis hohen Effektstärke auf einem signifikanten Niveau.

7.6 Diskussion und Fazit

Das eingesetzte Instrument zur Erfassung der Usability (Lund, 2001) weist nach der hier durchgeführten Faktorenanalyse noch einige Schwächen auf. Das vierfaktorielle Modell (Modell 3) weist gegenüber dem dreifaktoriellen Modell 4 nur einen leicht besseren Fit auf, weshalb es weiterer Untersuchungen bedarf. Zu einem ähnlichen Schluss kommen Gao et al. (2018), die das ursprüngliche Instrument mit allen Items validiert haben. Es wurden ähnliche Faktoren wie bei Lund (2001) gefunden, allerdings weist das gebildete Faktorenmodell (CFA) einen schlechten Fit auf (χ2(399) = 1198.7, p < .001, RMSEA = .117). Die Studie bestätigt jedoch die guten Reliabilitäten, die auch Hendra und Yulyani (2018) und Hariyanto et al. (2020) ermittelten.

Bezogen auf HDS kann die Einschätzung der Usability insgesamt als gut eingestuft werden. Insbesondere die Einfachheit des Lernens der Bedienung und der Nutzung sind hierbei positiv hervorzuheben. Die schlechtere Bewertung der Usability durch Schülerinnen könnte womöglich mit einer geringeren computerbezogenen Selbstwirksamkeit im Vergleich zu Schülern zusammenhängen (Vekiri & Chroaki, 2008). Da sich der Unterschied erst zu TZP 2 zeigt, wird dieser womöglich durch den Neuheitseffekt oder das anfänglich hohe Interesse bei TZP 1 überdeckt. Es fällt außerdem die höhere Bewertung der Usability bei Gymnasiastinnen und Gymnasiasten zu TZP 2 auf. Hier liegt eventuell eine Interaktion mit dem Interesse vor, das bei diesen Lernenden ebenfalls höher ist. Die schlechtere Bewertung der Usability von Lernenden der Oberstufe gegenüber denen der Mittelstufe könnte im geringeren Interesse Ersterer begründet sein. Eventuell stellen Schülerinnen und Schüler der Oberstufe auch höhere Anforderungen an ein digitales Werkzeug, da sich die Unterschiede lediglich in Bezug auf die Zufriedenheit und die Nützlichkeit zeigen. Ferner zeigt sich, dass die Einschätzung der Usability über die Nutzungsdauer eines Systems abnehmen kann.

Der Einsatz von HD kann im Vergleich zu analogen Arbeitsblättern bei einem erstmaligen Einsatz das Interesse signifikant erhöhen und als Catch-Faktor dienen. Es besteht damit die Möglichkeit, weniger interessierte Lernende zu einer aktiven Auseinandersetzung mit dem Lerngegenstand zu bewegen. Dieser Effekt könnte bei mehrmaligem Einsatz mit der Zeit abnehmen, was sich bereits in anderen Studien zeigte und wahrscheinlich unter anderem auf den Neuheitseffekt zurückzuführen ist (Schulz, 2020). Es sind jedoch noch genauere Analysen durchzuführen, um diese Effekte zu überprüfen. Zur langfristigen Interessensentwicklung können die multimedialen Lernhilfen als Hold-Komponente beitragen, indem das Gefühl der Eingebundenheit (Mitchell, 1993) verstärkt wird. Diese Hypothese erfordert eine längerfristige Längsschnittstudie. Es sind weitere Analysen geplant, bei denen untersucht wird, wie sich die anderen Faktoren der SDT im Vergleich zwischen der Interventionsgruppe und der Kontrollgruppe verhalten.

Weiterhin kann der Zusammenhang zwischen Usability und Interesse bestätigt werden. Die Effekte sind dabei als hoch einzustufen. Aus den Ergebnissen der Studie lässt sich folgern, dass das Interesse und die Usability sich gegenseitig beeinflussen, da geringer interessierte und motivierte Schülerinnen und Schüler das System auch als weniger nützlich erachten.

Neben dem interessefördernden Aspekt konnten im Rahmen der Studie Vorteile beobachtet werden, die aber noch nicht empirisch belegt sind: Durch das Differenzierungsangebot können Lehrende die individuellen Lernprozesse der Lernenden begleiten, die einzelnen Lernprodukte allen Schülerinnen und Schülern zugänglich machen und den eigenen Unterricht evaluieren.

In Ausblick zu stellen wären nun Untersuchungen, bei denen HDS bei Lerngruppen eingesetzt wird, die bereits länger mit digitalen Technologien arbeiten. Außerdem wäre ein Vergleich zwischen einfachen digitalen Arbeitsblättern ohne Differenzierung über Hilfekärtchen und den HD zu untersuchen, um die Rechtfertigung des Einsatzes einer binnendifferenzierten Variante weiterführend empirisch zu stützen.

Insgesamt bekräftigen die bisher ausgewerteten Daten die Erkenntnisse im Bereich der Usability- und Motivationsforschung im Zusammenhang mit digitalen Technologien. Dabei kann HDS als ein reliables und valides System zur Umsetzung digitaler multimedialer Arbeitsmaterialien angesehen werden, das als Catch-Faktor zur Interessensentwicklung in einem allgemeineren Kontext genutzt werden kann. Weiterhin können individuelle Unterschiede zwischen den Lernenden durch die Möglichkeit der Differenzierung mit z. B. textbasierten und videobasierten Inhalten berücksichtigt werden.

7.7 Limitation

Die durchgeführte Studie weist aufgrund der Corona-Pandemie Limitationen auf. Die Zuweisung der Vergleichs- und Kontrollgruppe erfolgte nicht vollkommen randomisiert und die Stichprobengröße der Kontrollgruppe ist deutlich kleiner.

Gleichzeitigt erfolgte die Erhebung der Kontrollgruppe in einem versetzten Zeitraum und an anderen Schulen, sodass schulspezifische Effekte bei den Ergebnissen nicht vollkommen ausgeschlossen werden können. Dagegen spricht, dass die Schulen keinen digitalen Schwerpunkt hatten und sich in Bezug auf die Nutzung digitaler Werkzeuge nur gering unterschieden. Weiterhin ist bei dem Vergleich zwischen Vergleichs- und Kontrollgruppe anzumerken, dass der Kontrollgruppe natürlicherweise ein geringeres Differenzierungsangebot, ohne Video- und Audiohilfen, zur Verfügung stand. Aus den Ergebnissen der Vergleichsgruppe zur Nutzungshäufigkeit (hier nicht dargestellt), differenziert nach Darbietungsform, lässt sich jedoch eine eher geringe Nutzung (< 5 %) von Video- und Audiohilfen ablesen, zumal versucht wurde, den Informationsgehalt in allen Darbietungsformen äquivalent zu gestalten. Bei Betrachtung der Oberstufe konnten keine schulbezogenen Unterschiede analysiert werden, da die vorhandene Teilstichprobe zu klein war.

Bei dem Vergleich zwischen Vergleichs- und Kontrollgruppe ist auf den Versuchsleitereffekt (Rosenthal-Effekt) hinzuweisen, da die Erhebung von dem Studiendesigner selbst durchgeführt wurde. Um gleiche Bedingungen zu schaffen, wurde das Unterrichtsskript zwischen den beiden Gruppen nicht verändert und keine Kenntnisse über die Klassen (z. B. Leistung) vor der Erhebung ausgetauscht. Eine Ausnahme bildet Stunde 1, in der die Einführung in das Arbeiten mit dem Tablet durch die Einführung in das Arbeiten mit den Lernhilfen in den beigefügten Umschlägen substituiert wurde.

Bezüglich der Testinstrumente ist anzumerken, dass bei der Usability vier Faktoren angenommen wurden. Zum Teil liegen hohe Korrelationen zwischen den Faktoren Einfachheit der Nutzung und Einfachheit des Lernens der Nutzung vor. Bei allen Instrumenten zeigen zudem die Itemschwierigkeiten eine unzureichende Differenzierung im oberen Bereich.

Förderung

Das Vorhaben „Die Zukunft des MINT-Lernens“ wird von der Deutschen Telekom Stiftung gefördert.“ Das Vorhaben „U.EDU: Unified Education – Medienbildung entlang der Lehrerbildungskette“ wird im Rahmen der gemeinsamen „Qualitätsoffensive Lehrerbildung“ von Bund und Ländern aus Mitteln des Bundesministeriums für Bildung und Forschung gefördert.