Navigation – Plan du site

AccueilNuméros26Débat-discussionLes LA : des réponses et des prom...

Texte intégral

1L’appel au débat « Les Learning Analytics en question ? » invite à une discussion sur cette approche liée à l’exploitation de données massives (Big Data). Daniel Peraya l’indique dans son texte introductif, l’approche des Learning Analytics (LA) est source de débats multiples, tant sur le périmètre qu’elle recouvre, que sur les considérations déontologiques et éthiques qu’elle suscite. C’est peut-être parce qu’elle renvoie à un imaginaire technique (Flichy, 2001), dont la formation est récente (la définition la plus populaire des LA, celle de Siemens date de 2010) et qu’elle implique des acteurs d’horizons variés (enseignants, chercheurs, preneurs de décision, apprenants…). Sous-jacente, c’est pourtant bien la conviction de trouver des informations pertinentes sur le processus d’apprentissage à partir de données qui anime cette approche (Siemens, 2011). En misant sur les données, le potentiel d’analyse serait renouvelé (Azemard, Henda et Hudrisier, 2015, cités par Peraya, 2019).

2Notre contribution à ce dossier a donc pour ambition de positionner notre propos par rapport à cette approche, en répondant principalement à la question du lien entre LA et démarche éthique. De fait, si cette approche offre des opportunités, notre texte se propose surtout d’en questionner les limites, dans une perspective critique.

Positionnement par rapport aux LA

3Sans revenir sur l’ensemble des arguments énoncés par Daniel Peraya dans son texte, nous commencerons notre contribution par revenir sur la question du périmètre des LA. À ce sujet, nous le rejoignons sur l’emploi de la locution « analytique des activités d’apprentissage instrumentées » (Djoudi et al., 2018), en guise d’équivalent francisé aux LA.

4Mais, comme l’invitent les auteurs à le faire dans leur proposition de terminologie, la question des contours de l’apprentissage peut être posée : dans le cadre d’une activité d’apprentissage en ligne, dans un MOOC par exemple, on peut attendre des apprenants qu’ils consultent des ressources, qu’ils produisent du contenu, qu’ils échangent entre eux. Dans cette activité, l’ensemble des actions des apprenants au sein de l’environnement virtuel de travail est susceptible de générer des données (des traces d’activité), qui pourront être analysées dans le but d’optimiser l’expérience d’apprentissage par exemple. Ici, l’expression « analytique des activités d’apprentissage instrumentées » décrit et recouvre bien les méthodes et processus mobilisés.

5Dans ce même exemple, où l’on s’intéresse à des participants à un MOOC, il pourrait être intéressant d’ouvrir l’analyse à ce qui se joue en dehors de la plateforme : il est possible que pour produire du contenu, les apprenants s’appuient sur des compétences construites en dehors de l’activité d’apprentissage instrumentée. De même, le processus d’apprentissage n’est pas restreint aux activités formelles d’apprentissage. Dans ces cas, l’expression « analytique des comportements instrumentés », également proposée par le groupe de travail de la Direction du numérique pour l’éducation (DNE) semble mieux convenir.

6De fait, c’est dans cette perspective que nous ancrons nos contributions à des travaux de recherche qui reposent sur l’analyse de données numériques pour décrire des comportements et des situations instrumentés, susceptibles de générer des apprentissages.

Faire parler les données

7Une fois notre positionnement précisé, nous souhaitons revenir sur la place des données dans les LA. Comme indiqué dans la section précédente, c’est parce que de plus en plus de données sont générées que les LA se déploient. Et, comme l’analyse Baron (2014), les LA poursuivent sur un objectif, celui de « mieux utiliser les grandes masses de données pour améliorer l’éducation ». Cette amélioration passe par une meilleure information des acteurs (les apprenants, les enseignants, les gestionnaires de formation et tous les autres acteurs impliqués) sur la situation d’apprentissage, pour leur offrir « une marge d’action supérieure » (Baron, 2014, p. 5) .

8De quelles données parlons-nous ? Il peut s’agir des traces d’activités, ces ensembles d’empreintes laissées volontairement ou non lors de l’utilisation d’un environnement numérique (Michel, 2015 ; Mille, 2013). Les traces peuvent être déclaratives (des productions laissées volontairement, comme des billets de blogs), comportementales (lorsqu’elles rendent compte du comportement des usagers à travers les requêtes formulées pour indiquer entre autres des préférences, c’est principalement sur ces traces que se basent ensuite les services de recommandation) ou liées à une identité calculée (en agrégeant des indicateurs comme le nombre de liens sur les réseaux sociaux par exemple) (Merzeau, 2013).

9La richesse des LA ne s’arrête pas là : si l’ensemble des données décrites juste avant sont directement liées à l’utilisation d’un environnement numérique, d’autres données viennent s’ajouter au corpus disponible pour cette analytique : des données liées au parcours scolaire des apprenants par exemple (les notes, les appréciations, les résultats aux tests…) sont autant d’informations susceptibles de « détecter de l’originalité et de la valeur ajoutée » (Azemard et al., 2015, p. 19).

10Dans ce contexte, on assiste alors presque à un fantasme technologique : on pourrait désormais mieux comprendre ce que « les apprenants apprennent et symétriquement ce que les enseignants enseignent » (Huet et Chérigny, 2019, p. 2). De même, le concepteur de formation à distance peut s’en saisir pour repenser ses parcours de formation, en anticipant les difficultés des apprenants ou en se fondant sur des prédictions relatives à leur progression.

11Pour ce faire, les LA s’appuient sur des techniques issues de plusieurs domaines (la fouille, la visualisation de données, les statistiques…) pour fournir des recommandations, des prédictions ou proposer des modélisations.

12Dans le cadre de notre recherche doctorale qui a porté sur les pratiques numériques juvéniles (Pierrot, 2018), nous avons utilisé un processus de collecte, traitement et analyse de données numériques. Pour cela, nous avons eu recours à une approche guidée de l’observation par les traces (Iksal, 2012) dont le principe est d’identifier des schémas d’informations dans les données. Cette approche guidée a servi à rendre compte de pratiques numériques, à partir d’un modèle formalisé qui définit des règles pour enrichir les données collectées. Dans notre cas, ces données correspondaient uniquement à des logs (historiques de navigation et logs d’activité issus d’un logiciel de traçage). Et, au risque d’avoir une formalisation figée de l’activité, les données ont permis d’observer dans le temps la construction de pratiques numériques dans des contextes scolaires et non scolaires.

13De cette manière, cette expérience d’analyse de données a contribué à mettre en évidence un processus d’appropriation sociale du numérique que nous aurions difficilement pu observer autrement. En effet, c’est parce que nous avons pu disposer de données sur un temps long (deux années scolaires) que nous avons pu identifier une circulation des pratiques numériques entre jeunes.

14Mais, même si dans notre cas les données analysées proviennent des équipements numériques personnels des collégiens et lycéens participants, elles ne rendent compte que d’une vue parcellaire de l’activité numérique des jeunes.

15De fait, c’est ce même constat qu’ont souligné des enseignants interrogés sur les freins et limites qu’ils identifient au déploiement des LA dans leur activité professionnelle (El Kechaï et Zibani, 2019). Dans une enquête menée en 2018 dans le cadre du groupe de travail sur les LA (GTnum2), les répondants ont placé en priorité cette vue parcellaire : s’il y a bien plus d’informations sur l’activité des apprenants grâce aux données numériques, ils n’en demeurent pas moins que les informations en dehors de l’environnement numérique utilisé ne sont, elles, pas collectées. Parmi les autres freins et limites identifiés, les enseignants interrogés évoquent d’autres risques : a) une « hypersurveillance », ou comment savoir quand s’arrêter de tracer ; b) la confiance et de la fiabilité à accorder aux analyses issues des LA, susceptibles de pénaliser en excluant des apprenants.

16Ces résultats renvoient de fait à l’une des questions soulevées par Daniel Peraya dans son appel à débat : une approche LA est-elle réellement compatible avec une démarche éthique et déontologique ? Dans la section suivante, nous tenterons de répondre à cette difficile question.

L’incompatibilité d’un processus de collecte, de traitement et d’analyse de données de qualité dans le respect d’une démarche éthique

17Pour illustrer cette difficulté, nous reprenons l’exemple de notre recherche doctorale. Comme nous l’avons indiqué dans la section précédente, afin d’analyser des pratiques numériques, nous avons eu recours à une collecte de traces. Les traces d’activité collectées ont fait l’objet d’un traitement, pour anonymiser les données et supprimer les informations identifiées comme ne relevant pas directement d’actions conscientes des jeunes. En effet, puisque nous avons utilisé pour partie des historiques de navigation sur Internet, nous avons cherché à supprimer les URL correspondant à des pop-ups publicitaires par exemple. Les traces ont aussi fait l’objet d’un traitement plus sémantique, pour passer de traces aux pratiques numériques. Par exemple, une trace correspondant à la consultation d’une vidéo en ligne est formulée de la manière suivante « 930240441 ; 249713 ; app ; YouTube ; 2018-11-14 11 :12 :47.000000 ». Dans cet exemple, un élève identifié par le code « 279713 » a consulté l’application (« app ») YouTube le 14 novembre 2018 à 11h12. En partant d’un modèle de pratique numérique basé sur quatre dimensions (Pierrot, 2018), nous avons défini des règles pour enrichir les données et rendre compte alors de pratiques numériques. De cette façon, des règles ont pu être définies pour ajouter de façon systématique les mêmes informations aux données et ajouter du sens aux traces. Dans cet exemple ci-dessus, l’action tracée relève d’une pratique de consultation vidéo réalisée, pour cet élève, dans un contexte scolaire.

18Enfin, nous avons procédé à des analyses pour catégoriser les collégiens et lycéens tracés en fonction de leurs pratiques (par une technique de classification non supervisée automatique, qui consiste à dresser une typologie des élèves en tenant compte des caractéristiques de leurs pratiques, sans définir un nombre de groupes attendus à l’avance) et identifier des réseaux au sein de groupe (par une analyse de réseaux).

  • 1 Le projet ANR Hubble réunit des équipes de recherche en informatique et sciences humaines et social (...)

19Dans le cadre de la Loi informatique et Libertés, nous avons fait inscrire au registre des traitements de l’Université de Poitiers la procédure de collecte des données. En outre, nous avons bénéficié d’un accompagnement complémentaire par le comité éthique mis en place dans le cadre du projet ANR Hubble1. Les chercheurs mobilisés dans ce projet ont mis en place une charte éthique dont la préoccupation principale porte sur la manière d’intégrer la protection des données personnelles et des libertés individuelles dans les dispositifs numériques de formation et de recherche (HUBBLE, 2016). Nous avons, dans cette perspective, complété un formulaire à destination du Comité d’éthique en Learning Analytics (CELA), qui expose le projet de recherche, le matériel utilisé et le traitement des données prévu. Une précision doit être faite : dans le cadre de notre recherche exploratoire, les techniques mobilisées pour détecter la circulation sociale des pratiques numériques ont été identifiées pendant le traitement des données, donc alors que la collecte avait débuté (et que l’accord des élèves avait été obtenu).

20C’est bien là l’obstacle : dans un souci de transparence, une démarche éthique et déontologique implique d’informer à l’avance les participants aux projets de recherche de la manière dont leurs données personnelles vont être exploitées. Cette préoccupation dépasse en réalité la participation aux projets de recherche et est très importante chez les internautes français2. Mais dans le cas d’un projet de recherche, la tension est plus prégnante : le risque de définir à l’avance ce que l’on souhaite observer suppose de renoncer à d’autres pistes à explorer. Or, l’une des techniques liées aux LA est la fouille (ou exploration) de données. Le Data Mining vise à extraire des traces des structures d’informations qui font sens. Le principe de cette approche est de découvrir et faire émerger des éléments « cachés » dans les traces, dans le sens où l’on n’a pas une représentation claire de l’information recherchée. Un autre enjeu est celui de documenter le processus de collecte, de traitement et d’analyse de données propre aux LA dans l’objectif de le partager à d’autres.

21Pour faire coïncider les deux, une ébauche de réponse peut être trouvée dans les préconisations formulées par la CNIL. Dans un rapport qui fait suite à une consultation sur les enjeux éthiques des algorithmes et de l’intelligence artificielle, on peut lire le concept de « maillons de la chaîne algorithmique » (Demiaux, 2017). Ce concept renvoie à ceux de transparence, d’éclairage et d’accompagnement, où l’ensemble des acteurs impliqués dans une approche LA contribueraient au processus, à condition de disposer des clés de compréhension suffisantes pour se saisir des enjeux associés.

22C’est ce dernier point que nous prolongeons dans la section suivante, la question de l’acculturation aux données, une démarche à co-construire.

Acculturation aux données : une opportunité pour les sciences humaines et sociales

23En 2017, un ensemble d’ateliers thématiques a été organisé pour traiter de challenges liés à l’e-éducation, parmi lesquels l’un portait sur les méthodologies et outils pour le recueil, l’analyse et la visualisation des traces d’interaction. A l’issue de ces ateliers, une synthèse présentant les huit grands challenges identifiés a été publiée (Guin, Molinari, Lefevre et Michel, 2019).

24Dans cette synthèse, la dimension interprétative est soulignée comme l’un des enjeux majeurs dans un contexte d’analyse de données. Parce que l’interprétation génère de la valeur, conceptuelle, sociale ou culturelle, elle prend sa place pour transformer des informations en connaissances. Et, cette interprétation est possible grâce à l’interaction d’acteurs multiples.

25C’est aussi la proposition que nous faisions dans le cadre de notre recherche doctorale, de penser un travail concerté entre analystes, enseignants et apprenants pour arriver à co-élaborer le processus d’analyse.

26De fait dans le cadre de notre recherche, la seule analyse des données numériques n’a pas suffi. C’est en combinant cette analyse à des techniques de collecte de données déclaratives que nous avons pu rendre compte des pratiques numériques. En travaillant directement auprès des lycéens concernés par l’étude, le souhait a été de les impliquer en tenant compte de leur point de vue des élèves, collecté au cours d’entretiens d’explicitation. Ces derniers, menés avec les 13 lycéens qui ont accepté d’y participer, avaient pour objectifs de préciser les finalités et les contextes d’usage du numérique, à partir des traces.

27Au cours des entretiens, individuels lors des premières sessions, collectifs lors des dernières, les lycéens ont été confrontés à leurs traces et aux premières analyses réalisées pour guider les analyses suivantes. En particulier, l’une des difficultés rencontrées lors de l’identification des pratiques numériques à partir des traces a porté sur la prise en compte de l’intention d’usage : une trace rendant compte de la consultation d’un réseau social pendant le temps scolaire, en classe est-elle rattachée à une fin scolaire ou non scolaire ? L’utilisation d’un outil de bureau en dehors du temps scolaire correspond-elle à une activité d’apprentissage ? Pour mieux comprendre ces situations, les élèves ont été interrogés et amenés à expliciter les finalités, ce qui a donné lieu à une prise en compte plus fine de leurs pratiques numériques. Mais comme signalé, cette démarche s’est faite auprès d’un nombre restreint d’élèves, la participation aux entretiens étant libre.

28Cela nous ramène alors à la question de la démarche éthique à mettre en place et la resitue dans une question plus large : comment impliquer des acteurs ?

En guise de conclusion

29Dans ce texte, nous avons cherché à discuter des LA, en observant la manière dont, autour de l’exploitation des données, les promesses de cette approche sont multiples. Mieux enseigner, mieux apprendre, optimiser le parcours, mieux décider…. Autant d’opportunités basées sur une vue qui reste parcellaire d’une situation d’apprentissage. Dans ce contexte, la tentation de collecter plus est donc présente, mais se retrouve atténuée par des considérations qui doivent rester centrales : celles du respect d’une démarche éthique et déontologique. Dans la dernière partie de ce texte, nous invitons donc à travailler dans des cadres co-construits, où la co-construction s’illustre entre les acteurs des LA (les enseignants, les concepteurs, les décideurs, les chercheurs, sans oublier les apprenants), mais aussi entre disciplines (informatique et sciences humaines et sociales) pour obtenir des données interprétées de qualité.

30En écho au titre volontairement « racoleur », nous pensons que les LA peuvent avoir réponse à tout, sous couvert de poser les bonnes questions…

Haut de page

Bibliographie

Azemard, G., Henda, B. et Hudrisier, H. (2015). Les Big Data : pistes de réflexions historiques, éthiques et épistémologiques pour l’appropriation sociale, 23.

Baron, G.-L. (2014). Elèves, apprentissages et «  numérique »  : regard rétrospectif et perspectives. Recherches en Éducation, 18, 91‑103.

Demiaux, V. (2017). Comment permettre à l’homme de garder la main  ? Les enjeux éthiques des algorithmes et de l’intelligence artificielle. Paris : CNIL. Récupéré de https://www.cnil.fr/sites/default/files/atoms/files/cnil_rapport_garder_la_main_web.pdf

Djoudi, M., Luengo, V., El Kechaï, H., Cerisier, J.-F., Maugard, E., Cherigny, F., … Beust, P. (2018). Thème 2 : Learning Analytics. Axe 6  : Terminologie du Learning Analytics. Paris : MENESR.

El Kechaï, H. et Zibani, N. (2019). Usages des données d’apprentissage dans les pratiques enseignantes, Enquête et étude exploratoire (GTnum 2, axe 2). Paris : MENESR.

Flichy, P. (2001). La place de l’imaginaire dans l’action technique. Réseaux, 109(5), 52-73.

Guin, N., Molinari, G., Lefevre, M. et Michel, C. (2019). The Grand Challenges of e-education research, resulting from the thematic workshops of the ORPHÉE-RDV’2017 (Research Report). ATIEF. Récupéré de https://hal.archives-ouvertes.fr/hal-02046920

HUBBLE. (2016). Charte éthique pour la recherche en Learning Analytics. Récupéré de http://hubblelearn.imag.fr/wp-content/uploads/2015/02/charte-ethique-Hubble-juin-2016.pdf

Huet, A.-S. et Chérigny, F. (2019). Learning Analytics  : Enjeux, protection des données personnelles et des libertés individuelles (GTNum2, axe 4). Paris : MENESR.

Iksal, S. (2012). Ingénierie de l’observation basée sur la prescription en EIAH (Thèse d’habilitation à diriger des recherches, Université du Maine, Le Mans).

Merzeau, L. (2013). Traces numériques et recrutement  : du symptôme au cheminement. Dans Traces numériques  : de la production à l’interprétation (p. 35-53). CNRS Éditions. Récupéré de https://halshs.archives-ouvertes.fr/halshs-01071357/document

Michel, C. (2015, juin). Analyse des usages des plateformes de construction de connaissances par des méthodes mixtes et réflexives pour l’amélioration de l’appropriation et de la structuration de l’information (Thèse d’habilitation à diriger des recherches, Université Lyon 1, Lyon). Récupéré de https://hal.archives-ouvertes.fr/tel-01212203

Mille, A. (2013). Des traces à la connaissance, à l’ère du web. Intellectica, 59, 7-28.

Peraya, D. (2019). Les Learning Analytics en question. Panorama, limites, enjeux et visions d’avenir. Distances et médiations des savoirs, 25.

Pierrot, L. (2018). Circulation sociale des pratiques numériques juvéniles et genèse instrumentale (Thèse de doctorat, Université de Poitiers, Poitiers).

Siemens, G. (2011). About: Learning Analytics & Knowledge. 1st International Conference on Learning Analytics and Knowledge, Banff.

Haut de page

Notes

1 Le projet ANR Hubble réunit des équipes de recherche en informatique et sciences humaines et sociales dans l’objectif de construire et partager des processus d’analyse de données massives : http://hubblelearn.imag.fr/?lang=fr

2 https://harris-interactive.fr/opinion_polls/barometre-la-confiance-des-francais-dans-le-numerique-6e-vague/ Dans cette enquête réalisée en 2017, 40 % de la population interrogée indique avoir confiance dans le numérique.

Haut de page

Pour citer cet article

Référence électronique

Laetitia Pierrot, « Les LA : des réponses et des promesses »Distances et médiations des savoirs [En ligne], 26 | 2019, mis en ligne le 17 juin 2019, consulté le 18 avril 2024. URL : http://journals.openedition.org/dms/3764 ; DOI : https://doi.org/10.4000/dms.3764

Haut de page

Auteur

Laetitia Pierrot

Laboratoire Techné, Université de Poitiers

laetitia.pierrot@univ-poitiers.fr

Articles du même auteur

Haut de page

Droits d’auteur

CC-BY-SA-4.0

Le texte seul est utilisable sous licence CC BY-SA 4.0. Les autres éléments (illustrations, fichiers annexes importés) sont « Tous droits réservés », sauf mention contraire.

Haut de page
Rechercher dans OpenEdition Search

Vous allez être redirigé vers OpenEdition Search