MODÈLES DE PRESTATIONDE TESTS Choisir ou équilibrer les priorités?

Nous joindre

Publication précédente Prochaine publication

31 mars 2025

MODÈLES DE PRESTATIONDE TESTS Choisir ou équilibrer les priorités?

S’inscrire au Vretta Buzz

Dans le contexte postpandémique actuel, les discussions autour des politiques éducatives et d'évaluation se concentrent de plus en plus sur la détermination de la portée et de l'ampleur de la numérisation, reconnaissant que les organisations priorisent habituellement l’intégrité, initialement à cause des ressources limitées et de la pression publique. Ces politiques évoluent graduellement vers l’amélioration de la qualité des évaluations et de la personnalisation. Avec une approche évolutive, les organismes d'évaluation pourraient être classés en catégories reflétant des priorités distinctes en matière d'intégrité (équité et sécurité), de qualité ou de personnalisation dans le choix des modèles de prestation de tests au sein du cycle d'évaluation.

Dans cet article, le terme « modèle de prestation des tests » désigne des approches spécifiques aux tests informatisés, telles que le mélange aléatoire d'items au sein d'un test (modèle linéaire), l'organisation des items en sous-ensembles selon leur type ou leur difficulté (modèle basé sur des questionnaires ou testlets), ou la sélection dynamique d'items directement dans une banque d'items grâce à une méthode appelée « test linéaire à la volée » (LOFT) et ses variantes, ainsi que les tests adaptatifs, avec leurs propres méthodes distinctes, comme approche distincte. Un équilibre judicieux entre les décisions prises concernant chaque aspect du modèle de gestion des tests choisi peut contribuer à créer un environnement de test sécurisé, valide et centré sur l'étudiant au sein du système éducatif d'une juridiction.

Cet article présente un aperçu simplifié de la manière dont les organismes d’évaluation peuvent choisir ou équilibrer stratégiquement l’intégrité, la qualité et la personnalisation avec des choix sur les modèles de prestation de tests.

Modèles de prestation de tests : intégrité, qualité, personnalisation ou tout ?

Pour accompagner l'évolution de la culture décisionnelle concernant les modèles de prestation des tests, notamment dans le contexte de la numérisation du cycle d'évaluation et de l'amélioration des fonctionnalités des plateformes numériques, une analyse numérique pourrait aider à déterminer la portée et l'ampleur appropriées de la réforme. En savoir plus sur l'élaboration d'une feuille de route pour la modernisation du cycle d'évaluation.

Le premier aspect à aborder, l'intégrité, concerne la mise en place d'une plateforme numérique et de procédures pour prévenir l'exposition des items lors de la mise en œuvre du cycle d'évaluation, un sujet largement abordé dans l'article Sécuriser le cycle d'évaluation. L'aspect qualité du choix d'un modèle de test vise principalement à garantir la validité et la fiabilité des évaluations. Le dernier aspect, la personnalisation, privilégie l'approche centrée sur l'étudiant en privilégiant des évaluations conviviales et adaptables à leurs besoins. Le tableau suivant illustre l'impact des modèles de test classiques : linéaire, basé sur des questionnaires, linéaire à la volée (LOFT) et adaptatif, sur l'intégrité, la qualité et la personnalisation des évaluations.

Tableau d'impact du modèle de prestation de tests

Modèle de prestation de tests	Impact sur l’intégrité	Impact sur la qualité	Impact sur la personnalisation
Test linéaire (mélange aléatoire d’items dans un tests)	Réduit le risque d’exposition en faisant varier l’ordre des items entre les candidats.	Maintient la cohérence dans la difficulté des items et la couverture du contenu.	Limité; fournit un contenu uniforme à tous les étudiants.
Test basé sur des questionnaires (items organisés en sous-ensembles par type ou difficulté)	Améliore la sécurité en minimisant les modèles prévisibles, réduisant ainsi l'exposition.	Améliore la fiabilité en contrôlant la difficulté et la distribution du contenu au sein des sous-ensembles.	Modéré ; permet une évaluation ciblée en fonction des groupes de capacités des élèves ou des catégories de contenu.
Test linéaire à la volée (LOFT) ou LOFT basé sur des questionnaires (tLOFT) (sélection dynamique d'items directement à partir d'une banque d’items)	Augmente l'intégrité en assemblant dynamiquement des tests uniques pour chaque étudiant, avec LOFT sélectionnant des items individuels et tLOFT sélectionnant des questionnaires structurés, minimisant ainsi la prévisibilité et l'exposition des items.	LOFT maximise l'adaptabilité grâce à la sélection d’items individuels, tandis que tLOFT équilibre l'adaptabilité avec un contenu structuré via des questionnaires prédéfinis.	Élevé ; LOFT fournit des évaluations hautement individualisées, tandis que tLOFT permet la personnalisation au sein de groupes de contenu structurés.
Test adaptatif (items sélectionnés en fonction des réponses des candidats en temps réel)	Améliore encore l'intégrité grâce à une sélection d’items unique et réactive.	Améliore considérablement la précision, la fiabilité et la validité en s'adaptant aux capacités du candidat.	Très élevé ; adapte précisément la difficulté et le contenu des items aux performances et aux besoins individuels des élèves.

Compte tenu de l'évolution de chaque modèle de prestation de test, leur impact varie, améliorant des aspects spécifiques des pratiques et des résultats d'évaluation selon le contexte et les priorités de la juridiction. Ainsi, le choix du modèle de prestation par un organisme d'évaluation peut indiquer l'axe d'évaluation prioritaire et le type de culture d'évaluation promu au sein du système d'évaluation de la juridiction.

L'IA et l'avenir des modèles de prestation de tests

L'intégration de l'IA dans les modèles de prestation de tests améliore la sélection des items, l'assemblage des tests et l'adaptabilité en temps réel grâce à des algorithmes d'apprentissage automatique qui prédisent les performances des étudiants, à une notation automatisée pour des évaluations plus rapides et à des analyses prédictives permettant d'ajuster dynamiquement la difficulté des tests. Ces avancées soutiennent l'évolution des modèles de prestation de tests linéaires, multi-étapes et entièrement adaptatifs, établissant une nouvelle référence en matière de précision, de personnalisation et d'évolutivité dans l'évaluation pédagogique.

En pratique, des évaluations précises et basées sur les compétences des élèves émergeront d'un nouveau modèle de test appelé « On-the-Fly Assembled Multistage Computer Adaptive Testing » (Li et al., 2025), qui intègre les principes des tests adaptatifs, l'analyse multidimensionnelle utilisant la théorie de la réponse aux items multidimensionnels (MIRT) et le mode à la volée. Ce modèle permettrait aux organismes d'évaluation d'assembler dynamiquement des tests en temps réel et d'utiliser des modèles informatiques multidimensionnels pour évaluer simultanément plusieurs compétences, améliorant ainsi la précision des mesures, la sécurité et l'efficacité des tests.

Il est à espérer que les décideurs des organismes d'évaluation et des ministères de l'Éducation seront mieux informés des utilisations de chaque modèle de prestation de tests et du message qu'il transmet au secteur et aux parties prenantes, garantissant ainsi que leurs choix de solutions techniques concilient efficacement intégrité, qualité et personnalisation du système éducatif. Cet équilibre, ou la décision de privilégier un aspect plutôt qu'un autre, est influencé par des facteurs contextuels qui peuvent justifier le choix sans jugement. Cependant, la compréhension de toutes les options techniques, y compris les modèles de prestation de tests avancés, permet aux organisations d'élaborer une feuille de route de croissance stratégique, tout en apprenant et en appliquant les solutions techniques, un atout essentiel pour équilibrer les priorités.

À propos de l'auteur

Vali Huseyn est un spécialiste de l'évaluation pédagogique, reconnu pour son expertise dans les projets de développement portant sur divers aspects du cycle d'évaluation. Sa capacité à conseiller sur l'amélioration des modèles de prestation d'évaluation, l'administration des différents niveaux d'évaluation, l'innovation en matière d'analyse de données et la création de techniques de rapports rapides et sécurisées le distingue dans son domaine. Son travail, enrichi par des collaborations avec des entreprises de technologies d'évaluation et des organismes de certification de premier plan, a considérablement fait progresser les pratiques d'évaluation de sa communauté. Au Centre d'examen d'État d'Azerbaïdjan, Vali a contribué de manière significative à la transformation des évaluations locales et a dirigé des projets régionaux clés, tels que la plateforme unifiée d'inscription et de suivi des programmes de tests internationaux, les évaluations linguistiques alignées sur le CECR, les formations à la littératie en évaluation soutenues par le PISA et le projet d'audit institutionnel, tous visant à améliorer la culture de l'évaluation dans le pays et dans la région de l'ex-URSS.

Vali a reçu deux bourses prestigieuses pour ses études : il a obtenu un master en planification et administration des politiques éducatives à l'Université de Boston grâce à une bourse Fulbright et a également étudié l'évaluation pédagogique à l'Université de Durham grâce à une bourse Chevening.

Découvrez des pratiques guidées en matière de modernisation des évaluations et obtenez un aperçu de l'avenir des évaluations éducatives en vous connectant avec Vali sur LinkedIn.

Publication précédente Prochaine publication