Évaluation authentique

Évaluation authentique

Depuis quelques années, on voit poindre dans le monde de la mesure et évaluation une recrudescence dintérêt pour lévaluation authentique. Dans la littérature spécialisée américaine, cette approche se retrouve sous les rubriques authentic assessment, authentic evaluation et performance based assessment.

Dans le cadre de ce bref travail, nous essaierons de définir ce quon entend par Évaluation authentique. Nous donnerons quelques exemples dapplication dans la formation générale et la formation spécialisée. Nous soulèverons quelques problèmes associés à cette méthode dévaluation. Finalement, nous illustrerons grâce à quelques cas précis comment la Direction générale de la formation professionnelle et technique du Québec utilise lévaluation pratique pour certifier la compétence de ses étudiants. Ces évaluations pratiques sapprochent énormément de lévaluation authentique préconisée par Grant Wiggins.

Sommaire

Définition du concept

Selon Grant Wiggins, un chercheur et un spécialiste en réformes scolaires :

« Assessment is authentic when we directly examines students performance on worthy intellectual tasks. Traditional assessment, by contrast, relies on indirect proxy itemsefficient, simplistic substitutes from which we think valid inferences can be made about the students performance at those valued challenges. »
trad: « l'évaluation est authentique lorsqu'elle examine directement les performances des étudiants sur des tâches intellectuelles utiles. L'évaluation traditionnelle, par comparaison, repose sur des éléments indirectement liésdes substituts efficaces et simplistes dont on pense pouvoir tirer des conclusions pertinentes à partir des performances de l'étudiant sur ces défis estimés. »

Selon lui, létudiant peut démontrer par lévaluation authentique sa maîtrise des compétences en lutilisant dans un cadre le plus réel possible. Les examens traditionnels ne sont que des moyens de montrer que létudiant se rappelle les éléments dinformations ou quil peut appliquer machinalement des techniques.

« Test validity should depend in part upon whether the test stimulates real-world tests of ability. Validity on most multiple-choice tests is determined merely by matching items to the curriculum content. »[1].
Trad. « La réussite des tests devrait dépendre en partie du fait de stimuler des capacités mises en œuvre dans le monde réel. La réussite à la plupart des questionnaires à choix multiples est plutôt déterminée par la capacité à faire correspondre des éléments au contenu du programme d'enseignement. »

Selon Janine Huot : une tâche basée sur la performance consiste en une activité qui requiert la démonstration par les apprenants de leurs aptitudes à intégrer et utiliser leur savoir, savoir-faire et jugement dans un contexte authentique. Une telle tâche possède une ou plusieurs caractéristiques suivantes :

  • elle exige lutilisation de connaissances et dhabiletés dans un contexte représentant des situations ou problèmes réels :
  • elle permet de découvrir la démarche utilisée par les apprenants pour affronter une situation donnée, plutôt que de se limiter au résultat final :
  • elle fait appel à plusieurs résultats dapprentissage ou compétences ;
  • elle exige lutilisation daptitudes intellectuelles complexes ;
  • elle permet dobserver de multiples facettes de lapprentissage ;
  • elle donne aux apprenants le choix des types de production pour exhiber ce quils ont appris[2].

Quelques exemples dapplication

Depuis très longtemps, lévaluation authentique a été utilisée dans des domaines professionnels. On peut penser au droit et au notariat qui senseignaient par apprentissage et qui étaient évalués par un bureau dexaminateurs. Les armées américaine, britannique et canadienne se servent de lévaluation authentique dans lattribution des brevets dofficiers.

Exemple de lÉcole des aspirants officiers des Forces armées canadiennes

Dans le cours de lÉcole des aspirants officiers des Forces armées canadiennes, on utilise lévaluation authentique pour vérifier les compétences en leadership. Un élève-officier reçoit lordre daller chercher deux rebelles de lArmée de libération de lOntario sur une route située à plus de 15 kilomètres de la base militaire. Pour se faire, il dirige une équipe de 6 soldats. On met à sa disposition un camion avec chauffeur et tout léquipement militaire nécessaire. Durant toute lopération, les actions de lélève-officier sont examinées par un sergent ou un adjudant qui les évalue méthodiquement. On étudie la façon dont il planifie lopération et la manière de passer les ordres à ses subalternes. On prépare une appréciation globale de toute lopération. Lobservateur ninterviendra que si la vie des participants est en jeu ou sil y a des risques de destruction de matériel.

Afin de rendre lopération plus réaliste, les rebelles peuvent opposer une résistance à leur arrestation ou un membre de léquipe peut mourir subitement. Lévaluation des membres du corps médical se fait également par évaluation authentique. Au moment linterne se trouve au chevet dun pseudo-patient et lui pose des questions, ce dernier peu mourir sans avertissement[3]. Cette mise en scène peut également se réaliser avec un modèle informatique.

Chaque épreuve est suivie dun de briefing avec laspirant toute lopération sera passée en revue. Cette méthode permet aux autorités militaires de faire en même temps une évaluation formative des connaissances des candidats. En colligeant les rapports, les autorités produisent une évaluation sommative de la performance des individus.

Cette méthode dévaluation respecte la validité et la fidélité. On peut définir la validité dun test ou dun examen comme lévaluation globale, fondée sur des preuves empiriques et sur un rationnel théorique, de ladéquation et de la justesse des inférences et des actions issues des scores de test. La fidélité se définit comme la qualité que possède un instrument à mesurer avec la même exactitude chaque fois quil est administré. Le ministère de l'Éducation du Québec (MEQ) considère la fidélité comme la qualité dun instrument de mesure dont les résultats demeurent stables pour les mêmes sujets qui se trouvent dans des conditions identiques lors dadministrations différentes[4]

Dans le cas des cours des aspirants officiers, la validité de lévaluation est assurée par la corrélation entre les contenus de cours donnés et les compétences évaluées. La fidélité inter-juge est favorisée en préparant un cours que tous les évaluateurs doivent suivre.

Exemple dans lenseignement général au secondaire

Dans le domaine de lenseignement général au secondaire, Guillermo Solano-Flores et Richard J. Shavelson rapportent quelques exemples dutilisation de lévaluation authentique. Lexpérience Astronomie diurne consiste à recréer avec un globe terrestre, une lampe de poche et une boîte, les ombres créés par le soleil de laube au crépuscule[5].

Dans ce cas, lévaluation dune seule compétence demande du matériel quelques fois encombrant. Une de ces expériences permet seulement de vérifier un seul objectif. On doit ainsi laisser de côté dautres objectifs.

Quelques problèmes associés à lévaluation authentique

Samuel Messick, de Educational Testing Service, soutient quil existe deux standards dévaluation quand il sagit dévaluer les compétences. Le premier type est le standard de contenu qui concerne ce que létudiant doit connaître et être capable de faire pour un sujet précis. Lautre type concerne le standard de performance qui indique le degré de compétence quun étudiant doit atteindre à un moment donné. Pour lui, la performance doit refléter la complexité du construit et non la complexité de lépreuve. Ce quon veut vérifier cest la capacité de létudiant à transférer en pratique ce quil a appris de façon théorique.

Messick voit un conflit entre le temps nécessaire pour passer une évaluation authentique et la nécessité dévaluer toute la matière apprise. Une épreuve authentique demande beaucoup de temps et évalue peu de choses. Il soutient que ce genre dépreuve peut avoir des conséquences adverses sur létudiant. Celui-ci peut ne pas se sentir à laise avec la manipulation dinstruments tout en maîtrisant parfaitement les concepts quil doit utiliser[6].

Solano-Flores soulève quelques problèmes avec ladministration de certains tests. Il souligne que le montage et le démontage de léquipement peut prendre tellement de temps que ladministration des tests devient presque impossible. Lutilisation de matériel qui sera détruit au cours de lévaluation authentique devient coûteux. Les institutions peuvent alors utiliser du matériel moins cher mais de qualité inférieure. La mauvaise qualité des matériaux introduit alors des erreurs de mesure et fausse les résultats finals. Il souligne également le problème de la fidélité entre les différents évaluateurs. Pour lui, il est très important de former les évaluateurs afin que dune façon générale leur évaluation soit standardisée[7].


Pour Bert F. Green, de Johns Hopkins University, si les autorités scolaires veulent pouvoir comparer les résultats de lévaluation authentique dune année à lautre, il faut sassurer que les résultats de performance puissent être comparables. Des changements dans ladministration des tests créent des difficultés de comparaison. Dautre part, si dannée en année, on utilise les mêmes tests, linformation circule parmi les étudiants. Les étudiants se préparent alors uniquement en fonction dune épreuve spécifique. On assiste alors à du bachotage[8]

Chez plusieurs auteurs que nous avons consulté, il semble se dégager une constante. Lévaluation authentique possède de nombreuses qualités mais elle ne peut pas dans tous les cas remplacer lexamen traditionnel, papier crayon. Pour ce qui est de vérifier lacquisition de connaissance, lexamen traditionnel a fait ses preuves. On peut facilement en déterminer la fiabilité, la validité et la comparabilité.

Lévaluation de la formation professionnelle

Le Guide général dévaluation pour la formation professionnelle et technique nous indique que ce type de formation au secondaire est axé sur lévaluation de la compétence acquise. À cet égard, deux aspects importants sont retenus : la maîtrise du métier et la formation fondamentale.

Pour certifier latteinte des objectifs, on peut utiliser une ou plusieurs de ces méthodes:

  • lévaluation dun produit, qui donne lieu à une épreuve pratique
  • lévaluation dun processus de travail, qui donne lieu également à une épreuve pratique
  • lévaluation des connaissances pratiques, qui donne lieu à une épreuve théorique.

On privilégie lévaluation dun produit plutôt que lévaluation dun processus de travail dans tous les cas lon peut confirmer par inférence lacquisition de la compétence considérée.

Ladministration dune épreuve en vue de lévaluation dun produit est généralement moins complexe que celle dune épreuve en vue de lévaluation dun processus de travail. De plus, lévaluation dun produit permet à lexaminateur dobserver plus de candidats à la fois.

La formation professionnelle du ministère de lÉducation se fait par programme. Chaque programme contient un certain nombre de modules correspondant chacun à une compétence spécifique. Le processus dacquisition des connaissances suit un logigramme spécifique à chaque programme. Chaque module fait lobjet dune évaluation. Celle-ci peut être locale ou faire lobjet dune épreuve ministérielle. La loi de lInstruction publique prévoit que le ministre de lÉducation peut imposer des épreuves pour tous les programmes de la formation professionnelle. Généralement, un module sur cinq sera soumis à une épreuve ministérielle.

Le but de lévaluation en formation professionnelle est de certifier que létudiant a atteint les compétences contenues dans le module. Un étudiant qui complète un programme spécifique devrait posséder les compétences pour atteindre les qualifications minimales dentrée dans le métier ou la profession. Il est certain quun finissant naurait pas lhabileté qui vient avec plusieurs années de pratique dun métier.

Comme il sagit de métiers professionnels, les épreuves dévaluation doivent se rapprocher le plus possible de la réalité du travail. Ainsi les étudiants en mécanique procéderont à des changements de silencieux sur une voiture ou à la mise au point dun moteur. Chaque évaluation portera soit sur le processus soit sur le produit final, et parfois les deux en même temps. Si on évalue le travail dun étudiant dans un cours dauxiliaire aux malades, on lui fera déplacer un malade dune civière à un lit dhôpital. Dans ce cas, le processus est plus important que le résultat final. Dans dautres cas, cest le résultat final, une lettre bien rédigée ou un moteur bien ajusté qui démontreront latteinte de la compétence.

Lutilisation dépreuves pratiques posent certains problèmes logistiques. Le problème de coûts et de la faisabilité des examens se présentent souvent. Dans le cas des examens sur lépandage des pesticides, il faudrait mélanger des pesticides et les étendre dans un champ avec un tracteur. Lutilisation dun tracteur nest pas toujours faisable et le fait de gaspiller des pesticides nest pas très écologique. Alors, une épreuve papier-crayon demande de déterminer les actions à entreprendre à partir dune mise en situation.

Dans le cadre du module de Confection de veston de femme sur mesure, les candidates apprennent à confectionner un veston pour dame. On leur apprend à prendre des mesures puis à modifier un patron existant conformément aux spécifications dune cliente avant de confectionner ledit veston. Dans le cadre dun cours de 90 heures, elles réussissent à réaliser un ou deux vestons avant de se présenter à lévaluation finale. Elles disposent 12 heures pour réaliser un veston complet. Lors de lévaluation, les examinateurs avaient à leur disposition une fiche dévaluation ils notent la performance à toutes les étapes nécessaires de la confection. Chaque critère est évalué de façon dichotomique. Létudiante atteint ou non chacun des critères. À la fin de lépreuve, létudiante se doit datteindre 80 points sur un total de 100. Il sagit ici dune évaluation critériée avec un seuil de passage de 80 points.

Malgré la meilleure préparation possible en ce qui concerne la validité et la fidélité de lépreuve. On sest aperçu quil faut jusquà 24 heures pour réaliser lépreuve. Ainsi, plusieurs étudiantes échouent. Ces échecs ne sont pas nécessairement dus à un manque de compétence des étudiantes mais au manque de temps pour réaliser toutes les étapes de la réalisation dun veston. Après consultation, il a été entendu dallonger la durée de lépreuve.

Pour assurer une certaine fidélité dans ladministration des épreuves ministérielles, la Direction générale de la formation professionnelle et technique prépare des épreuves. Celles-ci sont rédigées par des enseignants en formation professionnelle sous la direction dun conseiller en évaluation. Après leur rédaction, les épreuves sont soumises à la validation dun groupes denseignants qui en vérifie la validité. Par la suite, il y a des séances dimplantation dans les commissions scolaires. Il y a donc une interaction entre les examinateurs qui feront passer les épreuves et les concepteurs de celles-ci. Après avoir fait passer les examens à leurs étudiants, les professeurs peuvent faire une rétroaction sur les épreuves. Ceci permet de modifier, clarifier ou changer les critères et consignes entourant lexécution des épreuves.

Conclusion

Les méthodes dévaluation de la formation professionnelle du ministère de lÉducation rencontrent les mêmes problèmes et les mêmes difficultés que ceux soulevés par Wiggins, Messick et autres. Lors de la rédaction dépreuves, il faut toujours faire attention à la validité de contenu. Il ne faut pas que des défauts de matériel ou dappareil ne viennent nuire aux chances de réussite des étudiants. Le ministère essaie dassurer la fidélité inter-juge en imposant des épreuves ministérielles. Le système de rétroaction permet un réajustement des épreuves en cas de besoin. Somme toute, lévaluation basée sur la performance représente un excellent instrument pour déterminer si les étudiants possèdent les compétences de chaque module.

Annexes

Article connexe

Bibliographie

  • Bert F.Green, A Comparability of Scores from Performance Assessments, in Educational Measurement: Issues and Practice, hiver 1995.
  • Janine Huot, A Learning Outcomes: A Performance Assessment Perspective
  • Janine Huot, Un aperçu de lapproche pédagogique basée sur la performance [9]
  • Ministère de lÉducation, Guide général dévaluation, La formation professionnelle et technique, Québec, 1993.
  • Renald Legendre, Dictionnaire actuel de léducation, 2e édition, Édition 2000, Guérin, Montréal 1993.
  • Robert L. Linn, David B. Swanson et Geoffrey R. Norman, A Performance-Based Assessment: Lessons From the Health Professions, in Educational Researcher, juin/juillet 1995.
  • Robert L. Linn, Eva Baker et Stephen B. Dunbar, A Complex, Performance Based Assessment: Expectations and Validation Criteria, in Educational Researcher, novembre 1991.
  • Samuel Messick, A Standards of Validity and the Validity of Standards in Performance Assessment, in Educational Measurement: Issues and Practice, hiver 1995.
  • Guilermo Solano-Flores et Richard J. Shavelson, A Development of Performance Assessment in Science: Conceptual, Practical and Logistical Issues, in Educational Measurement: Issues and Practice, automne 1997.
  • Grant P. Wiggins, Assessing Student Performance: Exploring the Purpose and Limits of Testing, Jossey-Bass Publishers, San Francisco, 1993.
  • Grant, P. Wiggins, The case for authentic Assessment. ERIC Digest

Références

  1. Grant, P. Wiggins, The case for authentic Assessment. ERIC Digest, p1
  2. Janine Huot, Un aperçu de lapproche pédagogique basée sur la performance Telecom British Columbia, Alberta, Ontario, Quebec | Uniserve, p3
  3. Robert L. Linn, David B. Swanson et Geoffrey R. Norman, A Performance-Based Assessment: Lessons From the Health Professions, in Educational Researcher, juin/juillet 1995, p9
  4. Renald Legendre, Dictionnaire actuel de léducation, 2e édition, Édition 2000, Guérin, Montréal 1993, p609
  5. Guilermo Solano-Flores et Richard J. Shavelson, A Development of Performance Assessment in Science: Conceptual, Practical and Logistical Issues, in Educational Measurement: Issues and Practice, automne 1997, p18
  6. Samuel Messick, A Standards of Validity and the Validity of Standards in Performance Assessment, in Educational Measurement: Issues and Practice, hiver 1995, p6
  7. Guilermo Solano-Flores et Richard J. Shavelson, A Development of Performance Assessment in Science: Conceptual, Practical and Logistical Issues, in Educational Measurement: Issues and Practice, automne 1997, p19
  8. Bert F.Green, A Comparability of Scores from Performance Assessments, in Educational Measurement: Issues and Practice, hiver 1995, p12
  9. Telecom British Columbia, Alberta, Ontario, Quebec | Uniserve



Wikimedia Foundation. 2010.

Contenu soumis à la licence CC-BY-SA. Source : Article Évaluation authentique de Wikipédia en français (auteurs)

Игры ⚽ Поможем написать реферат

Regardez d'autres dictionnaires:

  • Evaluation authentique — Évaluation authentique Depuis quelques années, on voit poindre dans le monde de la mesure et évaluation une recrudescence d’intérêt pour l’évaluation authentique. Dans la littérature spécialisée américaine, cette approche se retrouve sous les… …   Wikipédia en Français

  • Docimologie — La docimologie, l étude des épreuves, est la discipline scientifique consacrée à l étude du déroulement des évaluations en pédagogie[1] et notamment à la façon dont sont attribuées les notes par les correcteurs des examens scolaires. Sommaire 1… …   Wikipédia en Français

  • Psychologie de l'apprentissage — D une manière générale, la psychologie de l apprentissage est un champ de la psychologie qui s intéresse particulièrement aux processus d apprentissage, ou comment l être humain est capable de développer de nouvelles attitudes, connaissances et… …   Wikipédia en Français

  • Généalogie de la morale — Un écrit polémique Auteur Friedrich Nietzsche Genre Philosophie, morale …   Wikipédia en Français

  • CROYANCE — Le parcours complexe qui sera ici suivi présente, pour un regard de survol, un certain nombre de grandes articulations. La première concerne le passage du langage ordinaire au langage philosophique : pour la langue courante, le mot est surtout… …   Encyclopédie Universelle

  • Mouvement de protestation universitaire en France en 2007-2008 — Mouvements universitaires de 2007 2009 en France Les mouvements universitaires de 2007 2009 en France sont un ensemble de protestations contre la Loi relative aux libertés et responsabilités des universités (loi LRU ou loi Pécresse , du nom de la …   Wikipédia en Français

  • Mouvement des enseignants-chercheurs de 2009 — Mouvements universitaires de 2007 2009 en France Les mouvements universitaires de 2007 2009 en France sont un ensemble de protestations contre la Loi relative aux libertés et responsabilités des universités (loi LRU ou loi Pécresse , du nom de la …   Wikipédia en Français

  • Mouvement des enseignants-chercheurs en France — Mouvements universitaires de 2007 2009 en France Les mouvements universitaires de 2007 2009 en France sont un ensemble de protestations contre la Loi relative aux libertés et responsabilités des universités (loi LRU ou loi Pécresse , du nom de la …   Wikipédia en Français

  • Mouvement universitaire de 2009 en France — Mouvements universitaires de 2007 2009 en France Les mouvements universitaires de 2007 2009 en France sont un ensemble de protestations contre la Loi relative aux libertés et responsabilités des universités (loi LRU ou loi Pécresse , du nom de la …   Wikipédia en Français

  • Mouvement universitaire en France de 2007-2009 — Mouvements universitaires de 2007 2009 en France Les mouvements universitaires de 2007 2009 en France sont un ensemble de protestations contre la Loi relative aux libertés et responsabilités des universités (loi LRU ou loi Pécresse , du nom de la …   Wikipédia en Français

Share the article and excerpts

Direct link
https://fr-academic.com/dic.nsf/frwiki/1787494 Do a right-click on the link above
and select “Copy Link”