Chronique Éducation: ESPÉ : Pour une “culture commune” de l'évaluation

Cet article était initialement destiné à être publié dans un recueil de textes à la suite de la conférence de consensus des IUFM franciliens en 2011 consacrée à l'évaluation. Mais, la publication a été retardée et ne semble plus aujourd'hui à l'ordre du jour. Je publie donc, aujourd'hui sur mon blog, cette tribune qui relate ma pratique des formations transversales que je mène depuis 7 ans à l'IUFM et aujourd'hui à l'ESPÉ de Paris.
Parce que, me semble t-il, la problématique qui y est développée est toujours d'actualité : Si on veut faire évoluer l'évaluation il faut en faire un sujet de formation qui ne soit pas uniquement celui des didactiques disciplinaires mais une réflexion commune faisant appel à l'histoire, les sciences sociales et surtout à un véritable questionnement pédagogique.

Pour compléter cet article, on peut visionner et télécharger un diaporama qui correspond à une partie de la formation.

----------------

« S’ils ont de trop bonnes notes ils vont arrêter de travailler » ; « Quoi qu'on fasse, il y aura toujours à peu près 1/3 de bons, 1/3 de moyens et 1/3 de faibles », « Il a progressé: sa note est passée de 9,76 à 9,98 ! » ; « Moi, je mets des notes justes, car ma grille de critères est très précise et travaillée »

“Selon votre pratique personnelle et votre réflexion, situez vous par rapport aux différentes phrases en opposition ou en adhésion, et justifiez ensuite vos réponses dans la discussion”.

Voici en quelques mots comment démarrent les séances que j’anime depuis six ans à l’IUFM de Paris consacrées à l’évaluation. Ces séances “transversales”, c’est-à-dire proposées à tous les enseignants stagiaires (du secondaire) commencent par un “Q-sort” comprenant une dizaine de phrases. Il s’agit “à froid” pour les enseignants stagiaires de réagir par rapport à ces phrases toutes faites que l’on peut entendre en salle des professeurs et dans les discours tenus par les collègues. Certaines renvoient à une conception “traditionnelle” de l’évaluation, d’autres pourraient être plutôt prononcées par des enseignants supposés innovants. En fait, il s’agit avant tout de travailler sur les représentations que nous avons tous de l’évaluation. Des représentations forgées dès l’enfance et sa propre expérience d’élève et qui se sont renforcées ou ont évolué avec les premières expériences d’une pratique d’enseignement.

Après un temps relativement bref de passation du questionnaire, la discussion est très vite lancée sur chacune des phrases et donne lieu à des échanges nourris et d’une grande richesse. Dès le départ, il est précisé qu’il ne s’agit pas de juger les réponses en conformité avec une quelconque doxa pédagogique mais bien de leur permettre de développer leur propre argumentation et réflexion dans une discussion (une “dispute”...) entre collègues. Ma position en tant que formateur durant ce premier temps est avant tout de distribuer la parole mais aussi de mettre en perspective les réflexions des uns et des autres et de les relier à quelques concepts que nous verrons plus précisément ensuite dans une deuxième phase de la séance.

Durant toutes ces années, j’ai été frappé par quelques constantes.

D’abord, l’intensité des discussions : les questions liées à l’évaluation prennent une place importante dans le vécu des nouveaux enseignants. Certains disent avoir mis de très nombreuses heures à préparer puis corriger leurs premières copies tant les problèmes qu’ils se posaient étaient nombreux et semblaient insolubles. En parler semble un élément important de la construction professionnelle.

Ensuite, il faut noter la satisfaction qu’expriment les stagiaires de pouvoir s’exprimer en tant que “collègues” sans avoir le sentiment d’être jugés sur la conformité avec une doctrine pédagogique. Le travail sur les représentations permet d’éviter ce biais fréquent dans la formation des enseignants et libère la parole en la raccrochant au vécu (en tant qu’ancien élève et nouvel enseignant). Selon la jolie formule d’André Giordan : avec les représentations, il s’agit de “faire avec pour aller contre”. C’est souvent la condition à un réel apprentissage. Partir de ces représentations est donc un préalable qui permet d’engager la discussion mais cela n’est évidemment pas suffisant. Il faut ensuite faire un certain nombre d’apports de connaissances sur ce thème de l’évaluation. En effet, après ce premier temps de débat et de réactions autour des représentations, la séance se poursuit avec un exposé plus classique développant des connaissances sociologiques, historiques, institutionnelles et bien sûr dans la champ de la docimologie.

L’évaluation vue par les parents, les élèves, les enseignants…

Pour faire une transition avec la première partie, le début de mon exposé propose de montrer que les représentations et l’opinion sur l’évaluation varie selon les acteurs sociaux (parents, élèves, enseignants). On peut s’appuyer pour cela sur un certain nombre de sondages et d’enquêtes réalisées au cours des dernières années. Dans un sondage paru dans La Croix en 2004, on notait que la question de l’évaluation («quelle note as-tu eues aujourd’hui ») est très souvent la première question posée aux enfants. On y voit aussi que les notes obtenues influencent fortement l’attitude des parents à l’égard de leurs enfants (punitions, récompenses). L’étude de ces sondages permet aussi de voir une évolution de l’opinion publique à l’égard de l’évaluation. Si les parents et l’opinion publique en général semblent rester attachés à la note chiffrée car celle-ci est considérée, à tort ou à raison, comme “lisible” et rigoureuse, on note aussi que l’opinion évolue et qu’en particulier pour le primaire, on apprécie des modes d’évaluation alternatifs et le desserrement de la pression évaluative. Le sondage lancé à l’occasion de l’appel de l’AFEV pour la suppression des notes à l’École montre une nette évolution.

Il est évidemment difficile d’avoir des enquêtes sur les opinions des premiers intéressés, c’est-à-dire les élèves eux mêmes. On ne peut se baser que sur des témoignages qui doivent être pris avec précaution. Toutefois on note des constantes, que Pierre Merle dans “L’élève humilié” (2005) où il interroge de jeunes adultes sur les situations d’humiliations vécues à l’école, met bien en évidence. L’expérience de l’évaluation est un moment fort pour de très nombreux élèves et renvoie à des situations qui remettent en question l’estime de soi, la motivation et conduisent même dans certains cas à des situations d’humiliation.

En ce qui concerne les enseignants, on dispose de nombreux éléments d’enquête. Les pratiques d’évaluation ont été étudiées à plusieurs reprises et notamment dans deux grandes études. « Les pratiques d’évaluation des enseignants au collège » parue en 2004 offre l’avantage de s’appuyer sur un travail important d’enquête statistique auprès de 3561 enseignants dans 597 collèges. Elle fait apparaître un relatif consensus sur les fonctions de l’évaluation. Lorsqu’on demande aux enseignants de donner trois réponses, les trois qui arrivent en tête sont :

mesurer les acquis des élèves (95% des réponses parmi trois réponses possibles)
s’assurer que les objectifs ont été atteints (90,7%)
fournir une note (41,4%)

On notera que “fournir une note” montre bien que le poids de la demande institutionnelle est très fort dans les pratiques d’évaluation. L’étude montre aussi que celles ci restent assez largement solitaires (90 % des enseignants interrogés déclarent élaborer seuls leurs évaluations). Toutefois l’enquête réalisée quelques années plus tard montre une évolution dans ce domaine. En effet, une enquête réalisée en 2008 auprès de 1200 enseignant et parue dans les Dossiers Evaluations et Statistiques (MEN) d'octobre 2009 sous le titre « Enseigner en collège et lycée en 2008 » montre que les enseignants interrogés sont 51% à travailler “souvent” ou “occasionnellement” avec des collègues pour produire des documents d’évaluation et 45% pour l’harmonisation des corrections.

Mais surtout ce qui est notable dans toutes ces études c’est la part considérable que l’ évaluation occupe dans le temps de travail des enseignants. On estime en effet que c’est entre un quart et un tiers du temps de l’enseignant de collège et de lycée. Mais la question que cela devrait susciter est : pour quelle efficacité ?

Les enseignants débutants perçoivent très vite ce travers du système qu’est l’ “évaluationnite” : On évalue… parce qu’il faut évaluer… On “fournit des notes” parce que le système éducatif, les parents (les élèves ?), en réclament. Mais les pratiques d’évaluation sont peu satisfaisantes au regard des enjeux. « Imaginez un restaurant gastronomique réputé dont les clients exigeraient d'être informés de manière continue de la manière dont progresse la préparation du plat qu'ils ont commandé. Du coup, la moitié du temps de travail des cuisiniers consisterait à informer les clients, au détriment de la qualité de la cuisine...» Cette métaphore de Philippe Perrenoud[1] est un bon moyen d’engager le débat sur les finalités de l’évaluation et de montrer l’ambigüité de notre rapport à l’évaluation.

Tous les pédagogues s’accordent sur la nécessité de mettre l’évaluation au service des apprentissages. Mais dans l’opinion, dans la culture française, celle-ci s’inscrit aussi dans une autre finalité : la sélection. Et cela explique aussi notre attachement à la note chiffrée.

Un détour par l’histoire

Questions pour sourire et réfléchir… « De quand date la création du Baccalauréat ? » Même si la réponse donnée par les stagiaires est souvent “Napoléon” (ce qui n’est pas une date, on en conviendra !), on peut arriver assez vite à une réponse précise : 1808. Deuxième question : « De quand date la note chiffrée (plus précisément l’obligation de donner une note chiffrée) ? » Ici, les réponses sont plus difficiles. On a l’impression que la note chiffrée a toujours existé. Mais institutionnellement, cela suppose une organisation du système éducatif qui n’existait pas au moment de la création du baccalauréat. La bonne réponse est 1890. C’est par un arrêté du 5 juin 1890 qu’il est établi que « dans les compositions, chaque copie aura sa note chiffrée de 0 à 20 ». Jusque là, l’usage de la note chiffrée était certes répandu mais pas obligatoire. Et, en particulier, le baccalauréat (qui ne concernait que 1% de la population) se passait sans notes. Il reposait sur un entretien oral et les examinateurs disposaient de boules blanches et de boules noires. Une majorité de boules blanches, le candidat était admis. Une majorité de boules noires, il était refusé (blackboulé…). On peut déjà noter qu’on était alors pas très loin d’une logique “acquis/non acquis” qui fait écho aux modalités d’évaluation actuelles.

Mais puisque nous avons créé une “énigme didactique”, il nous faut surtout répondre à la question de savoir pourquoi on a créé l’obligation de noter. La réponse est à chercher dans le poids des concours (administratifs, grandes écoles,…) dans la 3^ème république naissante. Comme le souligne l’historien de l’éducation Claude Lelièvre "La France est un pays de concours" et dans la logique de la méritocratie républicaine, le classement précède la note. Le système éducatif qui se met en place est construit pour sélectionner et pour créer de l'émulation et notre modalité d’évaluation dominante en résulte. Il y a donc une culture de la note et plus encore l’idée que l’évaluation est associée à la sélection. On peut d’ailleurs expliquer ainsi les polémiques récurrentes sur le fait que le baccalauréat soit “donné” et que le “niveau baisse”. L’idée d’une évaluation au service des apprentissages et qui ne soit pas entièrement tournée vers la sélection a du mal à faire son chemin en France alors que cela apparaît beaucoup plus évident dans d’autres pays. Un détour comparatiste est d’ailleurs utile pour relativiser ce trait culturel.

Variations autour de l’évaluation

Comme souvent en matière d’éducation, il ne s’agit pas de raisonner de manière binaire en considérant qu’il faudrait abandonner complètement cette logique du classement au profit d’une logique de la régulation des apprentissages. Il s’agit plutôt de raisonner « en tension » en identifiant clairement les moments dans la scolarité où la première logique est nécessaire et ceux où il faut la tenir à l’écart. Il s’agit plutôt pour chaque professeur et notamment les enseignants débutants se savoir où placer le curseur pour réguler leur propre pratique.

Cela suppose aussi de se doter d’une définition large de l’évaluation. On peut en proposer plusieurs assez voisines. Celle qui me semble la plus opératoire est celle de Jean-Marie De Ketele qui se décline en trois points. Pour le chercheur belge...

« Évaluer signifie...

recueillir un ensemble d’informations suffisamment pertinentes, valides et fiables

et examiner le degré d’adéquation entre cet ensemble d’informations et un ensemble de critères adéquats aux objectifs fixés au départ ou ajustés en cours de route,

en vue de prendre une décision. »

Cette définition a le mérite de mettre l’accent sur le talent des pédagogues qui consiste à bien formuler les consignes et les questions afin de recueillir des informations “pertinentes, valides et fiables”. On renvoie ici à la didactique propre à chaque discipline. Le deuxième item nous rappelle que l’évaluation est un processus continu (et pas toujours un contrôle) et qu’elle suppose une confrontation avec des objectifs liés à un curriculum et/ou à des objectifs individuels. Enfin, le troisième item nous renvoie à la question de la finalité de l’évaluation. La décision peut être institutionnelle (attribuer une note, déterminer un passage dans une classe supérieure, délivrer un diplôme,…) mais elle peut et doit être aussi interne à la séquence d’apprentissage. Dans ce cas, l’évaluation enclenche selon les cas, le passage à une autre séquence ou un processus de remédiation. Cette dernière dimension est fréquemment oubliée et « la note » est souvent vécue comme une fatalité puisque l’évaluation est pensée trop souvent comme uniquement sommative. Cela nous permet aussi de rappeler une évidence souvent oubliée : notation et évaluation ne sont pas synonymes.

Dans le bagage commun des enseignants débutants, il est également indispensable de décliner des typologies de l’évaluation. Plus que la typologie bien connue de Benjamin Bloom (1971) (diagnostique, formative, sommative) qui nous rappelle que l’évaluation peut se situer avant, pendant et à la fin du processus d’apprentissage il me semble que c’est la distinction entre évaluation critériée (référence à des critères de performance) et normative (référence aux autres) qui est aujourd’hui la plus pertinente pour analyser l’évolution de notre système. Cette distinction nous renvoie en effet au débat sur les finalités que nous évoquions plus haut et éclaire la problématique du socle commun et du travail par compétences.

Notation et évaluation : un débat biaisé.

Elle permet aussi de voir autrement le débat sur la note auxquels les enseignants et l’opinion publique semblent encore si attachés. Si l’on privilégie une démarche d’évaluation critériée, la note reste possible mais perd de son sens. Mais ce qui semble surtout remis en question c’est la “moyenne” [2]qui repose sur un principe de compensation (une difficulté dans un domaine est masquée par une réussite dans un autre).

Par ailleurs, s’il y a un tel attachement à la note, c’est surtout parce que celle ci est jugée lisible et rigoureuse. En ce qui concerne la première qualité, cela nous renvoie à une dimension essentielle : évaluer c’est communiquer. Et cette communication peut être différente selon les destinataires. On ne fournit pas forcément les mêmes informations aux institutions, aux collègues, aux parents et aux élèves. L’enjeu de l’évolution de l’évaluation par compétences passe par un travail de simplification des critères qui sont communiqués, loin des “usines à cases”…

Sur la rigueur de la note chiffrée, il faut s’étonner que les recherches de la docimologie soient si peu connues et enseignées. Rappelons que ces travaux montrent depuis les années 30 la relativité de la notation et tous les biais qui rentrent en jeu. Dès 1936, la commission française de l’enquête Carnegie (Laugier, Weinberg) dans une expérience de multicorrection pointe l’extrême difficulté d’une correction “objective”. Les résultats des expériences menées montrèrent une forte dispersion des notes attribuées à chaque copie par les correcteurs. L’expérience de docimologie la plus intéressante à cet égard et qui frappe fortement les enseignants débutants est celle de la “note vraie”. Il s’agit de calculer statistiquement le nombre minimum d’examinateurs auxquels il faudrait faire appel pour obtenir une moyenne des notes mises par eux qui ne varie plus en y ajoutant un correcteur supplémentaire. Le résultat ? Il aurait fallu 128 correcteurs en Philosophie pour obtenir la “note vraie” (une moyenne qui ne bouge plus), 78 en Français, 16 en physique, 13 en mathématiques… Oui, mais c’était en 1936, depuis les choses ont changé, me direz vous... Oui, puisqu’on refait le même travail en 1976, cette fois ci d’après les calculs il faudrait 762 ( !) correcteurs de philo pour qu’une copie ait sa moyenne stabilisée, et 78 en mathématiques. On sait bien aussi comme l’ont montré de nouveaux ouvrages (voir notamment ceux de Pierre Merle[3] ) que la notation est affectée de nombreux biais et est souvent le produit d’un “arrangement”.

Évoquer ces différents travaux devrait permettre de montrer la relativité de la note et d’appeler les enseignants à plus de modestie et de relativisme. Il devrait aussi amener à plus de nuances dans les médias lorsqu’on évoque ces questions à l’occasion du bac et des consignes d’harmonisation. Mais il est vrai que l’apport des sciences de l’éducation est souvent méconnu et/ou méprisé par les enseignants eux-mêmes. Alors ne parlons pas des journalistes…

Les débats récurrents dans les médias sur la notation sont assez révélateurs de ce qui se joue dans les pratiques d’évaluation des enseignants et même au delà dans la conception que ceux ci ont de leur métier. Est-on “propriétaire” de sa note ? Derrière l’accusation biaisée de “tripatouillage” des notes au moment des examens il y a cette idée que l’évaluateur est souverain et que son jugement ne peut donc être remis en question. La discussion sur la note nous montre aussi que la conception implicite du métier est celle d’une pratique d’évaluation solitaire. Même si les choses progressent, les enseignants ont un rapport “intime” avec l’évaluation qu’ils pratiquent. Peut-être parce que cela touche chacun dans son propre système de valeurs et la conception que l’on a du travail, du mérite et du “niveau”. On a du mal à discuter d’évaluation tout comme on a du mal à ouvrir la porte de sa classe. Et en hésitant pas pour se justifier à utiliser des arguments contradictoires. Il est curieux de noter (!) que ce sont ceux qui ont sans cesse à la bouche l’égalité républicaine qui refusent l’idée même d’harmonisation. Il faut dire qu’elle suppose un travail en équipe !

On peut même aller un peu plus loin dans l’analyse en se demandant s’il ne faut pas analyser cette crispation en termes de “déclassement”. Lorsqu’on se focalise ainsi sur le pouvoir de noter individuellement qui serait remis en cause n’est-ce pas parce qu’on se raccroche à des symboles d’un supposé prestige déchu ? L’attachement à la note tout comme au redoublement ne sont-ils pas les symptômes d’une profession qui se vit comme dévalorisée ?

Pour une culture commune de l’évaluation

La question de l’évaluation est un analyseur de nombreux aspects du système scolaire. Ce thème permet d’aborder la question des finalités de notre système éducatif et d’interroger notre « élitisme républicain » mais aussi le métier enseignant, la culture des établissements, la différenciation, la remédiation, les relations avec les parents,…

L’évaluation est une pratique sociale et donc soumise à des normes (culture d'établissement, de la discipline, de la génération,...) et sous-tendue par des valeurs. L’évaluation renvoie donc chacun à sa propre conception de la justice et à ses représentations du travail, du niveau, des apprentissages, du pouvoir, … C’est aussi ce qui la rend si difficile à faire évoluer car elle s’appuie sur notre propre échelle de valeurs...

Il est tentant de ranger les questions d’évaluation du côté des didactiques. Il est vrai que les modalités d’évaluation ne sont pas les mêmes en mathématiques, en langues vivantes ou en EPS… Mais si l’évaluation doit évidemment faire l’objet de longs développements dans les préparations au concours et dans la formation strictement disciplinaire, il me semble tout aussi important que ce thème soit abordé comme une “culture commune” à tous les enseignants.

Il nous faut espérer que le passage aux ESPÉ permette de maintenir et même de renforcer cette dimension pédagogique et que l’on ne réduise pas l’évaluation à de simples questions techniques et didactiques propres à chaque discipline. Car c’est bien un enjeu pédagogique et même politique fort qu’il y a derrière cette question de l’évaluation. Ce peut être une pratique chronophage (évaluationnite) et qui peut être vidée de son sens par l’abus des “grilles” et autres référentiels et d’une forme de taylorisme pédagogique. Dans les pratiques actuelles des enseignants, le contrôle occupe une large part du temps d’enseignement : il en reste d’autant moins pour penser au changement. Les élèves travaillent pour la note, la moyenne ou la promotion, ce qui développe un "rapport utilitariste au savoir" avec une perte de sens des apprentissages. Comme l’écrivait très bien un rapport de l’IGEN de 2005[4] « Il est bon de rappeler que l’évaluation, qui est une évaluation de la partie, ne doit pas faire oublier le tout, le long chemin de culture où l’école a la responsabilité de conduire chaque personne à un moment de sa vie ; que l’évaluation, qui produit des signes sociaux nécessaires tels que les notes ou les diplômes, doit être au service des acquis, pour aider à les mesurer, pour leur donner visibilité, et pas le contraire. » En somme, faire de l'évaluation un réel outil pour l'apprentissage et au service de la réussite de tous les élèves. Mieux évaluer, donner du sens et de la visibilité aux apprentissages pour que l’École ne soient pas qu’au service des “héritiers”.

C’est, au final, une réflexion très politique qui engage un questionnement sociologique, historique et comparatiste et demande le temps suffisant pour permettre l’analyse collective et la confrontation des arguments et des pratiques. Ce moment de formation doit être à la hauteur des enjeux.

Philippe Watrelot

Professeur de sciences économiques et sociales

Professeur en temps partagé à l’IUFM de Paris.

Juin 2012

Cette œuvre est mise à disposition selon les termes de la Licence Creative Commons Attribution - Pas d’Utilisation Commerciale - Partage dans les Mêmes Conditions 3.0 France.

[1] “L'évaluation des élèves, outil de pilotage ou pare-angoisse ?” Cahierspédagogiques, n° 438, décembre 2005, pp. 14-16.

[2] « L’appel à la moyenne peut sembler bien anodin, alors qu’en neutralisant potentiellement chaque carence éventuelle par la vérification de la présence d’un acquis dans un domaine qui n’a rien à voir avec le premier, il remplace la scolarité par un jeu sophistiqué où l’important n’est pas d’acquérir telle compétence ou telle connaissance, mais une note abstraite, qui ne signifie rien en termes d’apprentissages. » Roger-François Gauthier, les Contenus de l’enseignement secondaire dans le monde : état des lieux et choix stratégiques, Unesco, 2006, 140 pages.

[3] Pierre Merle “Les Notes Secret de fabrication” PUF 2007

[4] « Les acquis des élèves, pierre de touche de la valeur de l’école » (Rapport IGEN/IGAENR juillet 2005)

1 commentaire:

Anonyme a dit…: Je recopie ici un commentaire que m'a envoyé Pascal Bouchard.

"Tu oublies, Philippe, une donnée qui me paraît essentielle. Les enseignants sentent leurs instances de légitimation leur échapper. Exemple simple : les pédagogues dénoncent, à juste titre et en se fondant sur la docimologie, le caractère arbitraire de la notation sur 20. Mais les enseignants tiennent leur légitimité des notes sur 20 qu'ils ont eues le jour du concours. Leur dire "les notes n'ont qu'une valeur relative", c'est leur dire "vous n'avez qu'une légitimité relative à être sur l'estrade". Ils le prennent mal et c'est normal.
Pascal Bouchard"; dimanche 24 août 2014 à 10:05:00 UTC+2

Enregistrer un commentaire

Chronique Éducation

mercredi, juin 18, 2014

ESPÉ : Pour une “culture commune” de l'évaluation

1 commentaire:

Blog fondé en 2004

"La seule certitude que j"ai, c"est d"être dans le doute"
P. Desproges

Qui êtes-vous ?

A propos des commentaires

Un billet en vedette…

Opinion enseignante : unité, clivages et tensions

Utilisation de cette chronique

Articles les plus consultés

Archives

Une sélection d'articles...

Sur le site des Cahiers Pédagogiques

Vous aimez les revues de presse? alors achetez des journaux !

Chronique Éducation

mercredi, juin 18, 2014

ESPÉ : Pour une “culture commune” de l'évaluation

1 commentaire:

Blog fondé en 2004

"La seule certitude que j"ai, c"est d"être dans le doute" P. Desproges

Qui êtes-vous ?

A propos des commentaires

Un billet en vedette…

Opinion enseignante : unité, clivages et tensions

Utilisation de cette chronique

Articles les plus consultés

Archives

Une sélection d'articles...

Sur le site des Cahiers Pédagogiques

Vous aimez les revues de presse? alors achetez des journaux !

S’abonner à Chronique éducation

"La seule certitude que j"ai, c"est d"être dans le doute"
P. Desproges