Cet article était initialement destiné à être publié dans un recueil de textes à la suite de la conférence de consensus des IUFM franciliens en 2011 consacrée à l'évaluation. Mais, la publication a été retardée et ne semble plus aujourd'hui à l'ordre du jour. Je publie donc, aujourd'hui sur mon blog, cette tribune qui relate ma pratique des formations transversales que je mène depuis 7 ans à l'IUFM et aujourd'hui à l'ESPÉ de Paris.
Parce que, me semble t-il, la problématique qui y est développée est toujours d'actualité : Si on veut faire évoluer l'évaluation il faut en faire un sujet de formation qui ne soit pas uniquement celui des didactiques disciplinaires mais une réflexion commune faisant appel à l'histoire, les sciences sociales et surtout à un véritable questionnement pédagogique.
Pour compléter cet article, on peut visionner et télécharger un diaporama qui correspond à une partie de la formation.
----------------
« S’ils ont de trop bonnes notes ils vont
arrêter de travailler » ; « Quoi qu'on fasse, il y aura toujours à peu près 1/3 de bons, 1/3 de
moyens et 1/3 de faibles », « Il a progressé: sa note est passée de 9,76 à 9,98 ! » ;
« Moi, je mets des notes justes,
car ma grille de critères est très
précise et travaillée »
“Selon votre pratique personnelle et
votre réflexion, situez vous par rapport aux différentes phrases en opposition ou en adhésion, et justifiez ensuite vos réponses dans la discussion”.
Voici en
quelques mots comment démarrent les séances que j’anime depuis six ans à l’IUFM
de Paris consacrées à l’évaluation. Ces séances “transversales”, c’est-à-dire
proposées à tous les enseignants stagiaires (du secondaire) commencent par un
“Q-sort” comprenant une dizaine de phrases. Il s’agit “à froid” pour les
enseignants stagiaires de réagir par rapport à ces phrases toutes faites que
l’on peut entendre en salle des professeurs et dans les discours tenus par les
collègues. Certaines renvoient à une conception “traditionnelle” de
l’évaluation, d’autres pourraient être plutôt prononcées par des enseignants
supposés innovants. En fait, il
s’agit avant tout de travailler sur les représentations que nous avons tous de
l’évaluation. Des représentations forgées dès l’enfance et sa propre expérience
d’élève et qui se sont renforcées ou ont évolué avec les premières expériences
d’une pratique d’enseignement.
Après un
temps relativement bref de passation du questionnaire, la discussion est très
vite lancée sur chacune des phrases et donne lieu à des échanges nourris et
d’une grande richesse. Dès le départ, il est précisé qu’il ne s’agit pas de
juger les réponses en conformité avec une quelconque doxa pédagogique mais bien de leur permettre de développer leur
propre argumentation et réflexion dans une discussion (une “dispute”...) entre
collègues. Ma position en tant que formateur durant ce premier temps est avant
tout de distribuer la parole mais aussi de mettre en perspective les réflexions
des uns et des autres et de les relier à quelques concepts que nous verrons
plus précisément ensuite dans une deuxième phase de la séance.
Durant
toutes ces années, j’ai été frappé par quelques constantes.
D’abord, l’intensité
des discussions : les questions liées à l’évaluation prennent une place
importante dans le vécu des nouveaux enseignants. Certains disent avoir mis de
très nombreuses heures à préparer puis corriger leurs premières copies tant les
problèmes qu’ils se posaient étaient nombreux et semblaient insolubles. En
parler semble un élément important
de la construction professionnelle.
Ensuite, il
faut noter la satisfaction qu’expriment les stagiaires de pouvoir s’exprimer en
tant que “collègues” sans avoir le sentiment d’être jugés sur la conformité
avec une doctrine pédagogique. Le travail sur les représentations permet d’éviter
ce biais fréquent dans la formation des enseignants et libère la parole en la
raccrochant au vécu (en tant qu’ancien élève et nouvel enseignant). Selon la
jolie formule d’André Giordan : avec les représentations, il s’agit de “faire avec pour aller contre”. C’est
souvent la condition à un réel apprentissage. Partir de ces représentations est
donc un préalable qui permet d’engager la discussion mais cela n’est évidemment
pas suffisant. Il faut ensuite faire un certain nombre d’apports de
connaissances sur ce thème de l’évaluation. En effet, après ce premier temps de
débat et de réactions autour des représentations, la séance se poursuit avec un
exposé plus classique développant des connaissances sociologiques, historiques,
institutionnelles et bien sûr dans la champ de la docimologie.
L’évaluation vue par les parents, les élèves, les
enseignants…
Pour faire
une transition avec la première partie, le début de mon exposé propose de
montrer que les représentations et l’opinion sur l’évaluation varie selon les
acteurs sociaux (parents, élèves, enseignants). On peut s’appuyer pour cela sur
un certain nombre de sondages et d’enquêtes réalisées au cours des dernières
années. Dans un sondage paru dans La Croix en 2004, on notait que la question
de l’évaluation («quelle note as-tu eues aujourd’hui ») est très
souvent la première question posée aux enfants. On y voit aussi que les notes
obtenues influencent fortement l’attitude des parents à l’égard de leurs
enfants (punitions, récompenses). L’étude de ces sondages permet aussi de voir
une évolution de l’opinion publique à l’égard de l’évaluation. Si les parents
et l’opinion publique en général semblent rester attachés à la note chiffrée
car celle-ci est considérée, à tort ou à raison, comme “lisible” et rigoureuse,
on note aussi que l’opinion évolue et qu’en particulier pour le primaire, on
apprécie des modes d’évaluation alternatifs et le desserrement de la pression
évaluative. Le sondage lancé à l’occasion de l’appel de l’AFEV pour la suppression des notes à l’École montre une nette évolution.
Il est
évidemment difficile d’avoir des enquêtes sur les opinions des premiers
intéressés, c’est-à-dire les élèves eux mêmes. On ne peut se baser que sur des
témoignages qui doivent être pris avec précaution. Toutefois on note des
constantes, que Pierre Merle dans “L’élève humilié” (2005) où il
interroge de jeunes adultes sur les situations d’humiliations vécues à l’école,
met bien en évidence. L’expérience de l’évaluation est un moment fort pour de
très nombreux élèves et renvoie à des situations qui remettent en question
l’estime de soi, la motivation et conduisent même dans certains cas à des
situations d’humiliation.
En ce qui
concerne les enseignants, on dispose de nombreux éléments d’enquête. Les
pratiques d’évaluation ont été étudiées à plusieurs reprises et notamment dans
deux grandes études. « Les pratiques d’évaluation des enseignants au collège » parue en 2004 offre
l’avantage de s’appuyer sur un travail important d’enquête statistique auprès
de 3561 enseignants dans 597 collèges. Elle fait apparaître un relatif
consensus sur les fonctions de l’évaluation. Lorsqu’on demande aux enseignants
de donner trois réponses, les trois
qui arrivent en tête sont :
- mesurer les acquis des élèves (95% des réponses parmi trois réponses possibles)
- s’assurer que les objectifs ont été atteints (90,7%)
- fournir une note (41,4%)
Mais
surtout ce qui est notable dans toutes ces études c’est la part considérable que
l’ évaluation occupe dans le temps de travail des enseignants. On estime
en effet que c’est entre un quart et un tiers du temps de l’enseignant de
collège et de lycée. Mais la question que cela devrait susciter est : pour
quelle efficacité ?
Les
enseignants débutants perçoivent très vite ce travers du système qu’est l’ “évaluationnite” :
On évalue… parce qu’il faut
évaluer… On “fournit des notes” parce que le système éducatif, les parents (les
élèves ?), en réclament. Mais les pratiques d’évaluation sont peu
satisfaisantes au regard des enjeux. « Imaginez un
restaurant gastronomique réputé dont les clients exigeraient d'être informés de
manière continue de la manière dont progresse la préparation du plat qu'ils ont
commandé. Du coup, la moitié du temps de travail des cuisiniers consisterait à
informer les clients, au détriment de la qualité de la cuisine...» Cette
métaphore de Philippe Perrenoud[1]
est un bon moyen d’engager le débat sur les finalités de l’évaluation et de
montrer l’ambigüité de notre rapport à l’évaluation.
Tous les
pédagogues s’accordent sur la nécessité de mettre l’évaluation au service des
apprentissages. Mais dans l’opinion, dans la culture française, celle-ci
s’inscrit aussi dans une autre finalité : la sélection. Et cela explique
aussi notre attachement à la note chiffrée.
Un détour par l’histoire
Questions pour
sourire et réfléchir… « De quand date la création du Baccalauréat ? »
Même si la réponse donnée par les stagiaires est souvent “Napoléon” (ce qui n’est pas une date,
on en conviendra !), on peut arriver assez vite à une réponse précise
: 1808. Deuxième question : « De quand date la note
chiffrée (plus précisément l’obligation de donner une note chiffrée)
? » Ici, les réponses sont plus difficiles. On a l’impression que la note
chiffrée a toujours existé. Mais institutionnellement, cela suppose une
organisation du système éducatif qui n’existait pas au moment de la création du
baccalauréat. La bonne réponse est 1890. C’est par un arrêté du 5 juin 1890
qu’il est établi que « dans les
compositions, chaque copie aura sa note chiffrée de 0 à 20 ». Jusque là,
l’usage de la note chiffrée était certes répandu mais pas obligatoire. Et, en
particulier, le baccalauréat (qui ne concernait que 1% de la population) se
passait sans notes. Il reposait sur un entretien oral et les examinateurs
disposaient de boules blanches et de boules noires. Une majorité de boules
blanches, le candidat était admis. Une majorité de boules noires, il était refusé
(blackboulé…). On peut déjà noter qu’on était alors pas très loin d’une logique
“acquis/non acquis” qui fait écho aux modalités d’évaluation actuelles.
Mais puisque
nous avons créé une “énigme didactique”, il nous faut surtout répondre à la
question de savoir pourquoi on a créé l’obligation de noter. La réponse est à
chercher dans le poids des concours (administratifs, grandes écoles,…) dans la
3ème république naissante. Comme le souligne l’historien de
l’éducation Claude Lelièvre "La
France est un pays de concours" et dans la logique de la méritocratie
républicaine, le classement précède la note. Le système éducatif qui se met en
place est construit pour sélectionner et pour créer de l'émulation et notre
modalité d’évaluation dominante en résulte. Il y a donc une culture de la note
et plus encore l’idée que l’évaluation est associée à la sélection. On peut d’ailleurs
expliquer ainsi les polémiques récurrentes sur le fait que le baccalauréat soit
“donné” et que le “niveau baisse”. L’idée d’une évaluation au service des
apprentissages et qui ne soit pas entièrement tournée vers la sélection a du
mal à faire son chemin en France alors que cela apparaît beaucoup plus évident
dans d’autres pays. Un détour comparatiste est d’ailleurs utile pour
relativiser ce trait culturel.
Variations autour de l’évaluation
Comme
souvent en matière d’éducation, il ne s’agit pas de raisonner de manière
binaire en considérant qu’il
faudrait abandonner complètement cette logique du classement au profit d’une
logique de la régulation des apprentissages. Il s’agit plutôt de raisonner
« en tension » en identifiant clairement les moments dans la
scolarité où la première logique est nécessaire et ceux où il faut la tenir à
l’écart. Il s’agit plutôt pour chaque professeur et notamment les enseignants
débutants se savoir où placer le curseur pour réguler leur propre pratique.
Cela
suppose aussi de se doter d’une définition large de l’évaluation. On peut en
proposer plusieurs assez voisines. Celle qui me semble la plus opératoire est
celle de Jean-Marie De Ketele qui se décline en trois points. Pour le chercheur
belge...
« Évaluer signifie...
- recueillir un ensemble d’informations suffisamment pertinentes, valides et fiables
- et examiner le degré d’adéquation entre cet ensemble d’informations et un ensemble de critères adéquats aux objectifs fixés au départ ou ajustés en cours de route,
- en vue de prendre une décision. »
Cette
définition a le mérite de mettre l’accent sur le talent des pédagogues qui
consiste à bien formuler les consignes et les questions afin de recueillir des
informations “pertinentes, valides et fiables”. On renvoie ici à la didactique
propre à chaque discipline. Le deuxième item nous rappelle que l’évaluation est
un processus continu (et pas toujours un contrôle) et qu’elle suppose une
confrontation avec des objectifs liés à un curriculum et/ou à des objectifs
individuels. Enfin, le troisième item nous renvoie à la question de la finalité
de l’évaluation. La décision peut être institutionnelle (attribuer une note,
déterminer un passage dans une classe supérieure, délivrer un diplôme,…) mais
elle peut et doit être aussi interne à la séquence d’apprentissage. Dans ce
cas, l’évaluation enclenche selon les cas, le passage à une autre séquence ou
un processus de remédiation. Cette dernière dimension est fréquemment oubliée
et « la note » est souvent vécue comme une fatalité puisque
l’évaluation est pensée trop souvent comme uniquement sommative. Cela nous
permet aussi de rappeler une évidence souvent oubliée : notation et
évaluation ne sont pas synonymes.
Dans le
bagage commun des enseignants débutants, il est également indispensable de
décliner des typologies de l’évaluation. Plus que la typologie bien connue de Benjamin Bloom (1971) (diagnostique, formative, sommative) qui nous rappelle que
l’évaluation peut se situer avant, pendant et à la fin du processus
d’apprentissage il me semble que c’est la distinction entre évaluation critériée
(référence à des critères de performance) et normative (référence aux autres)
qui est aujourd’hui la plus pertinente pour analyser l’évolution de notre
système. Cette distinction nous renvoie en effet au débat sur les finalités que
nous évoquions plus haut et éclaire la problématique du socle commun et du
travail par compétences.
Notation et évaluation : un débat biaisé.
Elle permet
aussi de voir autrement le débat sur la note auxquels les enseignants et
l’opinion publique semblent encore si attachés. Si l’on privilégie une démarche d’évaluation critériée, la
note reste possible mais perd de son sens. Mais ce qui semble surtout remis en
question c’est la “moyenne” [2]qui
repose sur un principe de compensation (une difficulté dans un domaine est
masquée par une réussite dans un autre).
Par
ailleurs, s’il y a un tel attachement à la note, c’est surtout parce que celle
ci est jugée lisible et rigoureuse. En ce qui concerne la première qualité, cela
nous renvoie à une dimension essentielle : évaluer c’est communiquer. Et
cette communication peut être différente selon les destinataires. On ne fournit
pas forcément les mêmes informations aux institutions, aux collègues, aux
parents et aux élèves. L’enjeu de l’évolution de l’évaluation par compétences
passe par un travail de simplification des critères qui sont communiqués, loin
des “usines à cases”…
Sur la
rigueur de la note chiffrée, il faut s’étonner que les recherches de la
docimologie soient si peu connues et enseignées. Rappelons que ces travaux
montrent depuis les années 30 la relativité de la notation et tous les biais
qui rentrent en jeu. Dès 1936, la commission française de l’enquête Carnegie
(Laugier, Weinberg) dans une expérience de multicorrection pointe
l’extrême difficulté d’une correction “objective”. Les résultats des
expériences menées montrèrent une forte dispersion des notes attribuées à
chaque copie par les correcteurs. L’expérience de docimologie la plus
intéressante à cet égard et qui frappe fortement les enseignants débutants est celle
de la “note vraie”. Il s’agit de calculer statistiquement le nombre minimum
d’examinateurs auxquels il faudrait faire appel pour obtenir une moyenne des
notes mises par eux qui ne varie plus en y ajoutant un correcteur
supplémentaire. Le résultat ? Il aurait fallu 128 correcteurs en Philosophie
pour obtenir la “note vraie” (une moyenne qui ne bouge plus), 78 en Français,
16 en physique, 13 en mathématiques… Oui, mais c’était en 1936, depuis les choses
ont changé, me direz vous... Oui, puisqu’on refait le même travail en
1976, cette fois ci d’après les calculs il faudrait 762 ( !) correcteurs de
philo pour qu’une copie ait sa moyenne stabilisée, et 78 en mathématiques. On
sait bien aussi comme l’ont montré
de nouveaux ouvrages (voir notamment ceux de Pierre Merle[3] ) que la notation est affectée de nombreux biais
et est souvent le produit d’un “arrangement”.
Évoquer ces
différents travaux devrait permettre de montrer la relativité de la note et
d’appeler les enseignants à plus de modestie et de relativisme. Il devrait
aussi amener à plus de nuances dans les médias lorsqu’on évoque ces questions à
l’occasion du bac et des consignes d’harmonisation. Mais il est vrai que
l’apport des sciences de l’éducation est souvent méconnu et/ou méprisé par les
enseignants eux-mêmes. Alors ne parlons pas des journalistes…
Les débats récurrents dans les médias sur
la notation sont assez révélateurs de ce qui se joue dans les pratiques
d’évaluation des enseignants et même au delà dans la conception que ceux ci ont
de leur métier. Est-on “propriétaire” de sa note ? Derrière l’accusation
biaisée de “tripatouillage” des notes au moment des examens il y a cette idée
que l’évaluateur est souverain et que son jugement ne peut donc être remis en
question. La discussion sur la note nous montre aussi que la conception
implicite du métier est celle d’une pratique d’évaluation solitaire. Même si
les choses progressent, les enseignants ont un rapport “intime” avec l’évaluation
qu’ils pratiquent. Peut-être parce que cela touche chacun dans son propre
système de valeurs et la conception que l’on a du travail, du mérite et du
“niveau”. On a du mal à discuter d’évaluation tout comme on a du mal à ouvrir
la porte de sa classe. Et en hésitant pas pour se justifier à utiliser des
arguments contradictoires. Il est curieux de noter (!) que ce sont ceux qui
ont sans cesse à la bouche l’égalité républicaine qui
refusent l’idée même d’harmonisation. Il faut dire qu’elle suppose un travail
en équipe !
On
peut même aller un peu plus loin dans l’analyse en se demandant s’il ne faut
pas analyser cette crispation en termes de “déclassement”. Lorsqu’on se
focalise ainsi sur le pouvoir de noter individuellement qui serait remis en
cause n’est-ce pas parce qu’on se raccroche à des symboles d’un supposé
prestige déchu ? L’attachement à la note tout comme au redoublement ne sont-ils
pas les symptômes d’une profession qui se vit comme dévalorisée ?
Pour une culture commune de l’évaluation
La question
de l’évaluation est un analyseur de nombreux aspects du système scolaire. Ce
thème permet d’aborder la question des finalités de notre système éducatif et
d’interroger notre « élitisme républicain » mais aussi le métier
enseignant, la culture des établissements,
la différenciation, la remédiation,
les relations avec les parents,…
L’évaluation
est une pratique sociale et donc soumise à des normes (culture d'établissement,
de la discipline, de la génération,...)
et sous-tendue par des valeurs. L’évaluation renvoie donc chacun à sa propre conception de la
justice et à ses représentations du travail, du niveau, des apprentissages, du pouvoir, … C’est aussi ce
qui la rend si difficile à faire évoluer car elle s’appuie sur notre propre
échelle de valeurs...
Il est
tentant de ranger les questions d’évaluation du côté des didactiques. Il est
vrai que les modalités d’évaluation ne sont pas les mêmes en mathématiques, en
langues vivantes ou en EPS… Mais si l’évaluation doit évidemment faire l’objet
de longs développements dans les préparations au concours et dans la formation
strictement disciplinaire, il me semble tout aussi important que ce thème soit
abordé comme une “culture commune” à tous les enseignants.
Il nous
faut espérer que le passage aux ESPÉ
permette de maintenir et même de renforcer cette dimension pédagogique et que
l’on ne réduise pas l’évaluation à de simples questions techniques et
didactiques propres à chaque discipline. Car c’est bien un enjeu pédagogique et même politique fort qu’il y a
derrière cette question de l’évaluation. Ce peut être une pratique chronophage
(évaluationnite) et qui peut être
vidée de son sens par l’abus des “grilles” et autres référentiels et d’une
forme de taylorisme pédagogique.
Dans les pratiques actuelles des enseignants, le contrôle occupe une large part
du temps d’enseignement : il en reste d’autant moins pour penser au changement.
Les élèves travaillent pour la note, la moyenne ou la promotion, ce qui
développe un "rapport utilitariste au savoir" avec une perte de sens
des apprentissages. Comme l’écrivait très bien un rapport de l’IGEN de 2005[4]
« Il est bon de rappeler que
l’évaluation, qui est une évaluation de la partie, ne doit pas faire oublier le
tout, le long chemin de culture où l’école a la responsabilité de conduire
chaque personne à un moment de sa vie ; que l’évaluation, qui produit des
signes sociaux nécessaires tels que les notes ou les diplômes, doit être au
service des acquis, pour aider à les mesurer, pour leur donner visibilité, et
pas le contraire. » En somme, faire de l'évaluation un réel outil pour
l'apprentissage et au service de la réussite de tous les élèves. Mieux évaluer,
donner du sens et de la visibilité aux apprentissages pour que l’École ne
soient pas qu’au service des “héritiers”.
C’est, au
final, une réflexion très politique qui engage un questionnement sociologique,
historique et comparatiste et demande le temps suffisant pour permettre
l’analyse collective et la confrontation des arguments et des pratiques. Ce
moment de formation doit être à la hauteur des enjeux.
Philippe Watrelot
Professeur de sciences économiques et
sociales
Professeur en temps partagé à l’IUFM de
Paris.
Juin 2012
Cette œuvre est mise à disposition selon les termes de la Licence Creative Commons Attribution - Pas d’Utilisation Commerciale - Partage dans les Mêmes Conditions 3.0 France.
[1]
“L'évaluation des élèves, outil de pilotage
ou pare-angoisse ?” Cahierspédagogiques, n° 438, décembre 2005, pp. 14-16.
[2] « L’appel à la moyenne peut sembler bien anodin, alors qu’en neutralisant
potentiellement chaque carence éventuelle par la vérification de la présence
d’un acquis dans un domaine qui n’a rien à voir avec le premier, il remplace la
scolarité par un jeu sophistiqué où l’important n’est pas d’acquérir telle
compétence ou telle connaissance, mais une note abstraite, qui ne signifie rien
en termes d’apprentissages. » Roger-François Gauthier, les Contenus de
l’enseignement secondaire dans le monde : état des lieux et choix stratégiques,
Unesco, 2006, 140 pages.
[3] Pierre Merle
“Les Notes Secret de fabrication” PUF 2007
[4] « Les acquis des élèves, pierre de touche de la valeur de l’école »
(Rapport IGEN/IGAENR juillet 2005)
1 commentaire:
Je recopie ici un commentaire que m'a envoyé Pascal Bouchard.
"Tu oublies, Philippe, une donnée qui me paraît essentielle. Les enseignants sentent leurs instances de légitimation leur échapper. Exemple simple : les pédagogues dénoncent, à juste titre et en se fondant sur la docimologie, le caractère arbitraire de la notation sur 20. Mais les enseignants tiennent leur légitimité des notes sur 20 qu'ils ont eues le jour du concours. Leur dire "les notes n'ont qu'une valeur relative", c'est leur dire "vous n'avez qu'une légitimité relative à être sur l'estrade". Ils le prennent mal et c'est normal.
Pascal Bouchard"
Enregistrer un commentaire