Le conditionnement opérant est une forme d'apprentissage par laquelle un individu modifie volontairement son comportement en fonction des conséquences qui suivent ce comportement. Autrement dit, l'individu apprend que certaines actions entraînent des résultats avantageux ou désavantageux, et adapte sa fréquence de réalisation en conséquence.
Conséquences du comportement : renforcements, punitions et extinction
On distingue trois types de conséquences principales :
- Renforcement : un événement agréable ou utile qui augmente la probabilité que le comportement se reproduise.
- Punition : un événement désagréable qui diminue la probabilité que le comportement se reproduise.
- Extinction : absence de conséquence ; lorsqu'un comportement n'est plus suivi d'un renforcement, il tend à diminuer et finit souvent par disparaître.
Les quatre quadrants du conditionnement opérant
Dans le cadre du conditionnement opérant, on parle souvent de « positif » et « négatif » au sens technique : positif = ajout d'un stimulus ; négatif = retrait d'un stimulus. Cela donne quatre cas possibles :
- Renforcement positif : on ajoute quelque chose d'agréable après le comportement (ex. donner une friandise à un chien qui obéit). Cela augmente la fréquence du comportement.
- Renforcement négatif : on retire ou évite un stimulus aversif lorsque le comportement se produit (ex. arrêter un bruit désagréable quand l'animal actionne un levier). Cela augmente aussi la fréquence du comportement.
- Punition positive : on ajoute un stimulus aversif après le comportement (ex. un bruit fort, une correction) pour diminuer la probabilité que le comportement se reproduise.
- Punition négative : on retire un stimulus agréable après le comportement (ex. enlever un jouet à un enfant). Là encore, le but est de réduire la fréquence du comportement.
Exemples classiques et expérimentaux
Edward Thorndike a décrit le principe général avec la « boîte à énigmes » et la loi de l'effet : les réponses qui produisent un effet satisfaisant sont renforcées. B. F. Skinner a approfondi le concept avec la célèbre « boîte de Skinner » (operant chamber), où des animaux, comme des rats ou des pigeons, apprenaient à appuyer sur un levier ou picorer un disque pour obtenir de la nourriture (renforcement positif) ou pour interrompre un bruit désagréable (renforcement négatif).
Mécanismes et procédés importants
- Façonnage (shaping) : renforcement progressif des approximations successives d'un comportement complexe jusqu'à obtenir la réponse souhaitée.
- Chaining : enchaînement de comportements élémentaires renforcés dans un ordre précis pour aboutir à une séquence complexe (utile dans le dressage animalier et les formations professionnelles).
- Discrimination : apprentissage à émettre un comportement seulement en présence d'un stimulus discriminatif (ex. un signal lumineux indiquant que le levier sera récompensé).
- Généralisation : extension d'une réponse apprise à des situations similaires.
Programmes de renforcement (schedules)
La fréquence et la résistance à l'extinction d'un comportement dépendent du programme de renforcement :
- Renforcement continu : chaque réponse est renforcée ; l'apprentissage est rapide mais l'extinction aussi.
- Renforcement partiel : seules certaines réponses sont renforcées. On distingue :
- Ratio fixe : renforcement tous les N comportements (ex. une récompense toutes les 10 réponses) — conduit à un taux de réponse élevé avec pause après renforcement.
- Ratio variable : renforcement après un nombre moyen de réponses (ex. jeu de hasard) — très résistant à l'extinction.
- Intervalle fixe : renforcement de la première réponse après un intervalle de temps fixe (ex. premier appui passé 30 s).
- Intervalle variable : intervalle de temps variable — produit un taux de réponse stable et résistant à l'extinction.
Applications pratiques
Le conditionnement opérant est largement utilisé :
- En éducation : renforcements (éloges, points, récompenses) pour encourager les comportements d'apprentissage ; programmes token economy pour motiver les élèves.
- En parentalité : renforcement des comportements souhaitables, retrait de privilèges pour sanctionner.
- En dressage animalier : shaping et renforcement positif pour enseigner des tours et comportements utiles.
- En clinique : thérapies comportementales (ex. modification des comportements addictifs, gestion des phobies via renforcements alternatifs).
- En entreprise : systèmes d'incitation, reconnaissance, primes pour augmenter la productivité.
Différences avec le conditionnement classique
Le conditionnement opérant diffère du conditionnement classique (Pavlov) :
- Classique : association entre deux stimuli pour provoquer une réponse réflexe involontaire (ex. son + nourriture → salivation).
- Opérant : relation entre un comportement volontaire et ses conséquences (renforcement/punition) qui modifient la probabilité d'apparition du comportement.
Limites et considérations éthiques
La punition peut supprimer temporairement un comportement mais comporte des risques (peur, agressivité, avoidance, faiblesse de l'apprentissage de comportements alternatifs). Les spécialistes recommandent de privilégier le renforcement positif et les techniques d'enseignement, d'être cohérent, d'utiliser des renforçateurs adaptés et de veiller au bien-être des personnes et des animaux.
Conseils pratiques pour appliquer le conditionnement opérant
- Renforcer immédiatement le comportement souhaité pour que l'association soit claire.
- Choisir des renforçateurs pertinents et motivants pour l'individu.
- Commencer par un renforcement fréquent, puis passer progressivement à un renforcement partiel pour maintenir le comportement.
- En cas de punition, expliquer et enseigner une alternative acceptable plutôt que de se limiter à sanctionner.
En résumé, le conditionnement opérant est un cadre théorique et pratique puissant pour comprendre et modifier les comportements volontaires. Découvert par Thorndike et développé en profondeur par Skinner, il reste aujourd'hui un fondement central de la psychologie comportementale et de nombreuses méthodes d'intervention éducatives et thérapeutiques.