Conditionnement opérant
Le conditionnement des opérateurs est une forme d'apprentissage. Dans ce cadre, un individu modifie son comportement en raison des conséquences (résultats) de ce comportement.
La personne ou l'animal apprend que son comportement a une conséquence. Cette conséquence peut être
- Renforcement : un événement positif ou gratifiant. Le comportement se produit alors plus souvent
- Punition : un événement négatif ou punitif. Le comportement se produit ainsi moins souvent
- Extinction : aucun événement ne suit, donc le comportement n'a pas de conséquences. Lorsqu'un comportement n'a pas de conséquences, il se produit moins fréquemment.
Il existe quatre contextes différents dans le conditionnement opérant. Ici, les termes "positif" et "négatif" ne sont pas utilisés dans leur sens fondamental ; positif signifie que quelque chose est ajouté, et négatif signifie que quelque chose est enlevé :
- Le renforcement positif (souvent juste un "renforcement") se produit lorsqu'il y a une récompense pour une forme de comportement. Cela augmente la fréquence à laquelle le comportement se produit. Dans l'expérience de la boîte de Skinner, la récompense est sous forme de nourriture lorsque le rat appuie sur un levier.
- Le renforcement négatif (parfois la "fuite") se produit lorsqu'un stimulus aversif est supprimé. Cela augmente la fréquence à laquelle le comportement se produit. Dans l'expérience de la boîte de Skinner, il y avait un bruit fort, qui a été supprimé lorsque le rat a appuyé sur le levier.
- La punition positive se produit lorsqu'un stimulus est ajouté, ce qui fait que le comportement se produit moins souvent. Les stimuli peuvent être par exemple un bruit fort, un choc électrique (rat) ou une fessée (enfant).
- La punition négative se produit lorsqu'un stimulus est retiré, ce qui fait que le comportement se produit moins souvent. Par exemple, un jouet peut être retiré à un enfant qui a eu un comportement indésirable.
L'idée du conditionnement opérant a été découverte par Edward Thorndike, et analysée par B.F. Skinner.
Le conditionnement opérateur est différent du conditionnement classique de Pavlov. Le conditionnement opérateur concerne la modification volontaire du comportement ; le conditionnement classique, l'entraînement d'un réflexe.
La loi d'effet de Thorndike
Le conditionnement opérateur, parfois appelé apprentissage instrumental, a été étudié pour la première fois par Edward L. Thorndike (1874-1949). Il a observé le comportement des chats qui essayaient de s'échapper de boîtes à puzzle faites maison. Lorsqu'ils étaient mis dans ces boîtes, les chats mettaient beaucoup de temps à s'échapper. Avec l'expérience, les réponses positives étaient plus fréquentes, ce qui permettait aux chats de s'échapper en moins de temps. Dans sa loi de l'effet, Thorndike a théorisé que les comportements suivis de conséquences satisfaisantes ont tendance à se répéter, et que ceux qui produisent des conséquences désagréables ont moins de chances de se répéter. En bref, certaines conséquences renforcent le comportement et d'autres l'affaiblissent. Thorndike a produit les premières courbes d'apprentissage connues par cette procédure.
B.F. Skinner (1904-1990) a élaboré une analyse plus détaillée du conditionnement opérant. Skinner a inventé la chambre de conditionnement opérant qui lui a permis de mesurer le taux de réponse comme une variable clé dépendante. Il a utilisé un enregistrement des pressions sur les leviers ou les touches.
Principes du conditionnement opérant :
- La discrimination, la généralisation et l'importance du contexte.
- L'apprentissage se fait dans des contextes.
- La plupart des comportements sont sous contrôle de stimulus : une réponse particulière ne se produit que lorsqu'un stimulus approprié est présent.
- Le contrôle des stimuli est efficace même si le stimulus n'a aucune signification pour le répondant.
- Extinction : le comportement opérant s'éteint lorsque le renforcement s'arrête.
- Les renforts ne se produisent que lorsque la réponse appropriée a été apportée, et peuvent ne pas se produire même à ce moment-là. Les comportements ne s'affaiblissent pas et s'éteignent pour cette raison.
- Les résultats dépendent en partie de la fréquence du renforcement.
- Calendrier des renforts : le calendrier des renforts est crucial.
- Calendrier à intervalles fixes : les renforts sont présentés à des périodes fixes, à condition que la réponse appropriée soit apportée.
- Programme à intervalle variable : un comportement est renforcé sur la base d'un temps moyen écoulé depuis le dernier renforcement. Programmes de ratios : basés sur le ratio entre les réponses et les renforcements.
- Calendrier à intervalle fixe : le renforcement est délivré après un nombre spécifique de réponses. Le cas particulier de la présentation du renforcement après chaque réponse est appelé renforcement continu.
- Intervalle variable : le renforcement de la livraison est basé sur un nombre moyen particulier de réponses.
Questions et réponses
Q : Qu'est-ce que le conditionnement opérant ?
R : Le conditionnement opérant est une forme d'apprentissage dans laquelle un individu modifie son comportement en fonction des conséquences (résultats) de ce comportement.
Q : Quels sont les quatre contextes du conditionnement opérant ?
R : Les quatre contextes du conditionnement opérant sont le renforcement positif, le renforcement négatif, la punition positive et la punition négative.
Q : Comment fonctionne le renforcement positif ?
R : Le renforcement positif se produit lorsqu'un comportement est récompensé, ce qui augmente la fréquence du comportement.
Q : Comment fonctionne le renforcement négatif ?
R : Le renforcement négatif se produit lorsqu'un stimulus aversif est supprimé, ce qui augmente la fréquence à laquelle le comportement se produit.
Q : Comment fonctionne la punition positive ?
R : On parle de punition positive lorsqu'un stimulus est ajouté, ce qui a pour effet de réduire la fréquence du comportement.
Q : Comment fonctionne la punition négative ? R : On parle de punition négative lorsqu'un stimulus est retiré, ce qui a pour effet de réduire la fréquence du comportement.
Q : Qui a découvert le conditionnement opérant en premier ?
R : Edward Thorndike a découvert le conditionnement opérant, qui a ensuite été analysé par B.F. Skinner.