Erreur type

Auteur: Leandro Alegsa

09-05-2021 21:11

L'erreur type est l'écart-type de la distribution d'échantillonnage d'une statistique. Le terme peut également être utilisé pour une estimation (bonne estimation) de cet écart-type prise à partir d'un échantillon de l'ensemble du groupe.

La moyenne d'une partie d'un groupe (appelée échantillon) est la façon habituelle d'estimer la moyenne pour l'ensemble du groupe. Il est souvent trop difficile ou trop coûteux de mesurer l'ensemble du groupe. Mais si l'on mesure un autre échantillon, sa moyenne sera un peu différente de celle du premier échantillon. L'erreur-type de la moyenne est un moyen de savoir dans quelle mesure la moyenne de l'échantillon est proche de la moyenne de l'ensemble du groupe. C'est un moyen de savoir dans quelle mesure vous pouvez être sûr de la moyenne de l'échantillon.

Dans les mesures réelles, la valeur réelle de l'écart-type de la moyenne pour l'ensemble du groupe n'est généralement pas connue. Le terme d'erreur standard est donc souvent utilisé pour désigner une estimation proche du nombre réel pour l'ensemble du groupe. Plus il y a de mesures dans un échantillon, plus l'estimation sera proche du nombre réel pour l'ensemble du groupe.

Pour une valeur échantillonnée avec une erreur normalement distribuée non biaisée, le tableau ci-dessus indique la proportion d'échantillons qui se situerait entre 0, 1, 2 et 3 écarts types au-dessus et en dessous de la valeur réelle.

Comment trouver l'erreur type de la moyenne

Une façon de trouver l'erreur-type de la moyenne est d'avoir beaucoup d'échantillons. Tout d'abord, on trouve la moyenne de chaque échantillon. Ensuite, on trouve la moyenne et l'écart-type de ces moyennes d'échantillon. L'écart-type de toutes les moyennes des échantillons est l'erreur-type de la moyenne. Cela peut représenter beaucoup de travail. Parfois, il est trop difficile ou trop coûteux d'avoir beaucoup d'échantillons.

Une autre façon de trouver l'erreur type de la moyenne est d'utiliser une équation qui ne nécessite qu'un seul échantillon. L'erreur standard de la moyenne est généralement estimée par l'écart type d'un échantillon de l'ensemble du groupe (écart type de l'échantillon) divisé par la racine carrée de la taille de l'échantillon.

S E x ¯ = s n {\displaystyle SE_{\bar {x}}\ ={\frac {s}{\sqrt {n}}}} $SE_{\bar {x}}\ ={\frac {s}{\sqrt {n}}}$

où

est l'écart-type de l'échantillon (c'est-à-dire l'estimation de l'écart-type de la population sur la base de l'échantillon), et

n est le nombre de mesures dans l'échantillon.

Quelle doit être la taille de l'échantillon pour que l'estimation de l'erreur type de la moyenne soit proche de l'erreur type réelle de la moyenne pour l'ensemble du groupe ? Il doit y avoir au moins six mesures dans un échantillon. L'erreur type de la moyenne de l'échantillon sera alors inférieure de 5 % à l'erreur type de la moyenne si l'ensemble du groupe était mesuré.

Corrections pour certains cas

Il existe une autre équation à utiliser si le nombre de mesures concerne 5 % ou plus de l'ensemble du groupe :

Il existe des équations spéciales à utiliser si un échantillon comporte moins de 20 mesures.

Parfois, un échantillon provient d'un seul endroit, même si le groupe entier peut être dispersé. De même, il arrive qu'un échantillon soit réalisé sur une courte période alors que l'ensemble du groupe couvre une période plus longue. Dans ce cas, les chiffres de l'échantillon ne sont pas indépendants. Des équations spéciales sont alors utilisées pour tenter de corriger cette situation.

Utilité

Un résultat pratique : On peut être plus sûr d'une valeur moyenne en ayant plus de mesures dans un échantillon. L'erreur type de la moyenne sera alors plus faible, car l'écart type est divisé par un nombre plus important. Cependant, pour que l'incertitude (erreur standard de la moyenne) d'une valeur moyenne soit deux fois moins grande, la taille de l'échantillon (n) doit être quatre fois plus grande. Cela s'explique par le fait que l'écart type est divisé par la racine carrée de la taille de l'échantillon. Pour que l'incertitude soit dix fois plus grande, la taille de l'échantillon (n) doit être cent fois plus grande !

Les erreurs standard sont faciles à calculer et sont beaucoup utilisées car :

Si l'erreur type de plusieurs quantités individuelles est connue, l'erreur type d'une fonction des quantités peut être facilement calculée dans de nombreux cas ;
Lorsque la distribution de probabilité de la valeur est connue, elle peut être utilisée pour calculer une bonne approximation d'un intervalle de confiance exact
Lorsque la distribution de probabilité n'est pas connue, d'autres équations peuvent être utilisées pour estimer un intervalle de confiance
Lorsque la taille de l'échantillon devient très importante, le principe du théorème de la limite centrale montre que les nombres de l'échantillon sont très semblables aux nombres de l'ensemble du groupe (ils ont une distribution normale).

Erreur type relative

L'erreur type relative (ETS) est l'erreur type divisée par la moyenne. Ce nombre est inférieur à un. En le multipliant par 100 %, on obtient un pourcentage de la moyenne. Cela permet de montrer si l'incertitude est importante ou non. Par exemple, considérons deux enquêtes sur les revenus des ménages qui donnent toutes deux un échantillon moyen de 50 000 $. Si l'une des enquêtes a une erreur type de 10 000 $ et l'autre de 5 000 $, les erreurs types relatives sont respectivement de 20 % et de 10 %. L'enquête dont l'erreur-type relative est la plus faible est meilleure car elle a une mesure plus précise (l'incertitude est plus faible).

En fait, les personnes qui ont besoin de connaître les valeurs moyennes décident souvent du degré d'incertitude avant de décider d'utiliser l'information. Par exemple, le Centre national américain des statistiques de santé ne déclare pas de moyenne si l'erreur-type relative dépasse 30 %. Le NCHS exige également au moins 30 observations pour qu'une estimation soit rapportée. ^[]

Exemple

Par exemple, il y a beaucoup de sébastes dans les eaux du Golfe du Mexique. Pour savoir combien pèse en moyenne un sébaste de 42 cm de long, il n'est pas possible de mesurer tous les sébastes qui mesurent 42 cm de long. Il est plutôt possible d'en mesurer certains. Les poissons qui sont effectivement mesurés s'appellent un échantillon. Le tableau indique les poids de deux échantillons de sébaste, tous de 42 cm de long. Le poids moyen (moyen) du premier échantillon est de 0,741 kg. Le poids moyen du second échantillon est de 0,735 kg, un peu différent de celui du premier échantillon. Chacune de ces moyennes est un peu différente de la moyenne qui résulterait de la mesure de chaque sébaste de 42 cm de long (ce qui n'est pas possible de toute façon).

L'incertitude sur la moyenne peut être utilisée pour savoir dans quelle mesure la moyenne des échantillons est proche de la moyenne qui résulterait de la mesure de l'ensemble du groupe. L'incertitude de la moyenne est estimée comme l'écart type de l'échantillon, divisé par la racine carrée du nombre d'échantillons moins un. Le tableau montre que les incertitudes des moyennes pour les deux échantillons sont très proches l'une de l'autre. De plus, l'incertitude relative est l'incertitude de la moyenne divisée par la moyenne, multipliée par 100 %. L'incertitude relative dans cet exemple est de 2,38% et de 2,50% pour les deux échantillons.

En connaissant l'incertitude de la moyenne, on peut savoir dans quelle mesure la moyenne de l'échantillon est proche de la moyenne qui résulterait de la mesure de l'ensemble du groupe. La moyenne pour l'ensemble du groupe se situe entre a) la moyenne de l'échantillon plus l'incertitude sur la moyenne, et b) la moyenne de l'échantillon moins l'incertitude sur la moyenne. Dans cet exemple, le poids moyen de l'ensemble des sébastes de 42 cm de long dans le golfe du Mexique devrait être de 0,723-0,759 kg sur la base du premier échantillon, et de 0,717-0,753 sur la base du second échantillon.

Exemple d'un sébaste (également appelé tambour rouge, Sciaenops ocellatus) utilisé dans l'exemple.

Questions et réponses

Q : Qu'est-ce que l'erreur standard ?

R : L'erreur standard est l'écart-type de la distribution d'échantillonnage d'une statistique.

Q : Le terme "erreur standard" peut-il être utilisé pour une estimation de l'écart type ?

R : Oui, le terme "erreur standard" peut être utilisé pour une estimation (bonne supposition) de l'écart type à partir d'un échantillon de l'ensemble du groupe.

Q : Comment estime-t-on la moyenne d'un groupe entier ?

R : La moyenne d'une partie d'un groupe (appelée échantillon) est la façon habituelle d'estimer la moyenne du groupe entier.

Q : Pourquoi est-il difficile de mesurer l'ensemble d'un groupe ?

R : Il est souvent trop difficile ou trop coûteux de mesurer l'ensemble du groupe.

Q : Qu'est-ce que l'erreur standard de la moyenne et que détermine-t-elle ?

R : L'erreur standard de la moyenne est un moyen de savoir dans quelle mesure la moyenne de l'échantillon est proche de la moyenne de l'ensemble du groupe. C'est un moyen de savoir dans quelle mesure on peut être sûr de la moyenne de l'échantillon.

Q : La valeur réelle de l'écart-type de la moyenne est-elle généralement connue dans les mesures réelles ?

R : Non, la valeur réelle de l'écart-type de la moyenne pour l'ensemble du groupe n'est généralement pas connue dans les mesures réelles.

Q : Comment le nombre de mesures dans un échantillon affecte-t-il la précision de l'estimation ?

R : Plus l'échantillon comporte de mesures, plus l'estimation sera proche de la valeur réelle pour l'ensemble du groupe.

Rechercher dans l'encyclopédie