Échantillon (statistiques)

Auteur: Leandro Alegsa

09-05-2021 21:12

En statistique, un échantillon fait partie d'une population. L'échantillon est choisi avec soin. Il doit représenter l'ensemble de la population de manière équitable, sans biais. La raison pour laquelle les échantillons sont nécessaires est que les populations peuvent être si importantes que le comptage de tous les individus peut ne pas être possible ou pratique.

Par conséquent, la résolution d'un problème statistique commence généralement par un échantillonnage. L'échantillonnage consiste à choisir les données à prendre pour une analyse ultérieure. Par exemple, supposons que la pollution d'un lac soit analysée pour une étude. Selon l'endroit où les échantillons d'eau ont été prélevés, les études peuvent avoir des résultats différents. En règle générale, les échantillons doivent être prélevés au hasard. Cela signifie que la chance ou la probabilité de sélectionner un individu est la même que la chance de sélectionner un autre individu.

En pratique, les échantillons aléatoires sont toujours prélevés selon une procédure bien définie. Une procédure est un ensemble de règles, une séquence d'étapes écrites sur papier et suivies à la lettre. Malgré cela, il peut subsister un certain biais dans l'échantillon. Considérez le problème de la conception d'un échantillon pour prédire le résultat d'un sondage électoral. Toutes les méthodes connues ont leurs problèmes, et les résultats d'une élection sont souvent différents des prédictions basées sur un échantillon. Si vous recueillez des opinions en utilisant le téléphone ou en rencontrant des gens dans la rue, l'échantillon est toujours biaisé. Par conséquent, dans des cas comme celui-ci, un échantillon totalement neutre n'est jamais possible. Dans de tels cas, un statisticien réfléchira à la manière de mesurer le degré de biais, et il existe des moyens de l'estimer.

Une situation similaire se produit lorsque les scientifiques mesurent une propriété physique, par exemple le poids d'un morceau de métal ou la vitesse de la lumière. Si nous pesons un objet avec un équipement sensible, nous obtiendrons des résultats minutieusement différents. Aucun système de mesure n'est jamais parfait. Nous obtenons une série d'estimations, chacune étant une mesure. Ce sont des échantillons, avec un certain degré d'erreur. Les statistiques sont conçues pour décrire l'erreur, et effectuer des analyses sur ce type de données.

Il existe différents types d'échantillons :

La police des frontières à la recherche de drogues illégales avec un chien spécialement entraîné : S'ils contrôlent une voiture sur dix, ils prélèvent un échantillon non biaisé.

Échantillonnage stratifié

Si une population comporte des sous-populations évidentes, alors chacune d'entre elles doit être échantillonnée. C'est ce qu'on appelle l'échantillonnage stratifié. L'échantillonnage stratifié est également connu sous le nom d'échantillon aléatoire stratifié. L'échantillonnage stratifié est souvent représenté sous forme de proportion, comme le pourcentage (%).

Supposons qu'une expérience ait pour but d'échantillonner les revenus des adultes. Il est évident que les revenus des diplômés de l'enseignement supérieur peuvent différer de ceux des non-diplômés. Supposons maintenant que le nombre de diplômés masculins représente 30% du total des hommes adultes (chiffres imaginaires). Vous feriez alors en sorte que 30 % de l'échantillon total soient des diplômés masculins choisis au hasard et que 70 % du total soient des hommes non diplômés. Répétez le processus pour les femmes, car le pourcentage de femmes diplômées est différent de celui des hommes. Cela donne un échantillon de la population adulte stratifié par sexe et par niveau d'études. L'étape suivante consisterait à diviser chacune de vos sous-populations par groupes d'âge, car (par exemple) les diplômés peuvent gagner plus de revenus que les non-diplômés à l'âge moyen.

Un autre type d'échantillon stratifié traite de la variation. Dans ce cas, des échantillons plus importants sont prélevés dans les sous-populations les plus variables, de sorte que les statistiques sommaires, telles que les moyennes et les écarts types, sont plus fiables.

Questions et réponses

Q : Qu'est-ce qu'un échantillon en statistiques ?

R : En statistiques, un échantillon est une partie d'une population qui a été soigneusement choisie pour représenter l'ensemble de la population de manière équitable et sans biais.

Q : Pourquoi a-t-on besoin d'échantillons ?

R : Les échantillons sont nécessaires car les populations peuvent être si grandes qu'il n'est pas possible ou pratique de compter tous les individus. Par conséquent, la résolution d'un problème en statistique commence généralement par l'échantillonnage.

Q : Comment un échantillon est-il représenté ?

R : Lorsqu'il est traité comme un ensemble de données, un échantillon est souvent représenté par des lettres majuscules telles que X et Y, ses éléments étant représentés en minuscules (par exemple, x3), et la taille de l'échantillon étant représentée par la lettre n.

Q : Que doivent être les échantillons ?

R : En règle générale, les échantillons doivent être aléatoires, ce qui signifie que la chance ou la probabilité de sélectionner un individu est la même que la chance de sélectionner tout autre individu. En pratique, les échantillons aléatoires sont toujours prélevés au moyen d'une procédure bien définie.

Q : Un biais peut-il subsister dans les échantillons ?

R : Même en utilisant des procédures d'échantillonnage bien définies, un certain biais peut subsister dans l'échantillon en raison de facteurs tels que les personnes qui répondent aux appels téléphoniques ou qui marchent dans certaines rues lors de la collecte d'opinions pour la prédiction d'un sondage électoral. Dans des cas comme celui-ci, il peut être difficile d'obtenir des échantillons totalement neutres, mais les statisticiens peuvent mesurer le degré de biais qui reste présent.

Q : Existe-t-il différents types d'échantillons ?

R : Oui, il existe différents types d'échantillons, notamment les échantillons complets qui comprennent tous les éléments ayant des propriétés données et les échantillons non biaisés/représentatifs qui impliquent la sélection d'éléments à partir d'échantillons complets sans dépendre de leurs propriétés. La façon dont l'échantillon est obtenu ainsi que sa taille auront un impact sur la façon dont les données sont considérées.

Rechercher dans l'encyclopédie