En statistique, un échantillon fait partie d'une population. L'échantillon est choisi avec soin. Il doit représenter l'ensemble de la population de manière équitable, sans biais. La raison pour laquelle les échantillons sont nécessaires est que les populations peuvent être si importantes que le comptage de tous les individus peut ne pas être possible ou pratique.

Par conséquent, la résolution d'un problème statistique commence généralement par un échantillonnage. L'échantillonnage consiste à choisir les données à prendre pour une analyse ultérieure. Par exemple, supposons que la pollution d'un lac soit analysée pour une étude. Selon l'endroit où les échantillons d'eau ont été prélevés, les études peuvent avoir des résultats différents. En règle générale, les échantillons doivent être prélevés au hasard. Cela signifie que la chance ou la probabilité de sélectionner un individu est la même que la chance de sélectionner un autre individu.

En pratique, les échantillons aléatoires sont toujours prélevés selon une procédure bien définie. Une procédure est un ensemble de règles, une séquence d'étapes écrites sur papier et suivies à la lettre. Malgré cela, il peut subsister un certain biais dans l'échantillon. Considérez le problème de la conception d'un échantillon pour prédire le résultat d'un sondage électoral. Toutes les méthodes connues ont leurs problèmes, et les résultats d'une élection sont souvent différents des prédictions basées sur un échantillon. Si vous recueillez des opinions en utilisant le téléphone ou en rencontrant des gens dans la rue, l'échantillon est toujours biaisé. Par conséquent, dans des cas comme celui-ci, un échantillon totalement neutre n'est jamais possible. Dans de tels cas, un statisticien réfléchira à la manière de mesurer le degré de biais, et il existe des moyens de l'estimer.

Une situation similaire se produit lorsque les scientifiques mesurent une propriété physique, par exemple le poids d'un morceau de métal ou la vitesse de la lumière. Si nous pesons un objet avec un équipement sensible, nous obtiendrons des résultats minutieusement différents. Aucun système de mesure n'est jamais parfait. Nous obtenons une série d'estimations, chacune étant une mesure. Ce sont des échantillons, avec un certain degré d'erreur. Les statistiques sont conçues pour décrire l'erreur, et effectuer des analyses sur ce type de données.

Il existe différents types d'échantillons :