Loi de Student
La distribution t de Student est une distribution de probabilité qui a été développée par William Sealy Gosset en 1908. Student est le pseudonyme qu'il a utilisé lorsqu'il a publié l'article qui décrit la distribution. Gosset travaillait dans une brasserie et s'intéressait aux problèmes des petits échantillons, par exemple les propriétés chimiques de l'orge. Dans les problèmes qu'il a analysés, la taille de l'échantillon pouvait être aussi petite que trois. Une version de l'origine du pseudonyme est que l'employeur de Gosset préférait que le personnel utilise des noms de plume lors de la publication d'articles scientifiques au lieu de leur vrai nom, il a donc utilisé le nom "Student" pour cacher son identité. Une autre version est que la brasserie ne voulait pas que ses concurrents sachent qu'ils utilisaient le test T pour tester la qualité de la matière première.
En raison de la petite taille de l'échantillon, il n'est pas possible d'estimer l'écart type. De plus, dans de nombreux cas rencontrés par Gosset, la distribution de probabilité des échantillons n'était pas connue.
Une distribution normale décrit une population complète, les distributions t décrivent des échantillons tirés d'une population complète ; en conséquence, la distribution t pour chaque taille d'échantillon est différente, et plus l'échantillon est grand, plus la distribution ressemble à une distribution normale.
La distribution t joue un rôle dans de nombreuses analyses statistiques largement utilisées, notamment le test t de Student pour évaluer la signification statistique de la différence entre deux moyennes d'échantillon, la construction d'intervalles de confiance pour la différence entre deux moyennes de population et dans l'analyse de régression linéaire. La distribution t de Student est également utilisée dans l'analyse bayésienne des données d'une famille normale.
Si nous prenons un échantillon de n observations à partir d'une distribution normale, alors la distribution t avec ν = n-1 degrés de liberté peut être définie comme la distribution de l'emplacement de la vraie moyenne, par rapport à la moyenne de l'échantillon et divisée par l'écart-type de l'échantillon, après multiplication par le terme normalisant n {\displaystyle {\sqrt {n}}} . De cette façon, la distribution t peut être utilisée pour estimer la probabilité que la vraie moyenne se situe dans une fourchette donnée.
La distribution t est symétrique et en forme de cloche, comme la distribution normale, mais elle a des queues plus lourdes, ce qui signifie qu'elle est plus encline à produire des valeurs qui sont loin de sa moyenne. Cela la rend utile pour comprendre le comportement statistique de certains types de ratios de quantités aléatoires, dans lesquels la variation du dénominateur est amplifiée et peut produire des valeurs aberrantes lorsque le dénominateur du ratio tombe près de zéro. La distribution t de Student est un cas particulier de la distribution hyperbolique généralisée.
Questions et réponses
Q : Qu'est-ce que la distribution t de Student ?
R : La distribution t de Student est une distribution de probabilité qui a été développée par William Sealy Gosset en 1908. Elle décrit des échantillons tirés d'une population complète, et plus la taille de l'échantillon est grande, plus elle ressemble à une distribution normale.
Q : Qui a développé la distribution t de Student ?
R : William Sealy Gosset a développé la distribution t de Student en 1908. Il a utilisé le pseudonyme "Student" lorsqu'il a publié l'article la décrivant.
Q : Quelles sont certaines des utilisations de la distribution t de Student ?
R : La distribution t de Student joue un rôle dans de nombreuses analyses statistiques largement utilisées, notamment le test t de Student pour évaluer la signification statistique des différences entre deux moyennes d'échantillon, la construction d'intervalles de confiance pour les différences entre deux moyennes de population et l'analyse de régression linéaire. Elle se pose également dans l'analyse bayésienne des données d'une famille normale.
Q : Comment la taille de l'échantillon affecte-t-elle la forme d'une distribution t ?
R : Plus la taille de l'échantillon est importante, plus elle ressemblera à une distribution normale. Pour chaque taille d'échantillon différente, il existe une distribution t unique associée qui la décrit.
Q : Y a-t-il une relation entre la distribution T de Student et la distribution normale ?
R : Oui - alors que les distributions normales décrivent des populations complètes, les distributions T de Student décrivent des échantillons tirés de ces populations ; en tant que telles, elles partagent des similitudes mais diffèrent en fonction de leurs tailles respectives. Comme mentionné ci-dessus, les grands échantillons ont tendance à ressembler davantage aux distributions normales que les petits.
Q : Existe-t-il un autre nom pour ce type de distribution ?
R : Non - ce type de distribution est connu sous le nom de "distribution T de Student", du nom de son concepteur William Sealy Gosset qui a utilisé son pseudonyme "Student" lors de la publication de son article à ce sujet.