Test t — types, formule et quand l’utiliser

Un test t vous aide à décider si une moyenne d’échantillon, ou la différence entre deux moyennes d’échantillon, est plus grande que ce qu’on attendrait de la seule variabilité aléatoire. On l’utilise lorsque la variable étudiée est numérique et que l’écart-type de la population est inconnu, ce qui est le cas le plus courant en pratique.

La condition essentielle est que le test corresponde au plan des données. Un test t sert pour des questions portant sur des moyennes, pas sur des effectifs catégoriels, et les très petits échantillons demandent de la prudence s’ils présentent une forte asymétrie ou des valeurs aberrantes évidentes.

Ce que mesure un test t

L’idée de base est toujours la même :

t = \frac{\text{observed difference}}{\text{estimated standard error}}

La statistique devient plus grande lorsque la différence de moyenne est importante, et plus petite lorsque les données sont bruitées ou que l’échantillon est petit.

Sous l’hypothèse nulle, et si les conditions sont raisonnablement satisfaites, cette statistique suit une loi de Student $t$ plutôt qu’une loi normale $z$ . La loi $t$ a des queues plus épaisses, surtout pour les petits échantillons, donc elle est plus prudente avant de déclarer un résultat significatif.

Quel type de test t faut-il utiliser

Test t à un échantillon

Utilisez-le lorsque vous avez un seul échantillon et que vous voulez comparer sa moyenne à une valeur de référence $\mu_0$ .

t = \frac{\bar{x} - \mu_0}{s / \sqrt{n}}

Exemple : comparer le poids moyen de paquets dans un échantillon à une cible de $100$ grammes.

Test t à deux échantillons

Utilisez-le lorsque vous voulez comparer les moyennes de deux groupes indépendants, par exemple deux classes enseignées avec des méthodes différentes.

Si vous n’avez pas de raison solide de supposer l’égalité des variances dans les populations, le test t de Welch est généralement le choix le plus sûr par défaut :

t = \frac{\bar{x}_1 - \bar{x}_2}{\sqrt{\frac{s_1^2}{n_1} + \frac{s_2^2}{n_2}}}

Les degrés de liberté du test de Welch ne sont pas simplement $n_1 + n_2 - 2$ , donc un logiciel s’en charge généralement pour vous.

Test t apparié

Utilisez-le pour des données avant-après ou des paires appariées. Le test ne s’effectue pas séparément sur les deux colonnes brutes. Il s’effectue sur les différences au sein de chaque paire.

t = \frac{\bar{d} - \mu_{d,0}}{s_d / \sqrt{n}}

Dans de nombreux problèmes appariés, la valeur nulle est $\mu_{d,0} = 0$ , ce qui signifie que la variation moyenne est nulle.

Quand un test t est approprié

Un test t convient bien lorsque toutes les conditions suivantes sont raisonnablement vraies :

La variable de résultat est numérique.
Les observations sont indépendantes dans le plan choisi, sauf si vous utilisez volontairement un dispositif apparié.
La question porte sur une moyenne ou une différence de moyennes.
L’échantillon n’est pas si petit et déformé par des valeurs aberrantes ou une forte asymétrie que la moyenne et l’écart-type deviennent trompeurs.

Si l’écart-type de la population était connu exactement, un test $z$ de manuel serait l’alternative directe. En pratique, les tests t sont courants parce que $\sigma$ est généralement inconnu.

Exemple corrigé : un test t à un échantillon

Supposons qu’un procédé d’emballage soit censé avoir une moyenne de $100$ grammes. Vous prenez un échantillon aléatoire de $25$ paquets et vous trouvez

\bar{x} = 102, \quad s = 4

Vous voulez savoir si la vraie moyenne diffère de $100$ grammes.

Comme il s’agit d’un seul échantillon comparé à une valeur cible, le test correct est un test t à un échantillon.

Commençons par les hypothèses :

H_0: \mu = 100

H_1: \mu \ne 100

L’erreur standard est

\frac{s}{\sqrt{n}} = \frac{4}{\sqrt{25}} = \frac{4}{5} = 0.8

Calculons maintenant la statistique de test :

t = \frac{102 - 100}{0.8} = 2.5

Les degrés de liberté sont

df = n - 1 = 24

Pour un test bilatéral avec $df = 24$ , une valeur de $t = 2.5$ donne une p-valeur inférieure à $0.05$ . Cela signifie que le résultat est statistiquement significatif au seuil de $5\%$ , donc on rejette $H_0$ .

Dans ce contexte, l’échantillon fournit des éléments en faveur de l’idée que la moyenne du procédé est différente de $100$ grammes. Cette conclusion dépend du fait que l’échantillon soit raisonnablement indépendant et pas fortement déformé par des valeurs aberrantes.

Erreurs fréquentes avec les tests t

Une erreur fréquente consiste à choisir la mauvaise version du test. Si les mêmes personnes, machines ou unités sont mesurées deux fois, les données sont appariées, donc un test t à deux échantillons indépendants n’est pas approprié.

Une autre erreur consiste à interpréter « non statistiquement significatif » comme « il n’y a pas de différence ». En général, cela signifie simplement que l’échantillon n’a pas fourni de preuve assez forte contre l’hypothèse nulle.

Une troisième erreur consiste à ne pas vérifier les données. Avec un échantillon minuscule et une valeur aberrante extrême, la formule produit toujours un nombre, mais la conclusion peut ne pas être fiable.

Où les tests t sont utilisés

Les tests t sont courants dans les expériences, le contrôle qualité, la médecine, la psychologie, l’éducation et les comparaisons de type A/B lorsque la variable étudiée est numérique. Ils constituent l’un des points d’entrée classiques vers l’inférence statistique, car ils relient en une seule méthode les moyennes, la variabilité, l’incertitude et la prise de décision.

Essayez un problème similaire

Modifiez l’exemple pour que la moyenne de l’échantillon soit $101$ au lieu de $102$ , tout en gardant $n = 25$ et $s = 4$ . Recalculez la statistique t et décidez si la preuve reste suffisamment forte au seuil de $5\%$ . C’est une bonne étape suivante si vous voulez voir comment la conclusion change lorsque la moyenne de l’échantillon se rapproche de la valeur nulle.

Besoin d'aide pour un problème ?

Envoyez votre question et obtenez une solution vérifiée, étape par étape, en quelques secondes.

Ouvrir GPAI Solver →