Un test t vous aide à décider si une moyenne d’échantillon, ou la différence entre deux moyennes d’échantillon, est plus grande que ce qu’on attendrait de la seule variabilité aléatoire. On l’utilise lorsque la variable étudiée est numérique et que l’écart-type de la population est inconnu, ce qui est le cas le plus courant en pratique.

La condition essentielle est que le test corresponde au plan des données. Un test t sert pour des questions portant sur des moyennes, pas sur des effectifs catégoriels, et les très petits échantillons demandent de la prudence s’ils présentent une forte asymétrie ou des valeurs aberrantes évidentes.

Ce que mesure un test t

L’idée de base est toujours la même :

t=observed differenceestimated standard errort = \frac{\text{observed difference}}{\text{estimated standard error}}

La statistique devient plus grande lorsque la différence de moyenne est importante, et plus petite lorsque les données sont bruitées ou que l’échantillon est petit.

Sous l’hypothèse nulle, et si les conditions sont raisonnablement satisfaites, cette statistique suit une loi de Student tt plutôt qu’une loi normale zz. La loi tt a des queues plus épaisses, surtout pour les petits échantillons, donc elle est plus prudente avant de déclarer un résultat significatif.

Quel type de test t faut-il utiliser

Test t à un échantillon

Utilisez-le lorsque vous avez un seul échantillon et que vous voulez comparer sa moyenne à une valeur de référence μ0\mu_0.

t=xˉμ0s/nt = \frac{\bar{x} - \mu_0}{s / \sqrt{n}}

Exemple : comparer le poids moyen de paquets dans un échantillon à une cible de 100100 grammes.

Test t à deux échantillons

Utilisez-le lorsque vous voulez comparer les moyennes de deux groupes indépendants, par exemple deux classes enseignées avec des méthodes différentes.

Si vous n’avez pas de raison solide de supposer l’égalité des variances dans les populations, le test t de Welch est généralement le choix le plus sûr par défaut :

t=xˉ1xˉ2s12n1+s22n2t = \frac{\bar{x}_1 - \bar{x}_2}{\sqrt{\frac{s_1^2}{n_1} + \frac{s_2^2}{n_2}}}

Les degrés de liberté du test de Welch ne sont pas simplement n1+n22n_1 + n_2 - 2, donc un logiciel s’en charge généralement pour vous.

Test t apparié

Utilisez-le pour des données avant-après ou des paires appariées. Le test ne s’effectue pas séparément sur les deux colonnes brutes. Il s’effectue sur les différences au sein de chaque paire.

t=dˉμd,0sd/nt = \frac{\bar{d} - \mu_{d,0}}{s_d / \sqrt{n}}

Dans de nombreux problèmes appariés, la valeur nulle est μd,0=0\mu_{d,0} = 0, ce qui signifie que la variation moyenne est nulle.

Quand un test t est approprié

Un test t convient bien lorsque toutes les conditions suivantes sont raisonnablement vraies :

  1. La variable de résultat est numérique.
  2. Les observations sont indépendantes dans le plan choisi, sauf si vous utilisez volontairement un dispositif apparié.
  3. La question porte sur une moyenne ou une différence de moyennes.
  4. L’échantillon n’est pas si petit et déformé par des valeurs aberrantes ou une forte asymétrie que la moyenne et l’écart-type deviennent trompeurs.

Si l’écart-type de la population était connu exactement, un test zz de manuel serait l’alternative directe. En pratique, les tests t sont courants parce que σ\sigma est généralement inconnu.

Exemple corrigé : un test t à un échantillon

Supposons qu’un procédé d’emballage soit censé avoir une moyenne de 100100 grammes. Vous prenez un échantillon aléatoire de 2525 paquets et vous trouvez

xˉ=102,s=4\bar{x} = 102, \quad s = 4

Vous voulez savoir si la vraie moyenne diffère de 100100 grammes.

Comme il s’agit d’un seul échantillon comparé à une valeur cible, le test correct est un test t à un échantillon.

Commençons par les hypothèses :

H0:μ=100H_0: \mu = 100 H1:μ100H_1: \mu \ne 100

L’erreur standard est

sn=425=45=0.8\frac{s}{\sqrt{n}} = \frac{4}{\sqrt{25}} = \frac{4}{5} = 0.8

Calculons maintenant la statistique de test :

t=1021000.8=2.5t = \frac{102 - 100}{0.8} = 2.5

Les degrés de liberté sont

df=n1=24df = n - 1 = 24

Pour un test bilatéral avec df=24df = 24, une valeur de t=2.5t = 2.5 donne une p-valeur inférieure à 0.050.05. Cela signifie que le résultat est statistiquement significatif au seuil de 5%5\%, donc on rejette H0H_0.

Dans ce contexte, l’échantillon fournit des éléments en faveur de l’idée que la moyenne du procédé est différente de 100100 grammes. Cette conclusion dépend du fait que l’échantillon soit raisonnablement indépendant et pas fortement déformé par des valeurs aberrantes.

Erreurs fréquentes avec les tests t

Une erreur fréquente consiste à choisir la mauvaise version du test. Si les mêmes personnes, machines ou unités sont mesurées deux fois, les données sont appariées, donc un test t à deux échantillons indépendants n’est pas approprié.

Une autre erreur consiste à interpréter « non statistiquement significatif » comme « il n’y a pas de différence ». En général, cela signifie simplement que l’échantillon n’a pas fourni de preuve assez forte contre l’hypothèse nulle.

Une troisième erreur consiste à ne pas vérifier les données. Avec un échantillon minuscule et une valeur aberrante extrême, la formule produit toujours un nombre, mais la conclusion peut ne pas être fiable.

Où les tests t sont utilisés

Les tests t sont courants dans les expériences, le contrôle qualité, la médecine, la psychologie, l’éducation et les comparaisons de type A/B lorsque la variable étudiée est numérique. Ils constituent l’un des points d’entrée classiques vers l’inférence statistique, car ils relient en une seule méthode les moyennes, la variabilité, l’incertitude et la prise de décision.

Essayez un problème similaire

Modifiez l’exemple pour que la moyenne de l’échantillon soit 101101 au lieu de 102102, tout en gardant n=25n = 25 et s=4s = 4. Recalculez la statistique t et décidez si la preuve reste suffisamment forte au seuil de 5%5\%. C’est une bonne étape suivante si vous voulez voir comment la conclusion change lorsque la moyenne de l’échantillon se rapproche de la valeur nulle.

Besoin d'aide pour un problème ?

Envoyez votre question et obtenez une solution vérifiée, étape par étape, en quelques secondes.

Ouvrir GPAI Solver →