Un test t vous aide à décider si une moyenne d’échantillon, ou la différence entre deux moyennes d’échantillon, est plus grande que ce qu’on attendrait de la seule variabilité aléatoire. On l’utilise lorsque la variable étudiée est numérique et que l’écart-type de la population est inconnu, ce qui est le cas le plus courant en pratique.
La condition essentielle est que le test corresponde au plan des données. Un test t sert pour des questions portant sur des moyennes, pas sur des effectifs catégoriels, et les très petits échantillons demandent de la prudence s’ils présentent une forte asymétrie ou des valeurs aberrantes évidentes.
Ce que mesure un test t
L’idée de base est toujours la même :
La statistique devient plus grande lorsque la différence de moyenne est importante, et plus petite lorsque les données sont bruitées ou que l’échantillon est petit.
Sous l’hypothèse nulle, et si les conditions sont raisonnablement satisfaites, cette statistique suit une loi de Student plutôt qu’une loi normale . La loi a des queues plus épaisses, surtout pour les petits échantillons, donc elle est plus prudente avant de déclarer un résultat significatif.
Quel type de test t faut-il utiliser
Test t à un échantillon
Utilisez-le lorsque vous avez un seul échantillon et que vous voulez comparer sa moyenne à une valeur de référence .
Exemple : comparer le poids moyen de paquets dans un échantillon à une cible de grammes.
Test t à deux échantillons
Utilisez-le lorsque vous voulez comparer les moyennes de deux groupes indépendants, par exemple deux classes enseignées avec des méthodes différentes.
Si vous n’avez pas de raison solide de supposer l’égalité des variances dans les populations, le test t de Welch est généralement le choix le plus sûr par défaut :
Les degrés de liberté du test de Welch ne sont pas simplement , donc un logiciel s’en charge généralement pour vous.
Test t apparié
Utilisez-le pour des données avant-après ou des paires appariées. Le test ne s’effectue pas séparément sur les deux colonnes brutes. Il s’effectue sur les différences au sein de chaque paire.
Dans de nombreux problèmes appariés, la valeur nulle est , ce qui signifie que la variation moyenne est nulle.
Quand un test t est approprié
Un test t convient bien lorsque toutes les conditions suivantes sont raisonnablement vraies :
- La variable de résultat est numérique.
- Les observations sont indépendantes dans le plan choisi, sauf si vous utilisez volontairement un dispositif apparié.
- La question porte sur une moyenne ou une différence de moyennes.
- L’échantillon n’est pas si petit et déformé par des valeurs aberrantes ou une forte asymétrie que la moyenne et l’écart-type deviennent trompeurs.
Si l’écart-type de la population était connu exactement, un test de manuel serait l’alternative directe. En pratique, les tests t sont courants parce que est généralement inconnu.
Exemple corrigé : un test t à un échantillon
Supposons qu’un procédé d’emballage soit censé avoir une moyenne de grammes. Vous prenez un échantillon aléatoire de paquets et vous trouvez
Vous voulez savoir si la vraie moyenne diffère de grammes.
Comme il s’agit d’un seul échantillon comparé à une valeur cible, le test correct est un test t à un échantillon.
Commençons par les hypothèses :
L’erreur standard est
Calculons maintenant la statistique de test :
Les degrés de liberté sont
Pour un test bilatéral avec , une valeur de donne une p-valeur inférieure à . Cela signifie que le résultat est statistiquement significatif au seuil de , donc on rejette .
Dans ce contexte, l’échantillon fournit des éléments en faveur de l’idée que la moyenne du procédé est différente de grammes. Cette conclusion dépend du fait que l’échantillon soit raisonnablement indépendant et pas fortement déformé par des valeurs aberrantes.
Erreurs fréquentes avec les tests t
Une erreur fréquente consiste à choisir la mauvaise version du test. Si les mêmes personnes, machines ou unités sont mesurées deux fois, les données sont appariées, donc un test t à deux échantillons indépendants n’est pas approprié.
Une autre erreur consiste à interpréter « non statistiquement significatif » comme « il n’y a pas de différence ». En général, cela signifie simplement que l’échantillon n’a pas fourni de preuve assez forte contre l’hypothèse nulle.
Une troisième erreur consiste à ne pas vérifier les données. Avec un échantillon minuscule et une valeur aberrante extrême, la formule produit toujours un nombre, mais la conclusion peut ne pas être fiable.
Où les tests t sont utilisés
Les tests t sont courants dans les expériences, le contrôle qualité, la médecine, la psychologie, l’éducation et les comparaisons de type A/B lorsque la variable étudiée est numérique. Ils constituent l’un des points d’entrée classiques vers l’inférence statistique, car ils relient en une seule méthode les moyennes, la variabilité, l’incertitude et la prise de décision.
Essayez un problème similaire
Modifiez l’exemple pour que la moyenne de l’échantillon soit au lieu de , tout en gardant et . Recalculez la statistique t et décidez si la preuve reste suffisamment forte au seuil de . C’est une bonne étape suivante si vous voulez voir comment la conclusion change lorsque la moyenne de l’échantillon se rapproche de la valeur nulle.
Besoin d'aide pour un problème ?
Envoyez votre question et obtenez une solution vérifiée, étape par étape, en quelques secondes.
Ouvrir GPAI Solver →