T-Test

« Back to Glossary Index

Un t-test és un test estadístic utilitzat per determinar si hi ha una diferència significativa entre les mitjanes de dos conjunts de dades o entre la mitjana d’una mostra i un valor de referència conegut. Es basa en la distribució t de Student, especialment útil quan la mida de la mostra és petita i la desviació estàndard de la població és desconeguda.

Quan s’utilitza un t-test?

Un t-test s’utilitza en situacions com:

  1. Comparar la mitjana d’una mostra amb un valor teòric (t-test d’una mostra).
  2. Comparar la mitjana de dues mostres independents (t-test de mostres independents).
  3. Comparar mitjanes de mesures aparellades, com abans i després d’un tractament (t-test aparellat).

Tipus de t-tests

  • T-test d’una mostra: comprova si la mitjana d’una mostra és diferent d’un valor conegut. Exemple: determinar si la mitjana de puntuació d’una classe difereix de 50.
  • T-test de mostres independents: compara les mitjanes de dues mostres independents. Exemple: comparar la puntuació mitjana d’estudiants de dues escoles.
  • T-test aparellat: comprova si hi ha diferències entre dues mesures preses en els mateixos subjectes. Exemple: mesurar el rendiment d’un grup abans i després d’un entrenament.

Hipòtesis en un t-test

  1. Hipòtesi nul·la (H₀): no hi ha diferència significativa entre les mitjanes. Exemple: les dues mostres tenen la mateixa mitjana.
  2. Hipòtesi alternativa (H₁): hi ha una diferència significativa entre les mitjanes. Exemple: les mitjanes de les dues mostres són diferents.

Càlcul del t-test

El valor de t es calcula com:

t = (x̄₁ – x̄₂) / SE, on són les mitjanes de les mostres i SE és l’error estàndard combinat:

SE = √(s₁²/n₁ + s₂²/n₂), on s² són les variances de les mostres i n les seves grandàries.

Interpretació

  • Valor de t: un valor absolut alt indica més evidència contra la hipòtesi nul·la.
  • p-value: si p < 0.05, es rebutja H₀ i s’accepta que hi ha una diferència significativa.

Exemple amb Python

from scipy.stats import ttest_ind

# Dades de dues mostres
group1 = [5.1, 5.5, 6.2, 5.9, 5.8]
group2 = [6.8, 7.0, 7.1, 6.9, 7.2]

# T-test de mostres independents
t_stat, p_value = ttest_ind(group1, group2)
print(f"T-statistic: {t_stat}")
print(f"P-value: {p_value}")

if p_value < 0.05:
    print("Hi ha una diferència significativa entre les mostres.")
else:
    print("No hi ha una diferència significativa entre les mostres.")

Quan no utilitzar un t-test?

  • Si les dades no segueixen una distribució normal (millor utilitzar un test no paramètric com Mann-Whitney U).
  • Si les variàncies no són iguals entre les mostres (fer servir la versió ajustada del t-test).

Conclusió

El t-test és una eina essencial de l’estadística inferencial per comparar mitjanes i determinar si les diferències entre grups són significatives. Té aplicació en la investigació científica, la psicologia i el machine learning.

« Back to Glossary Index