Un t-test és un test estadístic utilitzat per determinar si hi ha una diferència significativa entre les mitjanes de dos conjunts de dades o entre la mitjana d’una mostra i un valor de referència conegut. Es basa en la distribució t de Student, especialment útil quan la mida de la mostra és petita i la desviació estàndard de la població és desconeguda.
Quan s’utilitza un t-test?
Un t-test s’utilitza en situacions com:
- Comparar la mitjana d’una mostra amb un valor teòric (t-test d’una mostra).
- Comparar la mitjana de dues mostres independents (t-test de mostres independents).
- Comparar mitjanes de mesures aparellades, com abans i després d’un tractament (t-test aparellat).
Tipus de t-tests
- T-test d’una mostra: comprova si la mitjana d’una mostra és diferent d’un valor conegut. Exemple: determinar si la mitjana de puntuació d’una classe difereix de 50.
- T-test de mostres independents: compara les mitjanes de dues mostres independents. Exemple: comparar la puntuació mitjana d’estudiants de dues escoles.
- T-test aparellat: comprova si hi ha diferències entre dues mesures preses en els mateixos subjectes. Exemple: mesurar el rendiment d’un grup abans i després d’un entrenament.
Hipòtesis en un t-test
- Hipòtesi nul·la (H₀): no hi ha diferència significativa entre les mitjanes. Exemple: les dues mostres tenen la mateixa mitjana.
- Hipòtesi alternativa (H₁): hi ha una diferència significativa entre les mitjanes. Exemple: les mitjanes de les dues mostres són diferents.
Càlcul del t-test
El valor de t es calcula com:
t = (x̄₁ – x̄₂) / SE, on x̄ són les mitjanes de les mostres i SE és l’error estàndard combinat:
SE = √(s₁²/n₁ + s₂²/n₂), on s² són les variances de les mostres i n les seves grandàries.
Interpretació
- Valor de t: un valor absolut alt indica més evidència contra la hipòtesi nul·la.
- p-value: si p < 0.05, es rebutja H₀ i s’accepta que hi ha una diferència significativa.
Exemple amb Python
from scipy.stats import ttest_ind
# Dades de dues mostres
group1 = [5.1, 5.5, 6.2, 5.9, 5.8]
group2 = [6.8, 7.0, 7.1, 6.9, 7.2]
# T-test de mostres independents
t_stat, p_value = ttest_ind(group1, group2)
print(f"T-statistic: {t_stat}")
print(f"P-value: {p_value}")
if p_value < 0.05:
print("Hi ha una diferència significativa entre les mostres.")
else:
print("No hi ha una diferència significativa entre les mostres.")Quan no utilitzar un t-test?
- Si les dades no segueixen una distribució normal (millor utilitzar un test no paramètric com Mann-Whitney U).
- Si les variàncies no són iguals entre les mostres (fer servir la versió ajustada del t-test).
Conclusió
El t-test és una eina essencial de l’estadística inferencial per comparar mitjanes i determinar si les diferències entre grups són significatives. Té aplicació en la investigació científica, la psicologia i el machine learning.
« Back to Glossary Index