Definició (en el context de sistemes i data centers):

La tolerància a fallades és la capacitat d’un sistema informàtic o infraestructura digital per continuar funcionant correctament tot i la fallada d’alguns dels seus components.
Com funciona:
- El sistema està dissenyat per detectar errors i compensar-los de manera automàtica.
- Utilitza mecanismes com la redundància de maquinari o programari, la replicació de dades i protocols de recuperació.
- En molts casos, l’usuari final no percep cap interrupció, ja que el sistema “amaga” la fallada.
Exemple:
En un centre de dades, si un disc dur falla, un altre disc redundant (RAID) pot assumir immediatament la càrrega, evitant la pèrdua de dades i mantenint l’aplicació en funcionament.
Objectiu principal:
Garantir la continuïtat del servei i minimitzar l’impacte de fallades inevitables en entorns crítics.
Vegeu també: Redundància, Alta disponibilitat (HA).
« Back to Glossary Index