Alta disponibilidad
La alta disponibilidad (High Availability) se refiere a la capacidad de que aplicaciones y datos se encuentren operativos para los usuarios autorizados en todo momento y sin interrupciones, debido principalmente a su carácter crítico.
El objetivo de la misma es mantener nuestros sistemas funcionando las 24 horas del día, 7 días a la semana, 365 días al año, manteniéndolos a salvo de interrupciones, teniendo en cuenta que se diferencian dos tipos de interrupciones:
- Las interrupciones previstas, que se realizan cuando paralizamos el sistema para realizar cambios o mejoras en nuestro hardware o software.
- Las interrupciones imprevistas, que suceden por acontecimientos como un apagón, un error del hardware o del software, problemas de seguridad, un desastre natural, virus, accidentes, caídas involuntarias del sistema, etc.
Las métricas comúnmente utilizadas para medir la disponibilidad y fiabilidad de un sistema son el tiempo medio entre fallos o MTTF (Mean Time To Failure) que mide el tiempo medio transcurrido hasta que un dispositivo falla, y el tiempo medio de recuperación o MTTR (Mean Time To Recover) que mide el tiempo medio tomado en restablecerse la situación normal una vez que se ha producido el fallo.
El tiempo en el que un sistema está fuera de servicio, o lo que es lo mismo, el tiempo de no disponibilidad del servicio, se mide a menudo como el cociente MTTR / MTTF. Lógicamente, nuestro principal objetivo es aumentar el MTTF y reducir el MTTR de forma que minimicemos el tiempo de no disponibilidad del servicio.
Existen distintos niveles de disponibilidad del sistema, y según el tiempo aproximado de inactividad por año se determina el porcentaje de disponibilidad. El mayor nivel de exigencia de alta disponibilidad acepta 5 minutos de inactividad al año, con lo que se obtiene una disponibilidad de 5 nueves: 99,999%.
Como ejemplos de sistemas y servicios de alta disponibilidad podemos mencionar los sistemas sanitarios, de control aéreo, de comercio electrónico, bancarios, de transporte marítimo, militares, etc., donde la pérdida o interrupción de conectividad pueden suponer graves consecuencias personales y/o económicas.
Obra publicada con Licencia Creative Commons Reconocimiento 4.0