SRE (Site Reliability Engineering) y confiabilidad
Prácticas para asegurar disponibilidad, resiliencia y desempeño con foco en automatización.
Incluye definición de SLO/SLI, manejo de incidentes, error budgets, automatización de respuestas, ingeniería de resiliencia (por ejemplo, pruebas de fallas controladas), y reducción de MTTD/MTTR. Se implementa estrechamente con equipos de desarrollo y operación.