Job Description
Nos encontramos en la búsqueda de un SRE / Platform Engineer (Observability) para incorporar de manera directa a empresa líder del rubro farmacéutico, para diseñar, implementar y evolucionar la estrategia de monitoreo, logging y tracing de nuestra plataforma, garantizando la confiabilidad, performance y visibilidad de sistemas distribuidos.
Responsabilidades
- Configuración y Mantenimiento: Instalar, configurar y mantener plataformas de monitoreo (Prometheus, Grafana, ELK, OCI Monitoring, APM, etc.) y agentes (SNMP, Beats).
- Diseño de Observabilidad: Crear dashboards interactivos y alertas inteligentes para visualizar el estado del sistema, gestionar SLIs / SLOs / error budgets.
- Análisis de Datos: Diseñar e implementar soluciones de observabilidad (métricas, logs y trazas), liderar análisis de incidentes (RCA).
- Automatización de Alertas: Configurar sistemas de alerta inteligente que reduzcan el ruido y prioricen incidentes críticos, de...