Job Description
Habilidades
AWS RDS (Relational Database Service), Bash, DevOps, kubernetes, Python, Docker
O que nós buscamos
Principais responsabilidades Observabilidade e Monitoramento
- Implementar, evoluir e otimizar ambientes Datadog (APM, Infra, Logs, RUM, Synthetics, Dashboards, Monitors e integrações)
- Criar estratégias avançadas de monitoramento para aplicações, infraestrutura, cloud e jornadas críticas de negócio
- Desenvolver dashboards executivos, técnicos e operacionais
- Estruturar alertas inteligentes, thresholds, anomalias e correlação de eventos
- Apoiar troubleshooting avançado e análise de causa raiz
- SRE e Confiabilidade: Atuar na evolução da maturidade SRE
- Criar e acompanhar SLI, SLO e indicadores de confiabilidade
- Desenvolver práticas de automação operacional e redução de toil
- Participar de estratégias de resposta a incidentes, post-mortem e prevenção