Estamos procurando um profissional para atuar na sustentação e evolução de sistemas em produção, sendo responsável por garantir a estabilidade, disponibilidade e rápida recuperação das aplicações, apoiando o time na resolução de incidentes complexos e na melhoria contínua do ambiente.
RESPONSABILIDADES E ATRIBUIÇÕES
- Atuar no atendimento e gestão de fila de incidentes e requisições (modeloKanban / ITSM) e investigar, analisar e solucionar incidentes em ambientes produtivos.
- Realizar troubleshooting de integrações entre sistemas (APIs, filas, serviços distribuídos), identificando falhas, inconsistências e interrupções de processo.
- Analisar logs, métricas e traces para diagnóstico de problemas e identificação de causa raiz.
- Apoiar decisões técnicas relacionadas à estabilidade e performance das aplicações.
- Garantir a disponibilidade e confiabilidade dos sistemas, atuando com foco em SLA/SLO.
- Participar de situações crí...