Senior Site Reliability Engineer (SRE) Contratación directa con Gopass. Contrato a término indefinido. Modalidad híbrida – Bogotá, Colombia (Zona Norte). Salario a convenir según experiencia. En Gopass buscamos un Senior Site Reliability Engineer (SRE) apasionado por la confiabilidad, automatización y estabilidad de plataformas críticas de alto tráfico. Serás parte fundamental del equipo de Plataforma, garantizando la disponibilidad y performance de servicios estratégicos como Pagos, Core e Integraciones, aplicando prácticas modernas de observabilidad, incident response y reliability engineering. Misión Garantizar la confiabilidad, disponibilidad y estabilidad de nuestra plataforma tecnológica mediante prácticas SRE, automatización operativa y mejora continua de observabilidad, incident management y performance. Responsabilidades Definir SLIs, SLOs y error budgets junto con squads de producto. Diseñar runbooks, playbooks y automatizaciones operativas. Liderar incidentes críticos P1/P2 y facilitar postmortems blameless. Implementar prácticas de chaos engineering y game days. Realizar capacity planning y performance tuning. Mejorar MTTR mediante automatización y observabilidad avanzada. Revisar arquitecturas y servicios desde el enfoque de reliability. Trabajar de la mano con equipos de plataforma, backend y cloud. Requisitos indispensables 5+ años de experiencia en roles SRE, Reliability o Platform Operations. Experiencia sólida con observabilidad: Prometheus, Grafana, Loki/ELK y Jaeger. Experiencia liderando incidentes en producción. Dominio de Linux, networking y troubleshooting distribuido. Experiencia con Kubernetes en producción. Programación en Go o Python enfocada en automatización. Conocimiento práctico de SLI/SLO, error budgets y toil reduction. Inglés técnico avanzado. Plus deseables Experiencia con chaos engineering. Certificaciones cloud o DevOps. Experiencia en fintech o pagos. Conocimiento de PostgreSQL. Stack tecnológico Prometheus, Grafana, Loki/ELK, Jaeger, PagerDuty, AWS CloudWatch, Kubernetes (EKS), PostgreSQL, Go y Python. Si te apasiona construir plataformas resilientes, automatizadas y de alta disponibilidad, queremos conocerte. #J-18808-Ljbffr
Ingeniero Site Reliability Engineer (Sre)
BLUENOTE SOLUTIONS - WEBSITES, MARKETING & SEO
bogotá, bogotá
Publicado hace 13 días
Denunciar empleo