Ubicación Este rol está disponible para trabajo remoto desde México, Chile, Argentina, Colombia, Uruguay y Perú. Resumen Únete a nuestro equipo de Site Reliability Engineering como Observability Engineer , donde implementamos y optimizamos herramientas que permiten un monitoreo automatizado y eficiente, proporcionando la información necesaria para corregir errores y asegurar en todo momento el correcto funcionamiento de nuestros productos en la nube en ambientes productivos. Tendrás el desafío de garantizar la estabilidad, disponibilidad y desempeño de infraestructuras cloud productivas mediante el diseño e implementación de soluciones de monitoreo y visualización de indicadores de desempeño de las plataformas para garantizar la continuidad de la operación de grandes centros de datos, que soportan las aplicaciones e infraestructura críticas e ininterrumpidas que desplegamos. Responsabilidades Diseñar, implementar y optimizar soluciones de monitoreo para infraestructuras cloud Definir, analizar e implementar dashboards para visualizar indicadores de desempeño críticos Asegurar el correcto funcionamiento de clouds productivos basados en tecnologías open source (como Kubernetes y OpenStack) Atender las incidencias críticas de la plataforma, escalando a los Ingenieros Senior o al área de desarrollo de productos Requisitos Técnicos Formación Estudios de Ingeniería Informática, Ingeniería de Sistemas, Computación o título afín Experiencia Experiencia relacionada de al menos 3 años en cargos relacionados con la gestión, optimización y monitoreo de infraestructuras en la nube, especialmente con tecnologías como Kubernetes y/o OpenStack, y el manejo de incidencias y entornos productivos Experiencia en el diseño y soluciones de monitoreo para infraestructuras cloud, así como gestión del desempeño y coordinación de incidencias críticas con el equipo de desarrollo Conocimientos Específicos / Requisitos Técnicos Linux intermedio: comandos básicos, manipulación de archivos, red, etc. Experiencia con Shell scripting (Bash) Automatización (scripting) con Bash y/o Python Git: Nivel básico (conoce el flujo add, commit, push; no interviene en rebase o cherry-pick) Uso y creación de imágenes de contenedores con Docker (intermedio) Uso y configuración de herramientas de monitoreo (Prometheus, Grafana, Elasticsearch, Kibana) Uso y configuración de herramientas de despliegue como GitLab, ArgoCD, etc. Conocimiento en monitorear elementos externos como routers, switches, clusters de Kubernetes, VMs Uso y administración de clusters de Kubernetes Idioma: Inglés intermedio (escritura/lectura) Deseables Experiencia Cloud Público (AWS, GCP, Azure) o Privado (Openstack) Experiencia en metodologías ágiles (Scrum, Kanban, etc.) Capacidad de adaptar open-source existente Certificaciones en Linux, OpenStack y/o Kubernetes Integración de proyectos de código abierto Conocimientos básicos en Networking Soft-skills requeridos Autonomía, disciplina y capacidad autoaprendizaje Pensamiento analítico conceptual Orientación al cliente Saber trabajar en equipo Sobre nosotros En Whitestack somos líderes en Latinoamérica en el desarrollo de soluciones Telco Cloud, Open Networking e infraestructura digital híper‑escalable. Trabajamos con tecnologías de código abierto como OpenStack, Kubernetes, Open Source Mano, Ceph, Prometheus, ONOS y muchas otras y colaboramos activamente con organizaciones globales como ETSI, la Open Infrastructure Foundation, el Telecom Infra Project y el Open Compute Project. Impulsamos la transformación digital en la región mediante estándares de clase mundial, grandes implementaciones para operadores y un fuerte compromiso con la innovación. Además, somos un Great Place to Work , donde la colaboración y el desarrollo personal son parte esencial de nuestra cultura. ¿Por qué unirte a Whitestack? Proyección internacional: Participa en iniciativas globales y viaja para colaborar con equipos en distintos países ⚖️ Equilibrio real: Diseñamos políticas que se ajustan a tu estilo de vida y te permiten trabajar con autonomía y propósito Crecimiento claro: Te ofrecemos una línea de carrera sólida en liderazgo y tecnología Salud primero: Seguro médico privado para ti y tu familia Aprendizaje sin límites: Acceso a cursos, libros, materiales y reembolso de certificaciones Idiomas para el mundo: Cursos de idiomas para que tu crecimiento no tenga fronteras Tecnología en tus manos: Renovamos tu equipo cada 3 años... ¡y es tuyo al finalizar el período Reconocimiento al esfuerzo: Bonos por rendimiento y éxito en proyectos Tiempo para ti: 15 días de vacaciones mínimo, un día libre por tu cumpleaños y descansos extra antes de Fiestas Patrias, Navidad y Año Nuevo
Observability Engineer - Prometheus, Grafana - Co
WHITESTACK
workfromhome, workfromhome
Publicado hace 17 días
Denunciar empleo