Networking intermedio: BGP, EVPN-VXLAN, etc. Resumen Whitestack despliega nubes privadas en distintas capitales de Latinoamérica. En cada uno de estos sitios opera decenas o incluso cientos de servidores, interconectados mediante redes de alta velocidad y diseñados para soportar aplicaciones de misión crítica incluyendo el tráfico de voz de operadores móviles, lo que exige niveles de disponibilidad cercanos al 99,999%. Por esta razón estamos buscando a los mejores ingenieros para su área de Cloud Support, puestos de gran relevancia para garantizar la continuidad de la operación de grandes centros de datos, los que soportan las aplicaciones e infraestructura de telecomunicaciones críticas e ininterrumpidas que desplegamos. El Cloud NOC Engineer es el guardián de esta infraestructura. Su misión es el monitoreo proactivo 24/7 de la salud de los centros de datos, detectando anomalías antes de que afecten el servicio. Es el primer frente de respuesta, encargado de la gestión integral de incidentes: desde la detección y apertura de tickets hasta la resolución de fallas de complejidad baja/media y el escalamiento técnico estructurado hacia los niveles L1/L2. Este rol está disponible para trabajo remoto desde las siguientes ubicaciones: México, Chile, Argentina, Colombia, Uruguay y Perú. Shifts disponibles: México, Colombia, Perú desde la 1PM. / Argentina, Chile, Uruguay desde las 8AM. Responsabilidades Monitoreo Proactivo: Vigilancia constante de dashboards y alertas (infraestructura física, virtual y servicios) para garantizar la disponibilidad del 99,999%. Gestión de Incidentes (Triage): Recepción, categorización y priorización de alertas. Apertura y seguimiento riguroso de tickets bajo metodologías ITIL. Resolución Técnica Inicial: Diagnóstico y resolución de fallas de complejidad baja y media (ej. reinicio de servicios, limpieza de logs, ajustes de cuotas, verificación de conectividad básica). Escalamiento Estructurado: Cuando la complejidad supera el nivel inicial, escalar a L1/L2 entregando un reporte técnico completo (logs, trazas de red, pasos de reproducción y contexto del cliente). Documentación de Casos: Mantener actualizada la bitácora de eventos y la base de conocimientos (KB) sobre incidentes recurrentes. Comunicación Externa: Notificar a los clientes sobre estados de salud, ventanas de mantenimiento e incidentes en curso de forma clara y oportuna. Health Checks: Ejecución de rutinas periódicas de validación de salud en plataformas productivas. Velar por el cumplimiento de SLA de incidencias y disponibilidad de red y servicios. Generación y análisis de reportes de disponibilidad de las plataformas. Requerimientos Experiencia: Al menos 1-2 años en centros de monitoreo (NOC), soporte técnico de primer nivel o administración de sistemas. Experiencia en manejo de tickets y procesos de soporte (Jira, ServiceNow u otros), incluyendo documentación clara de diagnóstico, evidencias y comunicación. Experiencia en manejo de herramientas de Monitoreo/Observabilidad como Prometheus, Grafana, Elasticsearch, Opensearch, OpenNMS. Lectura e interpretación de métricas, eventos, logs, alarmas. Experiencia en sistemas productivos de misión crítica, incluyendo gestión de incidentes, coordinación de acciones en producción, escalamiento y comunicación efectiva. Formación: Ingeniería Informática, Ingeniería de Sistemas, Ingeniería Electrónica, o afín. Conocimientos Específicos / Requisitos Técnicos: Linux en entornos productivos: troubleshooting de servicios y sistema operativo (systemd, journalctl), permisos/usuarios, procesos, filesystem y redes. Networking en Linux: configuración y diagnóstico de interfaces, VLANs, rutas, bonding y MTU; troubleshooting con herramientas como tcpdump (sniffing), ip, ss, ethtool, ping/traceroute. Kubernetes: operación/administración y troubleshooting en producción (Pods, Deployments/DaemonSets, Services, eventos/logs, readiness/liveness; nociones de storage PV/PVC). Virtualización: experiencia operando y dando soporte a entornos virtualizados (KVM/VMware/Hyper‑V u otros), incluyendo diagnóstico de fallas comunes de cómputo, red y almacenamiento. Automatización: capacidad para resolver tareas repetibles mediante Bash y Ansible y/o Python (recolección de información, checks operativos, remediación básica, scripts seguros para producción). Inglés intermedio para leer/escribir documentación técnica, realizar actualizaciones a stakeholders e interactuar con proveedores/fabricantes ante casos de soporte. Requisitos Profesionales Autonomía (para lograr los mejores resultados) Adherencia a estándares de clase mundial Orientación al objetivo. Apertura de aprender nuevas tecnologías Pensamiento analítico Trabajo en equipo (para coordinar con equipos de desarrollo y despliegue de productos) Rápida adaptación a un entorno altamente dinámico. Requisitos Deseables Técnicos Experiencia en OpenStack (operación, troubleshooting o administración) y/o KVM Conocimientos del modelo de operación de una red Fija o Móvil. Experiencia integrando y operando proyectos de código abierto en ambientes productivos. Networking intermedio: BGP, EVPN-VXLAN, etc. Certificaciones: Linux, OpenStack, Kubernetes Administrator (CKA u otras). Cursos en Ansible y/o Bash scripting. Conocimientos en ITIL (Gestión de Incidentes, Requerimientos, Problemas, Cambios) y/o Scrum. Sobre nosotros Whitestack es una empresa líder en Latinoamérica especializada en soluciones en la nube e infraestructura digital híper‑escalable. Trabajamos con tecnología de código abierto y los más altos estándares de la industria para impulsar la transformación digital en toda la región. Somos un Great Place to Work, donde la innovación, la colaboración y el desarrollo personal son parte de nuestra esencia. ¿Por qué unirte a Whitestack? Proyección internacional: Participa en iniciativas globales y viaja para colaborar con equipos en distintos países. ⚖️ Equilibrio real: Diseñamos políticas que se ajustan a tu estilo de vida y te permiten trabajar con autonomía y propósito. Crecimiento claro: Te ofrecemos una línea de carrera sólida en liderazgo y tecnología. Salud primero: Seguro médico privado para ti y tu familia. Aprendizaje sin límites: Acceso a cursos, libros, materiales y reembolso de certificaciones. Idiomas para el mundo: Cursos de idiomas para que tu crecimiento no tenga fronteras. Tecnología en tus manos: Renovamos tu equipo cada 3 años… ¡y es tuyo al finalizar el período! Reconocimiento al esfuerzo: Bonos por rendimiento y éxito en proyectos. Tiempo para ti: 15 días de vacaciones mínimo, un día libre por tu cumpleaños y descansos extra antes de Fiestas Patrias, Navidad y Año Nuevo.
Cloud Noc Engineer - Co
WHITESTACK
workfromhome, workfromhome
Publicado hace 21 días
Denunciar empleo