




Resumen: Únase al equipo de Plataforma de Lingo como Ingeniero de confiabilidad del sitio para garantizar que la plataforma de biosensores funcione de forma fiable y eficiente a gran escala, impulsando mejoras en infraestructura, observabilidad y gestión de incidencias. Aspectos destacados: 1. Asegurar que la plataforma de biosensores de Lingo funcione de forma fiable y eficiente a gran escala 2. Impulsar mejoras en infraestructura, observabilidad y automatización 3. Habilitar un desarrollo de alta velocidad y mantener la disponibilidad en múltiples regiones **I****ngeniero****de****confiabilidad****del****sitio** **SOBRE LINGO** Lingo está desarrollando una plataforma digital de salud de vanguardia que combina datos continuos de biosensores, ingeniería de backend de alto rendimiento y análisis avanzado para ayudar a las personas a vivir vidas más sanas, más largas y más plenas. Nuestros sistemas procesan volúmenes masivos de datos en tiempo real, y mantener la fiabilidad, escalabilidad y seguridad de nuestra plataforma es fundamental para entregar valor a nuestros usuarios. **LA OPORTUNIDAD** Buscamos un Ingeniero de confiabilidad del sitio (SRE) para unirse a nuestro equipo de Plataforma y garantizar que la plataforma de biosensores de Lingo funcione de forma fiable y eficiente a gran escala. Será un socio clave de los equipos de Backend, Datos y Móvil, impulsando mejoras en infraestructura, observabilidad, gestión de incidencias y automatización. Su objetivo es habilitar un desarrollo de alta velocidad con confianza, mantener la disponibilidad en múltiples regiones e integrar prácticas de confiabilidad en toda la ingeniería. Trabajará en entornos de producción con Kubernetes, ajustará mallas de servicios, evolucionará manuales operativos y prevenirá proactivamente incidencias mediante código, automatización y diseño. **LO QUE HARÁ** * Establecer y mejorar los SLO, SLI y SLA en todos los servicios; colaborar con los equipos de ingeniería para integrar los objetivos de confiabilidad en los diseños de producto. * Construir y evolucionar los sistemas de monitorización, alertas y trazado para garantizar la detección y resolución rápidas de problemas. * Desarrollar procesos de respuesta ante incidencias, turnos de guardia y prácticas de análisis posterior a incidencias que impulsen la mejora continua. * Implementar automatización en las canalizaciones de despliegue, conmutación por error, escalado y planificación de capacidad para reducir las operaciones manuales y el riesgo de errores. * Impulsar una infraestructura orientada a la seguridad y el cumplimiento normativo, incluida la gestión de secretos, redes seguras y preparación para auditorías. * Colaborar en estrategias de recuperación ante desastres y pruebas de resistencia (ingeniería del caos, pruebas de carga, actualizaciones progresivas, despliegues azul/verde). * Trabajar con los desarrolladores para identificar cuellos de botella de rendimiento, optimizar servicios y reducir los costos de infraestructura. * Contribuir a las herramientas internas y a la experiencia del desarrollador para acelerar la entrega segura de funciones en producción. **CUALIFICACIONES REQUERIDAS** * 5 o más años de experiencia en Ingeniería de confiabilidad del sitio, DevOps o infraestructura en la nube para sistemas distribuidos a gran escala. * Conocimientos profundos de Kubernetes, orquestación de contenedores y mallas de servicios en entornos productivos. * Competencias sólidas en herramientas de observabilidad (Prometheus, Grafana, OpenTelemetry, etc.) y sistemas de gestión de incidencias. * Experiencia diseñando arquitecturas HA/DR, gestionando despliegues en múltiples regiones y optimizando flujos de tráfico de baja latencia. * Competencia con plataformas en la nube (AWS/GCP/Azure) e infraestructura como código (Terraform, Helm). * Mentalidad centrada en la seguridad y el cumplimiento normativo, cómodo en entornos regulados (HIPAA/GDPR) y con requisitos de auditoría. * Excelentes habilidades de comunicación y colaboración entre funciones. **CUALIFICACIONES DESEABLES** * Experiencia con sistemas de transmisión/mensajería (Kafka, RabbitMQ) en producción. * Antecedentes en salud digital, IoT u otras plataformas de datos críticas para la misión. * Conocimiento de herramientas de ingeniería del caos y estrategias de optimización de costos para servicios en la nube globales. * Experiencia de desarrollo en un lenguaje moderno de backend (Java, Kotlin, Go, Python) para herramientas y automatización. **CULTURA DE LINGO** Centrada en el cliente, obsesionada con la confiabilidad y orientada al equipo. En Lingo, los ingenieros de confiabilidad del sitio son guardianes de la disponibilidad, el rendimiento y la velocidad del desarrollador. Nos ayudará a avanzar rápidamente sin comprometer la confianza ni la calidad.


