





Buscamos un ingeniero experimentado de confiabilidad del sitio (SRE) para garantizar la estabilidad, escalabilidad y excelencia operativa de una plataforma basada en Kubernetes que se ejecuta en un entorno híbrido. El proyecto está entrando en una fase crucial, con una puesta en marcha importante prevista para mediados de febrero y una audiencia objetivo de 75 000 usuarios. Ya se ha iniciado la incorporación de usuarios, con más de 5 000 usuarios conectados y entre 15 000 y 20 000 usuarios previstos como activos para fin de año. Aunque el sistema es estable, anticipamos un aumento de la actividad y nuevos desafíos en enero, febrero y tras la puesta en marcha, lo que convierte este puesto en una oportunidad emocionante para generar un impacto real. El rol se centra en la optimización del rendimiento, estrategias de escalado, observabilidad e ingeniería de confiabilidad. **Habilidades requeridas:** * 4 o más años de experiencia como ingeniero SRE o DevOps * Amplia experiencia práctica con Kubernetes en producción * Experiencia trabajando con infraestructura híbrida (local + nube) * Conocimientos sólidos sobre ajuste del rendimiento y escalado de PostgreSQL * Experiencia con Qdrant u otras bases de datos vectoriales * Experiencia con Helm, escalado automático de Kubernetes y optimización de recursos * Familiaridad con pilas de observabilidad (Prometheus, Grafana, ELK/Loki) * Comprensión de la ingeniería del rendimiento y las pruebas de carga * Experiencia con sistemas Linux y redes * Excelentes habilidades de resolución de problemas y gestión de incidencias **Deseable:** * Experiencia con STACKIT u otras nubes soberanas * Experiencia con PgBouncer * Conocimientos sobre prácticas SRE (SLO/SLI) * Experiencia en entornos regulados o del sector público * Conocimientos del idioma alemán **Responsabilidades:** * Operar y optimizar la infraestructura híbrida (local y STACKIT) * Gestionar y escalar clústeres de Kubernetes * Optimizar gráficos Helm, uso de recursos y escalado automático * Realizar pruebas de rendimiento, carga y estrés * Garantizar la confiabilidad, disponibilidad y supervisión de los sistemas de producción * Ajustar y operar PostgreSQL * Operar y optimizar bases de datos vectoriales (por ejemplo, Qdrant) * Implementar supervisión, registro y alertas * Apoyar la respuesta ante incidencias y la planificación de capacidad **Ofrecemos\*:** * Formato laboral flexible: teletrabajo, presencial o mixto * Un salario competitivo y un buen paquete de compensación * Crecimiento profesional personalizado * Herramientas de desarrollo profesional (programa de tutoría, charlas técnicas y capacitaciones, centros de excelencia, entre otros) * Comunidades tecnológicas activas con intercambio regular de conocimientos * Reembolso de gastos educativos * Regalos conmemorativos por aniversarios * Eventos corporativos y actividades de team building * Otros beneficios específicos según ubicación * No aplicable para freelance


