Ingeniero Senior de MLOps – Infraestructura y Ingeniería de Rendimiento para Modelos de Lenguaje Grande (LLM)

Indeed

Tiempo completo

Presencial

Sin requisito de experiencia

Sin requisito de título

Okendo Kalea, 1, 20004 Donostia / San Sebastián, Gipuzkoa, España

Favoritos

Parte del contenido se ha traducido automáticamenteVer original

Descripción

Resumen: Este puesto de Ingeniero Senior de MLOps se centra en construir infraestructura de calidad de producción para modelos avanzados de IA, optimizando el entrenamiento y la inferencia a gran escala de modelos de lenguaje grande (LLM). Aspectos destacados: 1. Propiedad de sistemas críticos y decisiones arquitectónicas 2. Entorno altamente técnico con ingenieros de primer nivel 3. Impacto directo en sistemas de IA reales en producción Ingeniero Senior de MLOps – Infraestructura y Ingeniería de Rendimiento para Modelos de Lenguaje Grande (LLM) San Sebastián (España) | Híbrido Sobre la oportunidad Colaboramos con una empresa de deep tech de rápido crecimiento que opera en la intersección entre sistemas de IA a gran escala, computación de alto rendimiento y optimización de modelos de nueva generación. El equipo se enfoca en construir infraestructura de calidad de producción para modelos avanzados de IA, resolviendo desafíos del mundo real donde el rendimiento, la escalabilidad y la eficiencia son fundamentales. Se trata de un entorno altamente técnico, ideal para ingenieros que deseen operar cerca de los límites actuales de los sistemas modernos de GPU y cargas de trabajo de ML a gran escala. Misión del puesto Asumirá la propiedad de la capa de infraestructura que impulsa el entrenamiento y la inferencia a gran escala de modelos de lenguaje grande (LLM), asegurando que los modelos no solo sean punteros desde el punto de vista tecnológico, sino también eficientes, escalables y listos para producción. Este puesto se sitúa en la intersección entre la ingeniería de sistemas y el aprendizaje automático, con un fuerte énfasis en la optimización del rendimiento y los sistemas distribuidos. Qué hará Diseñar y escalar tuberías distribuidas de entrenamiento para modelos de lenguaje grande. Optimizar la utilización de GPU, el uso de memoria y la eficiencia del entrenamiento. Construir y mejorar sistemas de inferencia de alto rendimiento para la prestación de servicios de modelos de lenguaje grande (LLM). Implementar técnicas avanzadas para reducir la latencia y maximizar el rendimiento. Orquestar cargas de trabajo en entornos cloud y locales (on-premise). Definir buenas prácticas para el ciclo de vida de los modelos (entrenamiento, despliegue, supervisión). Realizar análisis profundos de rendimiento en toda la pila técnica (desde niveles bajos de GPU hasta la capa de aplicación). Impulsar estándares de ingeniería, asesorar a los miembros del equipo y contribuir a las decisiones técnicas. Qué buscamos 5+ años de experiencia en MLOps, DevOps o ingeniería backend/sistemas. Experiencia demostrable trabajando con infraestructura para modelos de lenguaje grande (LLM) o sistemas de ML a gran escala. Amplia experiencia en: Ecosistema PyTorch Computación GPU (CUDA, entrenamiento distribuido) Experiencia con herramientas modernas para modelos de lenguaje grande (LLM), tanto para entrenamiento como para inferencia. Conocimientos sólidos en sistemas distribuidos y optimización de rendimiento. Capacidad comprobada de programación en Python (C++/Rust es un plus). Experiencia desplegando sistemas en entornos cloud o híbridos. Dominio fluido del inglés. Valoraremos especialmente si dispone de: Experiencia en: Sistemas de inferencia de alto rendimiento Optimización de modelos (cuantización, destilación, compresión) Entornos de computación de alto rendimiento (HPC) o clústeres a gran escala Familiaridad con herramientas de orquestación (Ray, SLURM, etc.) Experiencia con Kubernetes y cargas de trabajo contenerizadas Contribuciones a infraestructura de ML de código abierto Experiencia con sistemas de observabilidad y supervisión Competencias clave Pensamiento sistémico y mentalidad orientada al rendimiento Capacidad sobresaliente para resolver problemas en entornos complejos Sentido de propiedad y autonomía Capacidad para trabajar en equipos de alto rendimiento Curiosidad por la infraestructura de IA de vanguardia Por qué este puesto destaca Trabajar en infraestructura para modelos de lenguaje grande (LLM) a escala, no en problemas académicos o de prueba Impacto directo en sistemas de IA reales utilizados en producción Entorno altamente técnico con ingenieros de primer nivel Propiedad de sistemas críticos y decisiones arquitectónicas Entorno dinámico y de rápido crecimiento en el ámbito de la deep tech Reubicación y estilo de vida La empresa le brindará apoyo integral en todos los procesos administrativos, legales y logísticos para garantizar una reubicación sin contratiempos a San Sebastián. Se proporcionará apoyo inicial para el alojamiento, incluida una vivienda temporal y asistencia en la búsqueda de su residencia definitiva. Una oportunidad única para establecerse en una de las ciudades más deseables para vivir en España —con una calidad de vida excepcional, playas, gastronomía de renombre mundial, surf y una vibrante escena cultural.

Fuentea: indeed Ver publicación original

David Muñoz

Indeed · HR

Compañía

Indeed

David Muñoz

Indeed · HR

Empleos similares

Ingeniero Senior de MLOps – Infraestructura y Ingeniería de Rendimiento para Modelos de Lenguaje Grande (LLM)

Descripción

Compañía

Empleos similares

Técnico/a mantenimiento electromecánico

Plegador/a-punzonador/a / operario/a del metal

Encofrador

Camarera/o fin de semana

Moldeador/a

Plegador/a