Categorías
···
Entrar / Registro
Ingeniero Senior de Plataforma de Datos / Ingeniero de Datos
Indeed
Tiempo completo
Presencial
Sin requisito de experiencia
Sin requisito de título
C. Sol, 1, 28950 Moraleja de Enmedio, Madrid, España
Favoritos
Compartir
Parte del contenido se ha traducido automáticamenteVer original
Descripción

Resumen: Únase a nuestro equipo de Plataforma de ML como Ingeniero Senior de Plataforma de Datos / Ingeniero de Datos para construir y escalar la infraestructura de datos para productos de IA, centrándose en el Data Lakehouse y la gestión de conjuntos de datos. Aspectos destacados: 1. Dar forma a la próxima generación de nuestra plataforma de datos y productos de IA 2. Colaborar estrechamente con investigadores e ingenieros de aprendizaje automático 3. Mejorar la calidad, la reproducibilidad y la trazabilidad de los datos **Grupo Straumann** En el Grupo Straumann estamos emprendiendo un apasionante viaje de crecimiento, innovación e impacto, impulsado por nuestra misión de mejorar la salud bucodental y transformar millones de vidas en todo el mundo. Unidos por un propósito común, aportamos lo mejor de nosotros mismos al trabajo cada día, adoptando una cultura de alto rendimiento basada en el rol activo del individuo y en el aprendizaje continuo, que inspira la colaboración, la curiosidad y la ambición. Aquí tendrá la oportunidad de asumir la responsabilidad de su propia carrera, aprovechando sus habilidades, pasión y entusiasmo por el aprendizaje para seguir creciendo y progresando constantemente. Juntos, no solo estamos dando forma a sonrisas más radiantes, sino también desbloqueando el potencial de las personas en todas partes, incluidas las nuestras. **Acerca del puesto** Buscamos un Ingeniero Senior de Plataforma de Datos / Ingeniero de Datos para unirse a nuestro equipo de Plataforma de ML y ayudar a construir y escalar la infraestructura de datos que impulsa nuestros productos de IA en odontología. Nuestra plataforma respalda el ciclo completo de desarrollo de IA, desde la ingesta de datos brutos y los flujos de trabajo de anotación hasta la versión de conjuntos de datos y las canalizaciones de entrenamiento de modelos. Trabajarás en estrecha colaboración con investigadores de aprendizaje automático (MLR), ingenieros de MLOps y equipos de producto para garantizar que nuestra infraestructura de datos sea fiable, escalable y fácil de usar. Un aspecto clave del puesto consiste en mejorar nuestros flujos de trabajo de Data Lakehouse (DLH) y gestión de conjuntos de datos, incluida la versión de conjuntos de datos (DVC) y la mejora de cómo se preparan, extraen y consumen los datos en los sistemas de investigación y producción. **En qué trabajará:** Desempeñará un papel fundamental en la configuración de la próxima generación de nuestra plataforma de datos. **Responsabilidades típicas incluyen:** Propiedad de la plataforma de datos * Diseñar y evolucionar la arquitectura del Data Lakehouse (DLH) utilizada en nuestros equipos de ML. * Mejorar la fiabilidad y la estructura de las canalizaciones de ingesta, extracción y transformación de datos. * Asegurar que los conjuntos de datos utilizados para el entrenamiento y la evaluación sean coherentes, reproducibles y estén bien documentados. Gestión del ciclo de vida de los conjuntos de datos * Mejorar los flujos de trabajo de versión y reproducibilidad de conjuntos de datos mediante herramientas como DVC. * Diseñar soluciones para gestionar múltiples versiones de conjuntos de datos y anotaciones en experimentos y modelos. * Mejorar la capacidad de los investigadores para recuperar de forma fiable las versiones correctas de los conjuntos de datos. Canalizaciones e infraestructura de datos * Construir y mantener canalizaciones de datos escalables en Python. * Mejorar la gestión de metadatos, la validación de conjuntos de datos y la supervisión de la calidad de los datos. * Optimizar los flujos de trabajo de datos en infraestructura basada en AWS. Colaboración con equipos de ML * Trabajar estrechamente con investigadores e ingenieros de ML para comprender sus necesidades de datos. * Apoyar los flujos de trabajo de investigación con patrones de acceso a los datos fiables y eficientes. * Ayudar a traducir los requisitos de investigación en capacidades robustas de la plataforma. Gobernanza y calidad de los datos * Implementar prácticas de calidad, reproducibilidad y trazabilidad de los datos a lo largo del ciclo de vida del ML. * Asegurar que nuestra infraestructura de datos cumpla con los requisitos del desarrollo regulado de IA. **Qué buscamos:** **Imprescindible:** * Fuertes habilidades de ingeniería en Python * Experiencia en la construcción de canalizaciones o plataformas de datos * Experiencia trabajando con AWS * Experiencia trabajando con grandes conjuntos de datos utilizados en flujos de trabajo de ML * Buenas prácticas de ingeniería de software (pruebas, CI/CD, documentación) * Experiencia colaborando con equipos de ML o trabajando en entornos de IA **Deseable:** * Experiencia con herramientas de versión de conjuntos de datos como DVC * Experiencia con Kubernetes * Experiencia con arquitecturas de data lakehouse * Experiencia con canalizaciones de anotación o conjuntos de datos para entrenamiento de ML * Experiencia con PostgreSQL, Metabase o herramientas similares de datos * Experiencia trabajando en entornos regulados (IA médica / sanitaria) **Nuestra tecnología*** AWS * Python * Kubernetes * PostgreSQL * Metabase * DVC para la versión de conjuntos de datos * Infraestructura interna de Data Lakehouse Todos los candidatos calificados serán considerados para el empleo sin tener en cuenta su raza, color, religión, sexo, orientación sexual, identidad de género, origen nacional o discapacidad. **Tipo de empleo:** Tiempo completo **Ubicaciones alternativas:** España: Madrid **Porcentaje de viajes:** 0 \- 10% **ID de solicitud:** 20071

Fuentea:  indeed Ver publicación original
David Muñoz
Indeed · HR

Compañía

Indeed
David Muñoz
Indeed · HR
Empleos similares

Cookie
Configuración de cookies
Nuestras aplicaciones
Download
Descargar en
APP Store
Download
Consíguelo en
Google Play
© 2025 Servanan International Pte. Ltd.