




**¿Te apasionan los datos, la IA y construir plataformas que convierten información compleja en impacto real?** En Xylem Vue, formarás parte de un equipo colaborativo donde tu trabajo habilita directamente la predicción, la optimización y la toma de decisiones basada en IA en el sector del agua. Si buscas un puesto en el que puedas dar forma a la base de la IA a escala—y crecer con ello… ¡Esta oportunidad es para ti! **¿Cuál será tu misión?** Jugar un papel clave en la definición de la dirección técnica y la estrategia del Data Lake de Xylem Vue, construyendo datasets analíticos de alta calidad y pipelines escalables que impulsen analítica avanzada y soluciones basadas en IA en toda la plataforma. ✅ **Tus responsabilidades incluirán:** * Definir la estrategia técnica y la arquitectura del Data Lake para dar soporte a modelos de IA/ML y flujos de trabajo analíticos * Construir y mantener modelos analíticos y datasets de *features* para predicción, detección de anomalías, optimización y soporte a la decisión * Diseñar pipelines de datos end\-to\-end (ingesta, transformación, control de calidad, trazabilidad/lineage) para múltiples fuentes del sector del agua (telemetría time\-series, modelos hidráulicos, datos geoespaciales, activos e historiales de eventos) * Garantizar la calidad, consistencia, gobierno y disponibilidad de los datos en todo el Data Lake * Colaborar con AI Engineers, data scientists, equipos de producto y arquitectos para entender requisitos de modelos y traducirlos a tareas accionables de data engineering * Liderar la adopción de buenas prácticas en arquitectura de datos, gestión de metadatos, modelado de datos y MLOps/feature engineering * Desarrollar capacidades a nivel plataforma (feature stores, interfaces modelo\-dato, herramientas de automatización) para acelerar el desarrollo de IA en los equipos de producto * Monitorizar el rendimiento y la fiabilidad de los pipelines, resolviendo proactivamente cuellos de botella o incidencias de datos * Documentar arquitecturas, transformaciones y estructuras de datos para asegurar transparencia y mantenibilidad a largo plazo **¿Qué te hará destacar?** * Grado o Máster en Informática, Data Engineering o un campo técnico relacionado * Sólida experiencia práctica en ingeniería de datos: construcción de pipelines ETL/ELT, trabajo con grandes volúmenes de datos e implementación de flujos distribuidos * Experiencia diseñando y manteniendo Data Lakes en la nube y tecnologías Big Data * Buen entendimiento de las necesidades de datos para IA/ML, *feature engineering* y diseño de datasets “model\-ready” * Dominio de Python y SQL, y herramientas como PySpark/Spark, Databricks, Airflow (o similares) * Experiencia con APIs, microservicios y patrones de integración de datos * Familiaridad con herramientas de MLOps, feature stores y marcos de gobierno del dato * Habilidad para colaborar con equipos multidisciplinares y comunicar conceptos complejos con claridad * (Valorable) Conocimiento de tipos de datos y contexto operativo del sector del agua


