




Resumen: Buscamos un Ingeniero Senior de Datos para liderar el desarrollo y la optimización de la infraestructura de datos destinada a iniciativas de IA Agente, definiendo la estrategia de datos para sistemas de IA de próxima generación. Aspectos destacados: 1. Liderar el desarrollo de la infraestructura de datos para iniciativas de IA Agente 2. Colaborar con ingenieros de aprendizaje automático y científicos de la IA 3. Definir la estrategia de datos para sistemas de IA de próxima generación Madrid, España \| Jornada completa \| Teletrabajo \| R1535985**Oferta de empleo disponible también en otras ubicaciones** Descripción interna del puesto**Descripción del rol** -------------------- Buscamos un Ingeniero Senior de Datos experimentado para incorporarse a nuestro equipo de IA. En este puesto, liderará el desarrollo y la optimización de la infraestructura de datos que respalda nuestras iniciativas de IA Agente. Colaborará con ingenieros de aprendizaje automático, científicos de la IA y gestores de producto para diseñar, implementar y mantener tuberías de datos robustas que impulsen agentes de IA autónomos. Como miembro senior del Programa de Innovación en IA de I+D, contribuirá a definir la estrategia de datos y garantizará que nuestras soluciones de datos escalen para satisfacer los exigentes requisitos de los sistemas de IA de próxima generación.**Responsabilidades clave** ------------------------ ### **Obligatorias** * Diseñar, desarrollar y mantener tuberías de datos escalables y procesos ETL que respalden la investigación y el desarrollo de IA. * Diseñar y mantener modelos de datos escalables (por ejemplo, esquemas en estrella, conjuntos de datos listos para características, capas semánticas) para análisis, entrenamiento de modelos de aprendizaje automático y flujos de trabajo de agentes. * Colaborar con científicos e ingenieros de la IA para recopilar requisitos de datos y garantizar su disponibilidad y calidad. * Implementar medidas de gobernanza y seguridad de los datos para proteger información sensible. * Establecer marcos de observabilidad, seguimiento de la procedencia y monitoreo para detectar anomalías, problemas de actualidad y fallos operativos. * Implementar técnicas de partición, indexación y optimización del almacenamiento de datos para conjuntos de datos de IA a gran escala. * Supervisar y solucionar incidencias en las tuberías de datos para garantizar su continuidad y fiabilidad. * Mantenerse actualizado sobre las últimas tecnologías emergentes en ingeniería de datos y IA. * Impulsar la fiabilidad, escalabilidad y optimización de costes de la plataforma de datos en infraestructuras basadas en la nube. ### **Preferibles** * Diseñar e implementar arquitecturas de datos escalables y resilientes para flujos de trabajo de entrenamiento, ajuste fino e inferencia de agentes de IA. * Construir tuberías de transmisión y basadas en eventos que permitan retroalimentación en tiempo real de los agentes, telemetría y aprendizaje adaptativo. * Desarrollar y mantener tuberías de alto rendimiento mediante marcos modernos de orquestación para apoyar interacciones en tiempo real de los agentes. * Crear sistemas especializados de almacenamiento y recuperación para incrustaciones vectoriales, grafos de conocimiento y componentes de razonamiento simbólico. * Implementar validación automatizada de datos, pruebas de esquemas y controles de calidad para garantizar conjuntos de datos fiables para el entrenamiento de IA. * Implementar marcos integrales de monitoreo y gobernanza que garanticen datos de entrenamiento de alta calidad y el cumplimiento de las normativas de privacidad. * Optimizar continuamente el rendimiento del sistema, centrándose en reducir la latencia para la toma de decisiones por parte de los agentes. **Requisitos** ------------------ **Formación académica*** Licenciatura o máster en Ciencias de la Computación, Ingeniería de Datos o campo relacionado; se prefiere título de posgrado. **Experiencia*** Mínimo 5 años de experiencia profesional en ingeniería de datos, incluyendo al menos 2 años centrados en infraestructura de datos para IA/aprendizaje automático. **Programación y tecnologías** ------------------------------- * Competencia avanzada en Python y Scala; se valora experiencia en Rust, Go, Java o Julia. * Conocimientos expertos en bases de datos SQL y NoSQL. * Experiencia práctica con bases de datos vectoriales (por ejemplo, Pinecone, Weaviate, Milvus). * Competencia con plataformas modernas de orquestación de datos (por ejemplo, Airflow 2\.x). **Nube e infraestructura** --------------------------- * Amplia experiencia con al menos una plataforma en la nube importante (AWS, Azure o GCP). * Expertise en contenerización y orquestación (Docker, Kubernetes). * Experiencia con herramientas de Infraestructura como Código (por ejemplo, Terraform). **Procesamiento de datos** ------------------- * Experiencia con marcos de computación distribuida (Spark, Dask, Ray). * Competencia con tecnologías de transmisión (Kafka, Flink). * Conocimientos sobre arquitecturas modernas de data lakehouse. **Requisitos preferibles** ---------------------------- * Certificaciones en plataformas en la nube, tecnologías de big data, ingeniería o operaciones de ML. * Experiencia colaborando con ingenieros de aprendizaje automático en tuberías CI/CD para procesamiento de datos e implementación de modelos. * Conocimientos prácticos de marcos de ML (PyTorch, TensorFlow). * Experiencia con almacenes de características y plataformas de seguimiento de experimentos. * Comprensión de los requisitos y el procesamiento de datos para el ajuste fino de modelos de lenguaje de gran tamaño (LLM). * Experiencia en el desarrollo de sistemas de datos para agentes de IA autónomos o aplicaciones de IA agente. * Antecedentes en ingeniería de indicaciones (prompt engineering) o sistemas de generación aumentada por recuperación (RAG). * Experiencia con caché semántico y almacenamiento/retrieval eficiente de artefactos generados por IA. * Familiaridad con métricas de evaluación de LLM y marcos de benchmarking. * Expertise en arquitecturas híbridas que combinen bases de datos tradicionales con almacenes vectoriales. * Experiencia con sistemas RAG y sus tuberías de datos asociadas. * Conocimiento de flujos de trabajo de datos RLHF. * Experiencia en la tutoría de ingenieros junior, el establecimiento de buenas prácticas y la contribución a decisiones arquitectónicas. IQVIA es un proveedor global líder de servicios de investigación clínica, conocimientos comerciales e inteligencia sanitaria para los sectores de ciencias de la vida y atención sanitaria. Creamos conexiones inteligentes para acelerar el desarrollo y la comercialización de tratamientos médicos innovadores que ayuden a mejorar los resultados de los pacientes y la salud de la población a nivel mundial. Más información en https://jobs.iqvia.com. IQVIA se compromete con la integridad en su proceso de contratación y mantiene una política de cero tolerancia ante el fraude de candidatos. Toda la información y credenciales presentadas en su solicitud deben ser veraces y completas. Cualquier declaración falsa, tergiversación o omisión material durante el proceso de reclutamiento dará lugar a la descalificación inmediata de su solicitud, o a la terminación del empleo si se descubre posteriormente, de conformidad con la legislación aplicable. Agradecemos su honestidad y profesionalidad. En IQVIA creemos que la diversidad, la inclusión y la pertenencia impulsan nuestra misión de acelerar la innovación para un mundo más sano. Creamos una cultura de pertenencia valorando las perspectivas de todos nuestros talentosos empleados de todo el mundo y brindándoles la oportunidad de impulsar una atención sanitaria más inteligente para todos, en todas partes. Cuando nuestros talentosos empleados aportan su verdadera identidad y sus diversas experiencias al trabajo, nos permiten lograr cosas extraordinarias. Los procesos de pensamiento multifacéticos despiertan la innovación. La colaboración multi-talentosa aprovecha la innovación para ofrecer resultados superiores. Asimismo, como parte de esta cultura, IQVIA se compromete a garantizar una igualdad efectiva entre mujeres y hombres, integrándola como principio estratégico en sus políticas corporativas y de recursos humanos.


