




Resumen: Buscamos un/a Ingeniero/a en Robótica especializado/a en Aprendizaje por Refuerzo para desarrollar, implementar y validar políticas de control en sistemas robóticos reales en una empresa líder. Puntos destacados: 1. Trabajar en la intersección entre simulación y hardware con robots reales 2. Desarrollar y validar políticas de control avanzadas basadas en aprendizaje por refuerzo 3. Colaborar entre equipos y contribuir a la innovación en robótica **Descripción de la empresa** PAL Robotics es una empresa líder en robótica de servicio con sede en la soleada Barcelona. Nuestro objetivo es mejorar la calidad de vida de las personas mediante tecnologías de robótica y automatización. Contamos con más de 20 años de experiencia en el campo de la robótica y ofrecemos desafíos diarios a todos los miembros de nuestro equipo para ayudarles a crecer. **Descripción del puesto** Buscamos un/a Ingeniero/a en Robótica especializado/a en Aprendizaje por Refuerzo (RL) para desarrollar, implementar y validar políticas de control en sistemas robóticos reales. Trabajarás en la intersección entre simulación y hardware, construyendo políticas robustas en simulación (MuJoCo / MJLab) y transfiriéndolas a robots reales con alta fiabilidad. Este puesto requiere una sólida experiencia en aprendizaje de políticas, transferencia simulación\-a\-real, identificación de sistemas, así como experiencia práctica validando comportamientos en plataformas físicas. **Principales funciones:** * Desarrollar políticas de control basadas en RL para sistemas robóticos utilizando MuJoCo y MJLab. * Diseñar y entrenar políticas de locomoción y manipulación, incluyendo marcha, equilibrio, agarre e interacción con objetos. * Implementar y comparar enfoques puramente basados en aprendizaje por refuerzo con métodos de aprendizaje por imitación, como clonación de comportamiento y RL fuera de línea. * Implementar y validar políticas entrenadas en hardware de robots reales para garantizar un rendimiento efectivo. * Superar la brecha simulación\-a\-real mediante identificación de sistemas, aleatorización de dominio y modelado de actuadores/dinámicas. * Analizar fallos e iterar sobre modelos, funciones de recompensa y configuraciones de entrenamiento para mejorar el rendimiento. * Integrar políticas en pilas robóticas existentes, como sistemas basados en ROS 2. * Colaborar entre equipos, interactuando con especialistas en control, percepción y hardware. **Requisitos** **Requisitos obligatorios:** * Máster o Doctorado en Robótica, Aprendizaje Automático, Control o campo relacionado. * Experiencia sólida en Aprendizaje por Refuerzo aplicado específicamente al campo de la robótica. * Experiencia práctica con MuJoCo; la competencia en MJLab se considera un gran valor añadido. * Experiencia demostrable implementando políticas aprendidas en sistemas y hardware robóticos reales. * Conocimientos sólidos sobre dinámica robótica, control, optimización de políticas (PPO, SAC, etc.) y aprendizaje por imitación. * Experiencia con técnicas de transferencia simulación\-a\-real, como aleatorización de dominio e identificación de sistemas. * Competencias sólidas en programación tanto en Python como en C\+\+. * Conocimiento de frameworks robóticos, especialmente ROS 2. **Otras habilidades valoradas (no obligatorias):** * Experiencia con robots humanoides o bípedos/cuadrúpedos * Conocimientos sobre modelado de actuadores y dinámica de transmisión * Experiencia diseñando políticas robustas bajo incertidumbre * Familiaridad con pipelines de entrenamiento basados en GPU * Antecedentes en optimización o control basado en modelos (MPC es un plus) **Información adicional** **Condiciones del puesto** Ofrecemos un paquete retributivo competitivo, que incluye salario, beneficios y oportunidades de desarrollo profesional. Formarás parte de un equipo dinámico e internacional en un entorno en constante crecimiento y evolución, con un lugar de trabajo satisfactorio, inclusivo y de igualdad de oportunidades. * Contrato indefinido a tiempo completo. 37\.5 horas/semana \- En PAL creemos en el equilibrio entre la vida laboral y personal y, para que todos nuestros empleados se beneficien, desde 2024 nos hemos comprometido a trabajar 2\.5 horas menos cada semana. * Horario flexible y finalización anticipada los viernes a las 14:00. * 26 días hábiles de vacaciones anuales. * Oportunidades de retribución en especie e iniciativas continuas de formación. * Café y té gratuitos. * Fecha de inicio inmediata. **Datos de contacto** Si estás interesado/a, por favor, envía tu candidatura a través del enlace de esta página web o envía tu CV a recruit@ pal\-robotics.com. Indica, en el asunto del correo electrónico, el código del puesto JOB\-2026\-05 y el nombre del puesto. Toda la información será tratada de conformidad con el Reglamento General de Protección de Datos (RGPD).


