Ingeniero de Investigación en IA (Optimización de Kernel e Inferencia)

Indeed

Tiempo completo

Presencial

Sin requisito de experiencia

Sin requisito de título

Carrer d'Aribau, 66, Eixample, 08011 Barcelona, Spain

Favoritos

Parte del contenido se ha traducido automáticamenteVer original

Descripción

Resumen: Únase al equipo de modelos de IA de Tether para innovar en las arquitecturas de servicio e inferencia de modelos para sistemas avanzados de IA, optimizando su implementación y rendimiento en aplicaciones del mundo real. Aspectos destacados: 1. Pionero de una revolución financiera global con soluciones de vanguardia. 2. Impulsar la innovación en las arquitecturas de servicio e inferencia de modelos de IA. 3. Colaborar con mentes brillantes en una potencia global de talento remoto. ***Únase a Tether y moldeé el futuro de las finanzas digitales*** En Tether, no solo construimos productos, sino que también lideramos una revolución financiera global. Nuestras soluciones de vanguardia permiten a las empresas —desde exchanges y billeteras hasta procesadores de pagos y cajeros automáticos— integrar sin problemas tokens respaldados por reservas en múltiples blockchains. Al aprovechar el poder de la tecnología blockchain, Tether le permite almacenar, enviar y recibir tokens digitales de forma instantánea, segura y global, todo ello a una fracción del costo. La transparencia es la piedra angular de todo lo que hacemos, garantizando la confianza en cada transacción. ***Innovar con Tether*** **Finanzas Tether:** Nuestra innovadora suite de productos incluye la stablecoin más confiable del mundo, **USDT**, utilizada por cientos de millones de personas en todo el mundo, junto con servicios pioneros de tokenización de activos digitales. Pero eso es solo el comienzo: **Tether Power:** Impulsando un crecimiento sostenible, nuestras soluciones energéticas optimizan el exceso de energía para la minería de Bitcoin mediante prácticas ecológicas en instalaciones de última generación y geográficamente diversas. **Tether Data:** Impulsando avances en IA y tecnología peer-to-peer, reducimos los costos de infraestructura y mejoramos las comunicaciones globales con soluciones de vanguardia como **KEET**, nuestra aplicación insignia que redefine el intercambio seguro y privado de datos. **Tether Education:** Democratizando el acceso al aprendizaje digital de primer nivel, empoderamos a las personas para que prosperen en las economías digital y colaborativa, impulsando el crecimiento y las oportunidades globales. **Tether Evolution:** En la intersección entre tecnología y potencial humano, estamos expandiendo los límites de lo posible, creando un futuro en el que la innovación y las capacidades humanas se fusionan de formas poderosas e inéditas. ***¿Por qué unirse a nosotros?*** Nuestro equipo es una potencia global de talento que trabaja de forma remota desde todos los rincones del mundo. Si está apasionado por dejar huella en el sector fintech, esta es su oportunidad de colaborar con algunas de las mentes más brillantes, desafiando límites y estableciendo nuevos estándares. Hemos crecido rápidamente, manteniéndonos ágiles y consolidando nuestro lugar como líderes en la industria. Si posee excelentes habilidades de comunicación en inglés y está listo para contribuir a la plataforma más innovadora del planeta, Tether es el lugar indicado para usted. **¿Está listo para formar parte del futuro?** **Acerca del puesto** Como miembro de nuestro equipo de modelos de IA, usted impulsará la innovación en las arquitecturas de servicio e inferencia de modelos para sistemas avanzados de IA. Su trabajo se centrará en optimizar las estrategias de implementación e inferencia de modelos para ofrecer un rendimiento altamente receptivo, eficiente y escalable en aplicaciones del mundo real. Trabajará en un amplio espectro de sistemas, que van desde modelos eficientes en recursos diseñados para entornos con hardware limitado hasta arquitecturas complejas multimodales que integran datos como texto, imágenes y audio. Esperamos que tenga una experiencia profunda en el diseño y la optimización de tuberías de servicio de modelos y marcos de inferencia, así como una sólida formación en arquitecturas avanzadas de modelos. Adoptará un enfoque práctico y basado en la investigación para desarrollar, probar e implementar nuevas estrategias de servicio y algoritmos de inferencia. Sus responsabilidades incluyen la ingeniería de tuberías de inferencia robustas, el establecimiento de métricas exhaustivas de rendimiento y la identificación y resolución de cuellos de botella en entornos productivos. El objetivo final es habilitar un rendimiento de IA de alto rendimiento, baja latencia, bajo consumo de memoria y escalable, que aporte un valor tangible en escenarios dinámicos del mundo real. **Responsabilidades** * Diseñar e implementar arquitecturas de servicio de modelos de vanguardia que ofrezcan un alto rendimiento y baja latencia mientras optimizan el uso de memoria. Asegurar que estas tuberías funcionen eficientemente en entornos diversos, incluidos dispositivos con recursos limitados y plataformas perimetrales (edge). Establecer objetivos claros de rendimiento, tales como reducción de latencia, mejora de la respuesta por token y minimización de la huella de memoria. * Construir, ejecutar y supervisar pruebas controladas de inferencia tanto en entornos simulados como en producción real. Seguir indicadores clave de rendimiento, como la latencia de respuesta, el rendimiento, el consumo de memoria y las tasas de error, prestando especial atención a métricas específicas para dispositivos con recursos limitados. Documentar resultados iterativos y comparar los resultados con referencias establecidas para validar el rendimiento en distintas plataformas. * Identificar y preparar conjuntos de datos de prueba y escenarios de simulación de alta calidad adaptados a los desafíos reales de implementación, especialmente aquellos encontrados en dispositivos con pocos recursos. Establecer criterios medibles para asegurar que estos recursos evalúen eficazmente el rendimiento del modelo, la latencia y la utilización de memoria bajo diversas condiciones operativas. * Analizar la eficiencia computacional y diagnosticar cuellos de botella en la tubería de servicio mediante el monitoreo tanto de métricas de procesamiento como de memoria. Abordar problemas como un procesamiento por lotes subóptimo, retrasos de red y un alto consumo de memoria para optimizar la infraestructura de servicio en términos de escalabilidad y fiabilidad en sistemas con recursos limitados. * Colaborar estrechamente con equipos multifuncionales para integrar marcos de servicio e inferencia optimizados en tuberías productivas diseñadas para aplicaciones perimetrales (edge) y en dispositivo. Definir métricas claras de éxito, como un mejor rendimiento en el mundo real, bajas tasas de error, escalabilidad robusta, uso óptimo de memoria y garantizar un monitoreo continuo y refinamientos iterativos para lograr mejoras sostenidas. * Titulación universitaria en Ciencias de la Computación o campo relacionado. Idealmente, doctorado en PLN, Aprendizaje Automático o campo afín, complementado por un historial sólido en I+D en IA (con publicaciones relevantes en conferencias A*). * Debe tener conocimientos del lenguaje de sombreado Metal (MSL). Debe sentirse cómodo escribiendo shaders de cómputo personalizados desde cero. * Es indispensable contar con experiencia demostrada en optimizaciones de kernel de bajo nivel y optimización de inferencia en dispositivos móviles. Sus contribuciones deben haber generado mejoras medibles en la latencia, el rendimiento y la huella de memoria de la inferencia para aplicaciones específicas del dominio, particularmente en dispositivos con recursos limitados y plataformas perimetrales (edge). * Se requiere una comprensión profunda de las arquitecturas modernas de servicio de modelos y técnicas de optimización de inferencia. Esto incluye métodos de vanguardia para lograr un rendimiento de baja latencia y alto rendimiento, así como una gestión eficiente de la memoria en diversos escenarios de implementación con recursos limitados. * Debe poseer una sólida experiencia en la escritura de kernels para GPU en dispositivos móviles (por ejemplo, smartphones), así como una profunda comprensión de los marcos y motores de servicio de modelos. Se requiere experiencia práctica en el desarrollo e implementación de tuberías de inferencia de extremo a extremo, desde la optimización de modelos para un servicio eficiente hasta la integración de estas soluciones en dispositivos con recursos limitados. * Capacidad demostrada para aplicar investigación empírica para superar desafíos en el servicio de modelos, como la optimización de la latencia, los cuellos de botella computacionales y las restricciones de memoria. Debe ser competente en el diseño de marcos de evaluación robustos y en la iteración de estrategias de optimización para seguir expandiendo los límites del rendimiento de la inferencia y la eficiencia del sistema. * Sistemas de inferencia distribuida: Diseño y optimización de motores de inferencia de alto rendimiento mediante técnicas como paralelismo de tensores, paralelismo de tuberías y paralelismo de expertos, para gestionar modelos masivos en clústeres de GPU. * Comprensión profunda de las matemáticas y la estructura subyacentes a los modelos de difusión y a los transformadores visuales (Vision Transformers) * Conocimiento de poda (pruning), cuantización, atención Flash (Flash attention), caché KV (KV Cache), decodificación especulativa (Eagle), etc. **Información importante para los candidatos** Los fraudes de reclutamiento se han vuelto cada vez más comunes. Para protegerse, tenga en cuenta lo siguiente al postularse a puestos: * **Postúlese únicamente a través de nuestros canales oficiales.** No utilizamos plataformas ni agencias externas para reclutamiento, salvo que se indique expresamente. Todos los puestos disponibles están publicados en nuestra página oficial de carreras: https://tether.recruitee.com/ * **Verifique la identidad del reclutador.** Todos nuestros reclutadores cuentan con perfiles verificados en LinkedIn. Si tiene dudas, puede confirmar su identidad revisando su perfil o contactándonos a través de nuestro sitio web. * **Sea cauteloso con métodos de comunicación inusuales.** No realizamos entrevistas por WhatsApp, Telegram ni SMS. Toda la comunicación se lleva a cabo mediante correos electrónicos y plataformas oficiales de la empresa. * **Revise cuidadosamente las direcciones de correo electrónico.** Toda la comunicación proveniente de nosotros tendrá como dominio final **@**tether.to **o @**tether.io * **Nunca solicitaremos pagos ni detalles financieros personales.** Si alguien le solicita información financiera personal o un pago en cualquier etapa del proceso de contratación, se trata de una estafa. Por favor, repórtela de inmediato. **Si tiene dudas, no dude en ponerse en contacto con nosotros a través de nuestro sitio web oficial.**

Fuentea: indeed Ver publicación original

David Muñoz

Indeed · HR

Compañía

Indeed

David Muñoz

Indeed · HR

Empleos similares

Ingeniero de Investigación en IA (Optimización de Kernel e Inferencia)

Descripción

Compañía

Empleos similares

Técnico/a de Calidad Almacén

Educador/a Social para sustituciones

Ingeniero/a - Inspección de Sistemas de Procesos

Assistant Manager La Roca

TÉCNICO/A DE MANTENIMIENTO (TECNICIO/A DE MANTENIMIENTO DE PELLETS)

Psicopedagoga