Ingeniero de Investigación en IA (Optimización del Kernel e Inferencia)

Indeed

Tiempo completo

Presencial

Sin requisito de experiencia

Sin requisito de título

Carrer d'Aribau, 66, Eixample, 08011 Barcelona, España

Favoritos

Parte del contenido se ha traducido automáticamenteVer original

Descripción

Resumen: Únase al equipo de modelos de IA de Tether para impulsar la innovación en arquitecturas de servicio e inferencia de modelos destinadas a sistemas avanzados de IA, optimizando su despliegue para lograr un rendimiento altamente receptivo y escalable. Aspectos destacados: 1. Impulsando una revolución financiera global con soluciones innovadoras basadas en blockchain 2. Innovar con Tether en el ámbito de las monedas estables, la energía, los datos y la educación 3. Colaborar con mentes brillantes en un centro global de talento ***Únase a Tether y moldeé el futuro de las finanzas digitales*** En Tether, no solo construimos productos: lideramos una revolución financiera global. Nuestras soluciones innovadoras permiten a las empresas —desde exchanges y billeteras hasta procesadores de pagos y cajeros automáticos— integrar sin problemas tokens respaldados por reservas en múltiples blockchains. Al aprovechar el poder de la tecnología blockchain, Tether le permite almacenar, enviar y recibir tokens digitales de forma instantánea, segura y global, todo ello a una fracción del costo. La transparencia es la base de todo lo que hacemos, garantizando la confianza en cada transacción. ***Innovar con Tether*** **Finanzas Tether:** Nuestra innovadora suite de productos incluye la moneda estable más confiable del mundo, **USDT**, utilizada por cientos de millones de personas en todo el mundo, además de servicios pioneros de tokenización de activos digitales. Pero eso es solo el comienzo: **Tether Power:** Impulsando un crecimiento sostenible, nuestras soluciones energéticas optimizan el exceso de energía para la minería de Bitcoin mediante prácticas respetuosas con el medio ambiente en instalaciones de última generación y geográficamente diversas. **Tether Data:** Impulsando avances en IA y tecnología entre pares, reducimos los costos de infraestructura y mejoramos las comunicaciones globales con soluciones innovadoras como **KEET**, nuestra aplicación insignia que redefine el intercambio seguro y privado de datos. **Tether Education:** Democratizando el acceso al aprendizaje digital de máxima calidad, empoderamos a las personas para que prosperen en las economías digital y gig, impulsando el crecimiento y las oportunidades globales. **Tether Evolution:** En la intersección entre la tecnología y el potencial humano, estamos expandiendo los límites de lo posible, forjando un futuro donde la innovación y las capacidades humanas se fusionan de maneras poderosas e inéditas. ***¿Por qué unirse a nosotros?*** Nuestro equipo es un centro global de talento que trabaja de forma remota desde cualquier rincón del planeta. Si está apasionado por dejar huella en el sector fintech, esta es su oportunidad de colaborar con algunas de las mentes más brillantes, rompiendo barreras y estableciendo nuevos estándares. Hemos crecido rápidamente, manteniéndonos ágiles y consolidando nuestro lugar como líderes del sector. Si posee excelentes habilidades de comunicación en inglés y está listo para contribuir a la plataforma más innovadora del planeta, Tether es su lugar. **¿Está listo para formar parte del futuro?** **Acerca del puesto** Como miembro de nuestro equipo de modelos de IA, usted impulsará la innovación en arquitecturas de servicio e inferencia de modelos destinadas a sistemas avanzados de IA. Su trabajo se centrará en la optimización de las estrategias de despliegue e inferencia de modelos para ofrecer un rendimiento altamente receptivo, eficiente y escalable en aplicaciones del mundo real. Trabajará en una amplia gama de sistemas, desde modelos eficientes en recursos diseñados para entornos con hardware limitado hasta arquitecturas complejas multimodales que integran datos como texto, imágenes y audio. Esperamos que tenga una profunda experiencia en el diseño y la optimización de canalizaciones de servicio de modelos y marcos de inferencia, así como una sólida formación en arquitecturas avanzadas de modelos. Adoptará un enfoque práctico y orientado a la investigación para desarrollar, probar e implementar nuevas estrategias de servicio y algoritmos de inferencia. Sus responsabilidades incluyen la ingeniería de canalizaciones de inferencia robustas, el establecimiento de métricas exhaustivas de rendimiento y la identificación y resolución de cuellos de botella en entornos productivos. El objetivo final es habilitar un rendimiento de IA de alto rendimiento, baja latencia, bajo consumo de memoria y escalable, que aporte valor tangible en escenarios dinámicos del mundo real. **Responsabilidades** * Diseñar e implementar arquitecturas de servicio de modelos de vanguardia que ofrezcan un alto rendimiento y baja latencia mientras optimizan el uso de memoria. Asegurar que estas canalizaciones funcionen eficientemente en diversos entornos, incluidos dispositivos con recursos limitados y plataformas perimetrales (edge). Establecer objetivos claros de rendimiento, como la reducción de la latencia, la mejora de la respuesta por token y la minimización de la huella de memoria. * Construir, ejecutar y supervisar pruebas controladas de inferencia tanto en entornos simulados como en entornos productivos reales. Seguir indicadores clave de rendimiento como la latencia de respuesta, el rendimiento, el consumo de memoria y las tasas de error, prestando especial atención a las métricas específicas para dispositivos con recursos limitados. Documentar los resultados iterativos y comparar los resultados con referencias establecidas para validar el rendimiento en distintas plataformas. * Identificar y preparar conjuntos de datos de prueba y escenarios de simulación de alta calidad adaptados a los desafíos reales de despliegue, especialmente los que surgen en dispositivos con pocos recursos. Establecer criterios medibles para garantizar que estos recursos evalúen efectivamente el rendimiento del modelo, la latencia y la utilización de memoria bajo diversas condiciones operativas. * Analizar la eficiencia computacional y diagnosticar cuellos de botella en la canalización de servicio mediante la supervisión tanto de las métricas de procesamiento como de las de memoria. Abordar problemas como un procesamiento por lotes subóptimo, retrasos en la red y un alto consumo de memoria para optimizar la infraestructura de servicio en términos de escalabilidad y fiabilidad en sistemas con recursos limitados. * Colaborar estrechamente con equipos multifuncionales para integrar marcos de servicio e inferencia optimizados en canalizaciones productivas diseñadas para aplicaciones perimetrales y en dispositivo. Definir métricas claras de éxito, tales como una mejora del rendimiento en el mundo real, bajas tasas de error, escalabilidad robusta y uso óptimo de la memoria, y asegurar un monitoreo continuo y refinamientos iterativos para lograr mejoras sostenidas. * Titulación universitaria en Ciencias de la Computación o campo afín. Idealmente, doctorado en Procesamiento del Lenguaje Natural (PLN), Aprendizaje Automático o campo relacionado, complementado por un historial sólido en I+D en IA (con buenas publicaciones en conferencias de categoría A*). * Debe tener conocimientos del Metal Shading Language (MSL). Debe sentirse cómodo escribiendo sombreadores de cómputo personalizados desde cero. * Es imprescindible contar con experiencia demostrada en optimizaciones de bajo nivel del kernel y en la optimización de la inferencia en dispositivos móviles. Sus contribuciones deben haber generado mejoras cuantificables en la latencia, el rendimiento y la huella de memoria de la inferencia para aplicaciones específicas del dominio, particularmente en dispositivos con recursos limitados y plataformas perimetrales. * Se requiere una comprensión profunda de las arquitecturas modernas de servicio de modelos y de las técnicas de optimización de la inferencia. Esto incluye métodos de vanguardia para lograr un rendimiento de baja latencia y alto rendimiento, así como una gestión eficiente de la memoria en diversos escenarios de despliegue con recursos limitados. * Debe poseer una sólida experiencia en la escritura de kernels GPU para dispositivos móviles (por ejemplo, teléfonos inteligentes), así como una profunda comprensión de los marcos y motores de servicio de modelos. Se requiere experiencia práctica en el desarrollo y despliegue de canalizaciones de inferencia de extremo a extremo, desde la optimización de modelos para un servicio eficiente hasta la integración de estas soluciones en dispositivos con recursos limitados. * Capacidad demostrada para aplicar la investigación empírica para superar los desafíos en el servicio de modelos, como la optimización de la latencia, los cuellos de botella computacionales y las restricciones de memoria. Debe ser competente en el diseño de marcos de evaluación robustos y en la iteración de estrategias de optimización para seguir expandiendo los límites del rendimiento de la inferencia y la eficiencia del sistema. * Sistemas de inferencia distribuida: Diseño y optimización de motores de inferencia de alto rendimiento mediante técnicas como paralelismo de tensores, paralelismo de canalización y paralelismo de expertos para gestionar modelos masivos en clústeres de GPU. * Comprensión profunda de las matemáticas y la estructura subyacentes a los modelos de difusión y a los transformadores visuales (Vision Transformers) * Conocimiento de poda (pruning), cuantización, atención Flash (Flash attention), caché KV (KV Cache), decodificación especulativa (Eagle), etc. **Información importante para los candidatos** Los fraudes relacionados con reclutamiento se han vuelto cada vez más comunes. Para protegerse, tenga en cuenta lo siguiente al postularse a puestos: * **Postúlese únicamente a través de nuestros canales oficiales.** No utilizamos plataformas ni agencias externas para reclutamiento, salvo que se indique expresamente. Todos los puestos disponibles están publicados en nuestra página oficial de carreras: https://tether.recruitee.com/ * **Verifique la identidad del reclutador.** Todos nuestros reclutadores tienen perfiles verificados en LinkedIn. Si tiene dudas, puede confirmar su identidad revisando su perfil o contactándonos a través de nuestro sitio web. * **Sea cauteloso con métodos inusuales de comunicación.** No realizamos entrevistas por WhatsApp, Telegram o SMS. Toda la comunicación se lleva a cabo mediante correos electrónicos y plataformas oficiales de la empresa. * **Verifique cuidadosamente las direcciones de correo electrónico.** Toda la comunicación enviada por nosotros provendrá de direcciones que terminen en **@**tether.to **o @**tether.io * **Nunca solicitaremos pagos ni datos financieros personales.** Si alguien le solicita información financiera personal o algún pago en cualquier etapa del proceso de contratación, se trata de un fraude. Por favor, denúncielo de inmediato. **Si tiene dudas, no dude en ponerse en contacto con nosotros a través de nuestro sitio web oficial.**

Fuentea: indeed Ver publicación original

David Muñoz

Indeed · HR

Compañía

Indeed

David Muñoz

Indeed · HR

Empleos similares

Ingeniero de Investigación en IA (Optimización del Kernel e Inferencia)

Descripción

Compañía

Empleos similares

Técnico mantenimiento industrial

Electromecánico/a

Assistant Manager La Roca

Adjunto a responsable de almacen

PERSONAL DE LIMPIEZA

Ingeniero/a - Inspección de Sistemas de Procesos