Ingeniero de Investigación en IA (Compresión y Cuantización de Modelos)

Indeed

Tiempo completo

Presencial

Sin requisito de experiencia

Sin requisito de título

Carrer d'Aribau, 66, Eixample, 08011 Barcelona, Spain

Favoritos

Parte del contenido se ha traducido automáticamenteVer original

Descripción

Resumen: Únase al equipo de investigación en IA de Tether para innovar en la compresión de modelos y su implementación eficiente en sistemas avanzados de inteligencia artificial multimodal, como modelos de lenguaje grande (LLM) y modelos visión-lenguaje (VLM), centrándose en reducir la huella y el costo computacional sin comprometer la precisión. Aspectos destacados: 1. Impulsar la innovación en la compresión de modelos para sistemas avanzados de inteligencia artificial multimodal 2. Aplicar y mejorar técnicas de compresión para una implementación eficiente de la IA 3. Investigar y publicar hallazgos en conferencias de primer nivel ***Únase a Tether y moldee el futuro de las finanzas digitales*** En Tether, no solo desarrollamos productos, sino que lideramos una revolución financiera global. Nuestras soluciones de vanguardia permiten a las empresas —desde exchanges y billeteras hasta procesadores de pagos y cajeros automáticos— integrar sin problemas tokens respaldados por reservas en múltiples blockchains. Al aprovechar el poder de la tecnología blockchain, Tether le permite almacenar, enviar y recibir tokens digitales de forma instantánea, segura y global, todo ello a una fracción del costo. La transparencia es la base de todo lo que hacemos, garantizando confianza en cada transacción. ***Innovar con Tether*** **Tether Finance:** Nuestra innovadora suite de productos incluye la moneda estable más confiable del mundo, **USDT**, utilizada por cientos de millones de personas en todo el mundo, junto con servicios pioneros de tokenización de activos digitales. Pero eso es solo el comienzo: **Tether Power:** Impulsando un crecimiento sostenible, nuestras soluciones energéticas optimizan el exceso de energía para la minería de Bitcoin mediante prácticas ecológicas en instalaciones de última generación y geográficamente diversas. **Tether Data:** Impulsando avances en inteligencia artificial y tecnología peer-to-peer, reducimos los costos de infraestructura y mejoramos las comunicaciones globales con soluciones de vanguardia como **KEET**, nuestra aplicación insignia que redefine el intercambio seguro y privado de datos. **Tether Education**: Democratizando el acceso al aprendizaje digital de primer nivel, empoderamos a las personas para prosperar en las economías digital y gig, impulsando el crecimiento y las oportunidades globales. **Tether Evolution**: En la intersección entre la tecnología y el potencial humano, estamos expandiendo los límites de lo posible, forjando un futuro donde la innovación y las capacidades humanas se fusionan de formas poderosas e inéditas. ***¿Por qué unirse a nosotros?*** Nuestro equipo es un centro global de talento, trabajando de forma remota desde todos los rincones del mundo. Si está apasionado por dejar su huella en el sector fintech, esta es su oportunidad de colaborar con algunas de las mentes más brillantes, rompiendo barreras y estableciendo nuevos estándares. Hemos crecido rápidamente, manteniéndonos ágiles y consolidando nuestro lugar como líderes en la industria. Si posee excelentes habilidades de comunicación en inglés y está listo para contribuir a la plataforma más innovadora del planeta, Tether es el lugar indicado para usted. **¿Está listo para formar parte del futuro?** **Acerca del puesto** Como miembro de nuestro equipo de investigación en IA, usted impulsará la innovación en la compresión de modelos y su implementación eficiente para sistemas avanzados de inteligencia artificial multimodal, incluidos modelos de lenguaje grande (LLM) y modelos visión-lenguaje (VLM). Su trabajo se centrará en reducir la huella del modelo y el costo computacional sin comprometer la precisión, permitiendo que la IA de alto rendimiento funcione eficientemente en dispositivos periféricos con recursos limitados. Aplicará y mejorará técnicas de compresión como la cuantización, la destilación del conocimiento y el podado para simplificar arquitecturas multimodales complejas que integran texto, imágenes y audio. Esperamos que tenga una profunda experiencia en métodos de compresión de modelos y una sólida formación en arquitecturas de modelos multimodales. Adoptará un enfoque práctico y orientado a la investigación para desarrollar, probar e implementar nuevas estrategias de compresión que equilibren tamaño del modelo, latencia, rendimiento y precisión. Sus responsabilidades incluyen construir tuberías de compresión robustas, establecer métricas de rendimiento y fidelidad, y abordar cuellos de botella en la inferencia en producción. El objetivo final es ofrecer sistemas de IA escalables, de bajo consumo de memoria y baja latencia en dispositivos periféricos (por ejemplo, teléfonos inteligentes), que mantengan una alta fidelidad y un valor tangible en el mundo real. **Responsabilidades** Desglose las responsabilidades clave en viñetas. Es útil hacerlas accionables y medibles. Esto también puede agruparse en categorías para roles más complejos. * Aplicar cuantización de bajo número de bits para reducir el tamaño del modelo y la latencia de inferencia en modelos de IA generativa (LLM, VLM, multimodales), manteniendo la precisión y la calidad de salida. * Aprovechar la destilación del conocimiento para transferir capacidades desde modelos maestros más grandes a modelos estudiantes más pequeños, permitiendo un razonamiento multimodal eficiente sobre entradas de texto, imagen y audio. * Implementar técnicas de podado para eliminar parámetros redundantes y cabezas de atención, reduciendo la sobrecarga computacional sin sacrificar el desempeño en la tarea. * Analizar los compromisos entre la eficiencia del modelo (tamaño, latencia, memoria) y la precisión en los métodos de cuantización, destilación y podado; proponer mejoras basadas en hallazgos empíricos. * Investigar y aplicar cuantización de precisión mixta y otras estrategias avanzadas de compresión (por ejemplo, calendarios adaptativos de podado, destilación con coincidencia de características intermedias) para optimizar el equilibrio entre precisión y rendimiento. * Mantenerse actualizado con la investigación más reciente en compresión de modelos, incluidas técnicas emergentes para arquitecturas multimodales y generativas. * Documentar claramente las metodologías, experimentos y resultados para respaldar la reproducibilidad, la colaboración interna y la comunicación con partes interesadas. * Redactar artículos técnicos y publicar hallazgos en conferencias de primer nivel (por ejemplo, NeurIPS, ICML, ICLR, CVPR, ACL, AAAI) para avanzar en el campo de la compresión de modelos para IA multimodal. Enumere las calificaciones, certificaciones y experiencia requeridas para el puesto. Puede dividirlas en secciones obligatorias y preferidas si es necesario. * Titulación en Ciencias de la Computación o campo relacionado. Idealmente doctorado en PLN, Aprendizaje Automático o campo afín, complementado con un sólido historial en I+D en IA (con buenas publicaciones en conferencias A*). * Experiencia con frameworks de aprendizaje profundo como PyTorch o frameworks equivalentes. * Experiencia práctica en cuantización de modelos, incluida tanto la Entrenamiento con Cuantización Integrada (QAT) como la Cuantización tras el Entrenamiento (PTQ). * Experiencia investigadora y práctica en destilación del conocimiento para comprimir modelos grandes en otros más pequeños y eficientes. * Experiencia investigadora y práctica en podado de modelos para comprimir modelos grandes en otros más pequeños y eficientes. * Comprensión sólida de arquitecturas de redes neuronales y procesos de entrenamiento —incluidos transformadores (por ejemplo, LLM, VLM), retropropagación, optimización y técnicas de ajuste fino. * Conocimientos básicos de C++ son un plus (especialmente para implementar kernels de cuantización de bajo nivel u optimizaciones de inferencia). **Información importante para los candidatos** Los fraudes relacionados con reclutamiento se han vuelto cada vez más comunes. Para protegerse, tenga en cuenta lo siguiente al postularse a puestos: * **Postúlese únicamente a través de nuestros canales oficiales.** No utilizamos plataformas ni agencias externas para reclutamiento, salvo que se indique expresamente. Todos los puestos disponibles están publicados en nuestra página oficial de carreras: https://tether.recruitee.com/ * **Verifique la identidad del reclutador.** Todos nuestros reclutadores tienen perfiles verificados en LinkedIn. Si tiene dudas, puede confirmar su identidad revisando su perfil o contactándonos a través de nuestro sitio web. * **Sea cauteloso con métodos inusuales de comunicación.** No realizamos entrevistas por WhatsApp, Telegram o SMS. Toda la comunicación se lleva a cabo mediante correos electrónicos y plataformas oficiales de la empresa. * **Verifique cuidadosamente las direcciones de correo electrónico.** Toda la comunicación proveniente de nosotros tendrá como dominio final **@**tether.to **o @**tether.io * **Nunca solicitaremos pagos ni datos financieros personales.** Si alguien le solicita información financiera personal o un pago en cualquier etapa del proceso de contratación, se trata de una estafa. Por favor, repórtela de inmediato. **Si tiene dudas, no dude en contactarnos a través de nuestro sitio web oficial.**

Fuentea: indeed Ver publicación original

David Muñoz

Indeed · HR

Compañía

Indeed

David Muñoz

Indeed · HR

Empleos similares

Ingeniero de Investigación en IA (Compresión y Cuantización de Modelos)

Descripción

Compañía

Empleos similares

Oficial de Salud y Seguridad

Función de Servicio al Cliente

RESPONSABLE DE CALIDAD EN LA INDUSTRIA COSMÉTICA (REF. 15482)

Empleo Público – Arquitecturas Cloud, Alicante

Profesor/a en Ciencias de la Actividad Física y del Deporte R2

Técnico/a de Laboratorio