Categorías
···
Entrar / Registro

Analista de QA contra el fraude - Teletrabajo

Indeed
Tiempo completo
Presencial
Sin requisito de experiencia
Sin requisito de título
España
Favoritos
Compartir
Parte del contenido se ha traducido automáticamenteVer original

Descripción

Resumen: Este puesto implica realizar pruebas con el equipo rojo sobre modelos de IA conversacional, generar datos humanos de alta calidad, aplicar pruebas estructuradas y documentar hallazgos reproducibles para hacer la IA más segura. Aspectos destacados: 1. Modelos de IA conversacional del equipo rojo para descubrir vulnerabilidades y mejorar la seguridad 2. Generar datos humanos de alta calidad para anotar fallos y señalar riesgos sistémicos 3. Contribuir a hacer los sistemas de IA más seguros para los clientes mediante pruebas adversarias **Ubicación**: Teletrabajo **Tipo**: Trabajo por contrato a tiempo completo o parcial **Conocimientos lingüísticos exigidos**: Inglés e italiano. Se requiere fluidez nativa en inglés e italiano para este puesto. **Motivo de existencia de este puesto** Creemos que la IA más segura es aquella que ya ha sido atacada… por nosotros. Estamos formando un equipo rojo para este proyecto: expertos humanos en datos que someten los modelos de IA a entradas adversarias, detectan vulnerabilidades y generan los datos del equipo rojo que hacen la IA más segura para nuestros clientes. Este proyecto implica revisar salidas de IA relacionadas con temas sensibles como sesgos, desinformación o comportamientos dañinos. Todo el trabajo es basado en texto, y la participación en proyectos de mayor sensibilidad es opcional y está respaldada por directrices claras y recursos para el bienestar. Antes de exponerse a cualquier contenido, se comunicarán claramente los temas correspondientes. **Sus funciones** * Realizar pruebas con el equipo rojo sobre modelos y agentes de IA conversacional: escapadas (jailbreaks), inyecciones de indicaciones (prompt injections), casos de uso indebido, explotación de sesgos, manipulación en múltiples turnos * Generar datos humanos de alta calidad: anotar fallos, clasificar vulnerabilidades y señalar riesgos sistémicos * Aplicar estructura: seguir taxonomías, referencias comparativas (benchmarks) y manuales operativos para mantener la coherencia en las pruebas * Documentar de forma reproducible: elaborar informes, conjuntos de datos y casos de ataque sobre los que los clientes puedan actuar **Perfil ideal** * Experiencia previa en pruebas con equipo rojo (trabajo adversario con IA, ciberseguridad, sondeo socio-técnico) * Curiosidad y mentalidad adversaria: instintivamente lleva los sistemas hasta sus límites * Capacidad para trabajar de forma estructurada: utiliza marcos metodológicos o referencias comparativas, no solo ataques aleatorios * Habilidad comunicativa: explica los riesgos con claridad tanto a partes interesadas técnicas como no técnicas * Adaptabilidad: prospera al cambiar entre proyectos y clientes **Especialidades deseables (no obligatorias)** * Aprendizaje automático adversario: conjuntos de datos para escapadas (jailbreak), inyección de indicaciones (prompt injection), ataques RLHF/DPO, extracción de modelos * Ciberseguridad: pruebas de penetración, desarrollo de exploits, ingeniería inversa * Riesgo socio-técnico: sondeo de acoso/desinformación, análisis de abuso, pruebas de IA conversacional * Sondeo creativo: psicología, interpretación, escritura para un pensamiento adversario poco convencional **Qué significa el éxito** * Detecta vulnerabilidades que las pruebas automatizadas pasan por alto * Entrega artefactos reproducibles que refuerzan los sistemas de IA de los clientes * Ampliación de la cobertura de evaluación: se prueban más escenarios y surgen menos sorpresas en producción

Fuentea:  indeed Ver publicación original
David Muñoz
Indeed · HR

Compañía

Indeed
David Muñoz
Indeed · HR

Empleos similares

Cookie
Configuración de cookies
Nuestras aplicaciones
Download
Descargar en
APP Store
Download
Consíguelo en
Google Play
© 2025 Servanan International Pte. Ltd.