Pones un podcast en YouTube y un sonido indetectable al oído humano comienza a sonar. Son instrucciones para agentes IA

Pones un podcast en YouTube y un sonido indetectable al oído humano comienza a sonar. Son instrucciones para agentes IA

Lo llaman mezcla convolucional, pero entender qué hace es mucho más fácil que pronunciarlo. Es una forma de colar entre cualquier tipo de audio una serie de sonidos que resultan indetectables para tus oídos. Su función no es otra que enviarle órdenes a agentes IA para que envíen información o instalen malware que tú no has aprobado. El sistema, descubierto a medio camino entre China y Singapur, sería el equivalente a la inyección de prompts en texto, pero escondidos entre podcast o vídeos de YouTube en vez de entre líneas que sólo la máquina alcanza a leer.

Lo peor de todo es que, pese a parecer ciencia ficción de la buena, conseguir secuestrar a tu IA es más fácil de lo que parece. "Sólo se necesita media hora para entrenar esta señal" Según recogen en IEEE Spectrum, el líder del estudio asegura que "Sólo se necesita media hora para entrenar esta señal y, dado que es independiente del contexto, se puede usar para atacar un modelo cuando se quiera, sin importar lo que diga el usuario". Lejos de probarse con modelos específicos, han comprobado que el sistema funciona con hasta 13 modelos de IA, entre los que se encuentran servicios de Microsoft, con los que se alcanzó una tasa de éxito de entre el 79% y el 96%. Mientras le estamos dando acceso a la IA a toda nuestra vida digital de la mano de agentes capaces de realizar tareas de forma autónoma desde nuestro escritorio, algo tan simple como tener sonando por los altavoces un vídeo de TikTok puede acabar en un ataque que filtre nuestra información privada, nuestros datos bancarios o cualquier elemento sensible al que la inteligencia artificial tenga acceso. Ni pedirle a la IA que tenga en cuenta esos ataques para evitarlos, ni pedirle que reflexione sobre qué hará a continuación para no desalinearse con las instrucciones habituales, ha conseguido solucionarlo.

En el primer ejemplo sólo frenó un 7% de los casos, y en el segundo alcanzó un 28% de éxito que queda muy lejos de ser una cifra ideal. Desde Microsoft han agradecido el descubrimiento para poder seguir trabajando en "la resiliencia del modelo". Imagen | Yassine Ait Tahit En 3DJuegos | En China quieren que los robots humanoides hagan las tareas del hogar. El problema es que una casa no es una fábrica