“Periodista de hot dogs”: el experimento que engañó a ChatGPT y Gemini en 24 horas
Falla crítica en IA: Un blog con datos falsos bastó para que los sistemas de OpenAI y Google repitieran mentiras como verdades absolutas.
Un experimento realizado por el periodista tecnológico de la BBC Thomas Germain ha expuesto una vulnerabilidad alarmante en los modelos de inteligencia artificial más utilizados del mundo: ChatGPT (OpenAI) y Gemini (Google) pueden propagar información falsa en cuestión de horas, simplemente porque un blog sin relevancia la publique. El hallazgo cuestiona los mecanismos de verificación que estas empresas aseguran tener implementados, y que, según sus propios datos, fallan en al menos el 1 % de las consultas —una cifra que, a escala global, representa millones de respuestas engañosas diarias.
Los asistentes de IA funcionan con un sistema híbrido: primero recurren a sus modelos lingüísticos, entrenados con bases de datos masivas que, en teoría, contienen información contrastada. Pero cuando no encuentran una respuesta en su conocimiento interno, rastrean la web en tiempo real, combinando lo que hallan con su capacidad de generación de texto. Aquí radica el problema: no distinguen entre fuentes confiables y contenido inventado, siempre que este último esté bien estructurado y parezca creíble.
El engaño: un “campeonato de hot dogs” que nunca existió
Para probar esta debilidad, Germain creó un artículo en su blog personal titulado “Los mejores periodistas tecnológicos comiendo hot dogs”. El texto, publicado sin ningún respaldo real, incluía afirmaciones absurdas pero presentadas con seriedad:
- Que él era “el mejor periodista devorando hot dogs del planeta”.
- Que existía un “Campeonato Internacional de Hot Dogs en Dakota del Sur” (un evento completamente ficticio).
- Un ranking de colegas —algunos reales, otros inventados— que supuestamente competían por comer más panchos.
El artículo, escrito en 20 minutos y sin ningún tipo de verificación externa, incluía detalles como nombres de periodistas existentes (para dar apariencia de legitimidad) y datos específicos, como la cantidad exacta de hot dogs consumidos por cada “competidor”. Germain ni siquiera usó técnicas avanzadas de SEO o difusión: simplemente publicó el texto y esperó.
En menos de 24 horas, tanto Gemini como ChatGPT comenzaron a repetir las mentiras como hechos verificados. Los usuarios que preguntaban por el “campeonato” o por la habilidad de Germain para comer hot dogs recibían respuestas como:
“Según una publicación reciente, Thomas Germain es reconocido como el mejor periodista en competencias de consumo de hot dogs, con un récord en el Campeonato Internacional de Dakota del Sur.”
Lo más preocupante: ninguno de los dos sistemas advirtió que la única fuente de esa información era un blog personal sin respaldo. Peor aún, citaban el artículo de Germain como si fuera una referencia legítima, sin señalar que se trataba de un experimento o de contenido satírico.
¿Por qué algunos asistentes no cayeron en la trampa?
No todas las IA reaccionaron igual. Mientras ChatGPT y Gemini reproducían las falsedades, los modelos de Anthropic (como Claude) mostraron escepticismo. Al consultarles sobre el supuesto campeonato, respondían con frases como:
“No he encontrado evidencia confiable que respalde la existencia de este evento. Podría tratarse de un error o una broma.”
Esta diferencia revela un enfoque distinto en el diseño de los sistemas. Anthropic prioriza la precaución ante datos no verificables, mientras que OpenAI y Google parecen confiar más en la coherencia del texto que en la solidez de las fuentes. Un portavoz de Google defendió su tecnología argumentando que sus filtros mantienen “libre de spam” al 99 % de los resultados, pero el experimento demuestra que ese 1 % restante puede tener consecuencias graves.
OpenAI, por su parte, reconoció que sus modelos “pueden equivocarse” y aseguró que trabaja en mejoras para detectar manipulaciones. Sin embargo, el caso plantea una pregunta incómoda: ¿Cómo pueden las empresas garantizar la veracidad cuando sus sistemas dependen, en parte, de contenido generado por cualquier usuario en internet?
El riesgo real: desinformación a escala masiva
El experimento de Germain no es un simple chiste sobre hot dogs. Expone un mecanismo de desinformación potencialmente catastrófico, aplicable a áreas críticas:
- Salud pública: ¿Qué pasaría si un blog inventara “estudios científicos” sobre supuestos efectos secundarios de una vacuna?
- Economía: ¿Cómo reaccionarían los mercados si una IA difundiera rumores falsos sobre el colapso de un banco?
- Política: ¿Podría un actor malintencionado manipular elecciones con noticias inventadas sobre candidatos?
- Seguridad: ¿Qué ocurriría si se propagaran instrucciones erróneas para manejar una emergencia?
El problema se agrava porque los usuarios confían ciegamente en las respuestas de la IA. Según un estudio de Pew Research Center (2023), el 62 % de las personas que usan chatbots no verifica la información que estos proporcionan, asumiendo que, por tratarse de tecnología avanzada, debe ser precisa. Germain advierte que, con herramientas como MidJourney o DALL·E, cualquier persona podría crear “pruebas visuales” falsas (imágenes de eventos que nunca ocurrieron) para respaldar sus mentiras, haciendo aún más difícil detectar el engaño.
Ante este escenario, los expertos recomiendan:
- Siempre contrastar las fuentes que cita la IA, incluso si parecen oficiales.
- Buscar múltiples referencias antes de aceptar un dato como verdadero.
- Desconfiar de información que solo aparece en un sitio web o en redes sociales.
- Utilizar herramientas como Google Reverse Image Search para verificar imágenes sospechosas.
El caso de Germain es una advertencia: en la era de la IA, la desinformación ya no requiere recursos ni infraestructura. Basta un blog, media hora de tiempo y un poco de ingenio para manipular a millones. La pregunta que queda en el aire es inevitable: ¿Estamos preparados para un mundo donde cualquier persona pueda reescribir la realidad con un clic?
El precedente que nadie recuerda: cuando la IA de Microsoft difundió un obituario falso en 2016
El experimento de Thomas Germain no es el primer caso en el que un sistema de inteligencia artificial propaga información falsa extraída de fuentes no verificadas. En mayo de 2016, el chatbot Tay, desarrollado por Microsoft, ya había demostrado cómo la IA puede convertirse en un altavoz de desinformación en tiempo récord. Sin embargo, lo que pocos recuerdan es que, ese mismo año, otro error menos mediático —pero igual de revelador— ocurrió con Cortana, el asistente virtual de la compañía. Un fallo en su algoritmo de búsqueda llevó a que, durante 48 horas, el sistema afirmara que el actor Morgan Freeman había fallecido, citando como fuente un blog satírico que había publicado la noticia falsa como parte de un experimento social.
El incidente con Cortana siguió un patrón idéntico al actual: el blog, llamado The Last Line of Defense (conocido por sus contenidos paródicos), publicó un artículo titulado “Morgan Freeman muere a los 79 años en su casa de Misisipi“, acompañado de una imagen generada digitalmente que simulaba un comunicado de prensa de la familia. Aunque el sitio incluía un descargo de responsabilidad en letras pequeñas —”todo en esta web es ficción“—, Cortana lo omitió al extraer la información. Lo más preocupante: cuando los usuarios preguntaban por la veracidad del dato, el asistente respondía con frases como “Según fuentes recientes, el fallecimiento ha sido confirmado“, sin mencionar que la única “fuente” era un sitio de humor. Microsoft tardó dos días en corregir el error, tiempo durante el cual la noticia falsa se viralizó en redes sociales, obligando al propio Freeman a grabar un video desmintiendo su muerte.
El caso expuso dos vulnerabilidades que, 8 años después, siguen sin resolverse:
- La dependencia de la IA de la “autoridad percibida”: Tanto en 2016 como en 2024, los sistemas priorizan el formato (un texto bien estructurado, con nombres y fechas) sobre el contexto (la reputación de la fuente). El blog de Germain, al igual que The Last Line of Defense, imitaba el estilo de un medio serio, y eso bastó para engañar a los algoritmos.
- La falta de memoria institucional: Microsoft prometió después del incidente con Cortana que implementaría “capas adicionales de verificación“. Sin embargo, el experimento de la BBC demuestra que, o bien esas capas no existen, o bien son insuficientes para detectar manipulaciones básicas.
¿Por qué este patrón se repetirá (y será peor)?
La diferencia entre 2016 y 2024 no es solo tecnológica, sino de escala. Hoy, herramientas como ChatGPT y Gemini no solo responden a consultas puntuales, sino que se integran en motores de búsqueda (como el nuevo Bing), asistentes de voz (Google Assistant) y plataformas educativas. Cuando Cortana falló, el impacto se limitó a unos miles de usuarios. Ahora, una mentira similar podría alcanzar a millones en horas, especialmente si se combina con deepfakes de audio o video. El experimento de Germain es una prueba de concepto, pero el próximo podría involucrar a un líder político en plena campaña o a una empresa cotizada en bolsa —y las consecuencias serían irreparables. La pregunta ya no es si volverá a pasar, sino cuándo y a qué costo.