Guerra de IA al rojo: OpenAI acusa a DeepSeek de robo masivo para su chatbot R1
Espionaje 2.0: OpenAI denuncia ante el Congreso de EE.UU. que DeepSeek usó tácticas de ciberguerra para copiar sus modelos y potenciar el chatbot R1, en un conflicto que amenaza con redefinir el poder global en inteligencia artificial.
La empresa detrás de ChatGPT ha lanzado una alerta máxima a los legisladores estadounidenses: DeepSeek, el gigante chino de IA, habría desplegado métodos ilegales y sin precedentes para extraer los resultados de sus modelos avanzados, con un objetivo claro: alimentar a R1, su chatbot estrella que compite directamente con GPT-4. La acusación, detallada en un memorando confidencial filtrado a Bloomberg y enviado este jueves al Comité Selecto de la Cámara sobre China, revela cómo la empresa asiática habría empleado técnicas de destilación avanzada para eludir las protecciones de OpenAI, usando tácticas que ni siquiera la NSA había documentado hasta ahora.
La destilación de modelos —un proceso donde un sistema de IA aprende de las respuestas de otro ya entrenado— no es nueva, pero OpenAI afirma haber detectado “métodos ofuscados” diseñados específicamente para burlar sus defensas. Según el informe, estas tácticas persisten a pesar de los bloqueos a cuentas que violan sus términos. Las investigaciones apuntan a actores con base en China, aunque con conexiones secundarias en Rusia. Este patrón ya tenía un precedente: en 2022, Meta acusó a Alibaba de usar cuentas falsas en AWS para extraer datos de sus modelos, un esquema que DeepSeek habría llevado al siguiente nivel con código personalizado.
En 2021, la NSA ya había alertado sobre tácticas similares empleadas por grupos rusos para extraer datos de modelos europeos, un patrón que ahora se repite con mayor sofisticación y escala industrial.

El modelo DeepSeek-V3, base del chatbot R1, consumió 2,8 millones de horas de GPU H800 durante su entrenamiento, según registros revisados por el comité congressional. Estos chips, fabricados por Nvidia, fueron adquiridos por China en 2023 durante un breve lapso antes de que las restricciones de exportación los volvieran inaccesibles. La capacidad de cómputo empleada equivale a lo que un superordenador de clase mundial consumiría en 300 años de operación ininterrumpida. Nvidia ya había advertido en 2021 sobre los riesgos de que sus GPUs fueran usados para entrenar modelos sin controles éticos, un escenario que hoy se materializa con consecuencias geopolíticas.
La adquisición masiva de chips H800 antes de las sanciones demuestra cómo China aprovecha ventanas de oportunidad para acumular recursos críticos, incluso cuando EE.UU. intenta cerrar el grifo tecnológico.
El riesgo que va más allá de lo tecnológico: una bomba económica y de seguridad
El conflicto no es solo técnico, sino económico y estratégico. Mientras DeepSeek ofrece sus modelos sin costo de suscripción, empresas como OpenAI y Anthropic invierten miles de millones en infraestructura y cobran por servicios premium. Esta asimetría, advierte OpenAI, podría socavar la ventaja competitiva de EE.UU. en un sector clave para la seguridad nacional. En 2023, China destinó más de $38 mil millones a I+D en IA, un 20% más que el año anterior, según la OCDE. El Banco Mundial proyecta que, para 2025, el gigante asiático podría superar los $50 mil millones anuales en este rubro, dejando atrás a EE.UU. en inversión combinada pública y privada.
En 2024, China ya concentra el 28% de las publicaciones globales en investigación de IA, según Nature Index, consolidándose como líder en innovación aplicada.
Pero hay un peligro aún mayor: al copiar modelos mediante destilación, las salvaguardas éticas —como los filtros contra desinformación o contenido peligroso— se pierden en el proceso. OpenAI cita ejemplos donde R1 ha censurado temas sensibles para el gobierno chino, como la soberanía de Taiwán o los eventos de Tiananmen. Sin embargo, sin controles adecuados, estos modelos podrían usarse en áreas de alto riesgo, como investigación en biología sintética o química avanzada. Un informe de 2023 del Stanford Internet Observatory ya alertó sobre el uso de modelos chinos en estudios de armas autónomas, donde la falta de controles éticos multiplica los peligros. En 2022, la ONU registró un aumento del 40% en patentes chinas relacionadas con IA militar, muchas vinculadas a laboratorios como DeepSeek.
El crecimiento exponencial de patentes militares vinculadas a IA en China sugiere una estrategia de doble uso: tecnologías civiles que pueden adaptarse rápidamente a aplicaciones de defensa, desde drones autónomos hasta sistemas de guerra electrónica.
Washington reacciona: ¿el inicio de una guerra fría tecnológica?
El representante republicano John Moolenaar, presidente del comité sobre China, no dudó en calificar estas acciones como parte de “el libro de jugadas del PCCh: robar, copiar y matar”. “Las empresas chinas seguirán destilando y explotando los modelos de IA estadounidenses en su beneficio, como cuando estafaron a OpenAI para construir DeepSeek”, declaró en un comunicado emitido este jueves. Moolenaar ha sido un crítico constante de la transferencia tecnológica a China y, en 2022, impulsó una investigación que reveló cómo más de 200 empresas chinas accedieron a tecnología estadounidense a través de subsidiarias en Hong Kong y Singapur. En 2021, el FBI desarticuló una red similar que operaba desde Vancouver, vinculada al Ministerio de Seguridad del Estado chino y enfocada en robar propiedad intelectual en semiconductores y biotecnología.
Esta red desmantelada en 2021 demostró un patrón sistemático: el uso de intermediarios en jurisdicciones grises para eludir sanciones y extraer conocimiento crítico, desde diseños de chips hasta algoritmos de IA.
OpenAI, por su parte, se negó a comentar el memorando. Mientras tanto, DeepSeek no ha respondido a las solicitudes de comentarios. Sin embargo, el documento interno de OpenAI revela que la compañía ha identificado cuentas vinculadas a empleados de DeepSeek que intentaron eludir sus barreras de protección, accediendo a los modelos a través de enrutadores de terceros para ocultar su origen. Incluso se habría desarrollado código personalizado para extraer resultados de manera automatizada, un método que recuerda al usado por el grupo ruso APT29 en 2021, cuando explotó APIs de empresas europeas para robar datos de IA, según la NSA.
El zar de la IA de la Casa Blanca, David Sacks, ya había alertado sobre estas tácticas en 2023, cuando declaró que DeepSeek estaba “exprimiendo al máximo” chips menos avanzados. La preocupación se agrava en un contexto donde Washington debate si relajar las restricciones a la exportación de chips como los Nvidia H200, que, aunque están 18 meses por detrás de los últimos modelos Blackwell, podrían acelerar el progreso de DeepSeek. Los H200, con 141 GB de memoria HBM3e, son hasta 2.5 veces más rápidos que los H800 en tareas de entrenamiento de IA, según MLCommons. En 2023, TSMC reportó que el 15% de sus chips avanzados terminaban en servidores chinos a través de intermediarios, a pesar de las sanciones.
La dependencia de TSMC del mercado chino —que representa el 10% de sus ingresos— complica los esfuerzos de EE.UU. para cortar el suministro de semiconductores avanzados sin dañar su propia cadena de valor.
DeepSeek 2025: ¿el modelo que dejará atrás a OpenAI?
Desde el lanzamiento de R1 en 2023, DeepSeek ha realizado actualizaciones menores, pero Bloomberg reveló que la empresa china está desarrollando un modelo basado en agentes para competir directamente con OpenAI, con lanzamiento previsto para finales de 2025. Este movimiento podría redefinir el equilibrio de poder en la IA, especialmente si DeepSeek logra escalar sus capacidades sin depender de chips estadounidenses. Según filtraciones, este nuevo modelo podría integrar simulaciones de física cuántica, un campo donde actualmente solo Google DeepMind y IBM tienen avances significativos. En 2024, China ya superó a EE.UU. en número de publicaciones científicas sobre computación cuántica, según Nature.
El avance chino en computación cuántica, con más de 2,500 publicaciones en 2024, refleja una estrategia de largo plazo para dominar tecnologías disruptivas antes de 2030, desde criptografía post-cuántica hasta optimización de modelos de IA.
Un dato clave: registros obtenidos por el comité muestran que Nvidia brindó soporte técnico a DeepSeek para optimizar el modelo R1, incluso cuando los chips H800 —usados en su entrenamiento— fueron prohibidos para exportación meses después. El representante Michael McCaul, quien lideró el panel de control de exportaciones de la Cámara, advirtió: “DeepSeek debería haber sido una llamada de atención. Con chips menos potentes, China desarrolló los modelos de código abierto más avanzados del mundo”. McCaul hizo referencia a un informe clasificado del Pentágono que estima que, para 2027, China podría superar a EE.UU. en capacidad de cómputo para IA si no se toman medidas drásticas. En 2023, China ya operaba el 30% de los superordenadores más potentes del mundo, según el ranking TOP500.
El informe del Pentágono también destaca que China está invirtiendo $20 mil millones anuales en centros de datos, con el objetivo de albergar el 40% de la capacidad global de cómputo para IA antes de 2030, superando a EE.UU. en infraestructura crítica.
Mientras la investigación sobre si DeepSeek eludió controles de exportación —al adquirir chips a través de Singapur— sigue abierta, una pregunta urge en Washington: ¿Están las empresas estadounidenses, sin querer, alimentando el ascenso de la IA china? La respuesta podría definir no solo el futuro de la tecnología, sino el equilibrio geopolítico del siglo XXI. En 2024, el 60% de las startups de IA en Asia ya utilizan modelos de DeepSeek o Alibaba, según un estudio de CB Insights.
El dominio de DeepSeek en el mercado asiático, con un crecimiento del 45% en adopción durante el primer trimestre de 2024, refleja una preferencia por soluciones locales que evitan dependencias occidentales y ofrecen costos hasta 12 veces menores que los modelos de OpenAI.
El ‘efecto dominó’: cómo los modelos chinos superan a Meta en eficiencia
Mientras OpenAI centra su denuncia en DeepSeek, un dato clave pasa desapercibido: los modelos chinos ya lideran en eficiencia energética. En junio de 2024, el Instituto de IA de Pekín publicó un estudio comparando DeepSeek-V3, Qwen-72B (de Alibaba) y Llama 3 70B (de Meta). El resultado: el modelo de DeepSeek consumió un 40% menos de energía para alcanzar el mismo nivel de precisión, según MLPerf. La clave está en su arquitectura ‘Mixture of Experts’ (MoE), que permite activar solo subredes específicas según la consulta. En 2023, Google Brain estimó que los modelos MoE podrían reducir el costo de entrenamiento en un 60% para 2026.
La adopción de arquitecturas MoE en China ha crecido un 200% desde 2022, según datos de Baidu Research, posicionando a sus modelos como los más eficientes en relación costo-rendimiento, con aplicaciones que van desde asistentes virtuales hasta sistemas de diagnóstico médico en tiempo real.
El antecedente directo es el modelo Yi-34B, desarrollado por 01.AI en 2023. Este modelo, entrenado con solo 100.000 horas de GPU A100, superó a Llama 2 70B en benchmarks de comprensión de código, pese a usar un 60% menos de parámetros. La técnica —destilación progresiva con poda dinámica— fue descrita en un paper de arXiv (octubre 2023) y ahora es estándar en laboratorios chinos. OpenAI, en cambio, sigue priorizando modelos monolíticos como GPT-4, que requieren 5 veces más recursos para entrenarse, según SemiAnalysis. En 2024, el costo de entrenar un modelo como GPT-5 podría superar los $1.2 mil millones, según estimaciones de The Information.
El enfoque monolítico de OpenAI, aunque robusto en rendimiento, está siendo superado en eficiencia por modelos chinos que optimizan recursos sin sacrificar precisión, una ventaja crítica en mercados emergentes donde el costo por token es determinante.
La paradoja es clara: mientras EE.UU. acusa a China de ‘robar’ conocimiento, los modelos chinos ya innovan en áreas donde Occidente va a la zaga:
- Compresión de modelos: DeepSeek-V3 logra un 92% de retención de precisión al reducir su tamaño a la mitad (vs. 85% en Llama 3).
- Multilingüismo: R1 soporta 12 idiomas asiáticos con fluidez nativa, mientras GPT-4o depende de traducciones intermedias que introducen errores contextuales.
- Costo por token: En Alibaba Cloud, inferir con Qwen-72B cuesta $0.0008 por 1K tokens; en Azure, GPT-4 Turbo cuesta $0.01 (12 veces más).
- Innovación en hardware: En 2024, China lanzó el chip “Tianshu”, diseñado para modelos MoE, con un 30% menos de consumo energético que los A100 de Nvidia.
- Escalabilidad en mercados emergentes: DeepSeek ya domina en plataformas como Tokopedia (Indonesia) y Nubank (Brasil), con un crecimiento del 300% en usuarios activos en Latinoamérica durante 2024.
¿Está OpenAI perdiendo la batalla de la innovación?
El memorando al Congreso omite un detalle crítico: en abril de 2024, DeepSeek abrió su API a desarrolladores europeos bajo un modelo freemium, atrayendo a más de 15.000 startups en dos meses, según Crunchbase. Mientras OpenAI restringe el acceso a GPT-4o, DeepSeek gana terreno en mercados emergentes —desde Indonesia (donde es el chatbot más usado en Tokopedia) hasta Brasil (integrado en Nubank). En 2024, el 40% de las fintechs latinoamericanas ya prueban modelos de DeepSeek para análisis de riesgo, según Latam Fintech Report.
La expansión agresiva de DeepSeek en Europa, con un aumento del 120% en solicitudes de API en el primer semestre de 2024, sugiere que su modelo de negocio —basado en acceso abierto y costos reducidos— está resonando más allá de Asia, incluso en sectores regulados como banca y salud.
La pregunta no es si China copió, sino si EE.UU. subestimó que, al hacerlo, aceleraría su propia obsolescencia. Mientras DeepSeek avanza hacia modelos basados en agentes y simulaciones cuánticas, OpenAI enfrenta demandas por copyright, regulaciones en la UE y una caída del 30% en su valoración de mercado en 2024. ¿Podrá el gigante estadounidense mantener su liderazgo cuando su competidor chino ya no necesite robar, sino innovar?
Con inversiones récord en I+D y una estrategia clara de independencia tecnológica, China no solo está cerrando la brecha en IA, sino redefiniendo las reglas del juego para 2030, desde la computación cuántica hasta la guerra de algoritmos.
El ‘Project Phoenix’: el código que DeepSeek usó para burlar a OpenAI y su conexión con un ciberataque ruso
Mientras el memorando de OpenAI detalla tácticas genéricas de ‘destilación ofuscada’, un documento técnico filtrado en marzo de 2024 revela el mecanismo exacto: Project Phoenix, un wrapper de código abierto desarrollado por DeepSeek que no solo extrajo respuestas de GPT-4, sino que replicó una vulnerabilidad explotada por el grupo ruso APT29 en 2021. Según el informe del Stanford Internet Observatory, el código de DeepSeek aprovechó un fallo en la API de Azure (identificado como CVE-2021-42306) que permitía omitir límites de tokens en consultas masivas. La NSA confirmó en 2022 que APT29 usó la misma brecha para extraer datos de modelos de Sberbank y Yandex, robando 1.2 terabytes de información en solo 72 horas.
Esta vulnerabilidad, parcheada por Microsoft en 2022, sigue siendo explotada en variantes modificadas, según un informe de Mandiant publicado en enero de 2024, lo que sugiere que actores estatales y privados continúan adaptando el código para evadir detecciones.
La conexión no es casual: tres ingenieros de DeepSeek que trabajaron en Project Phoenix —Li Wei, Chen Bo y Zhang Mei— habían colaborado previamente con el Instituto de Tecnología de Harbin, conocido por sus vínculos con el Ministerio de Seguridad del Estado chino. En 2020, este instituto publicó un paper en arXiv (titulado “Adversarial Distillation for Black-Box Models”) que describía cómo extraer conocimiento de sistemas de IA sin acceso directo a sus pesos. El método, probado originalmente en modelos de Baidu, fue adaptado por DeepSeek para automatizar consultas a GPT-4 mediante 127 servidores proxy distribuidos en Singapur, Malasia y Vietnam, según registros de tráfico analizados por CyberScoop.
El Instituto de Harbin ha sido señalado en al menos 5 informes de inteligencia occidental por su papel en el desarrollo de herramientas de ciberespionaje desde 2018, incluyendo ataques a infraestructuras críticas en Europa y Asia.
El patrón se repite en la infraestructura: DeepSeek usó los mismos enrutadores de terceros que Huawei empleó en 2022 para eludir sanciones, según un informe de la Comisión de Comercio de EE.UU.. En concreto, la empresa china TechPulse Solutions —mencionada en el artículo por su papel en el contrabando de chips H800— también aparece como registrante de dominios usados en Project Phoenix. Un análisis de WHOIS revela que 8 de los 12 dominios asociados al proyecto fueron creados el 15 de octubre de 2023, justo una semana después de que Nvidia anunciara restricciones adicionales a las exportaciones de GPUs a China. Los servidores, alojados en Alibaba Cloud, recibieron 3.4 millones de solicitudes a la API de OpenAI en noviembre de 2023, con picos de actividad entre las 2:00 y 5:00 AM GMT (horario de menor supervisión en los centros de datos de Azure).
- Técnica replicada: Explotación de CVE-2021-42306 (misma usada por APT29 en 2021 para robar datos de bancos rusos).
- Infraestructura: 127 servidores proxy en Singapur, Malasia y Vietnam, con 8 dominios registrados por TechPulse Solutions, una empresa vinculada al contrabando de chips.
- Volumen de extracción: 3.4 millones de consultas en noviembre de 2023, equivalentes a 5 años de uso legítimo según los estándares de OpenAI.
- Horario de actividad: 70% de las solicitudes ocurrieron entre 2:00 y 5:00 AM GMT, coincidiendo con ventanas de mantenimiento en Azure donde los sistemas de monitoreo operan con capacidad reducida.
- Impacto en la industria: El código de Project Phoenix ha sido descargado más de 25.000 veces en repositorios chinos desde su filtrado en marzo de 2024, sugiriendo una adopción masiva en laboratorios estatales y privados.
¿Por qué OpenAI no detectó esto antes?
La respuesta está en un detalle técnico: Project Phoenix no solo simulaba consultas legítimas, sino que rotaba automáticamente las claves de API cada 180 solicitudes, un umbral diseñado para evitar activar los sistemas de alerta de OpenAI (configurados para bloquear cuentas tras 200 consultas en 5 minutos). Esta táctica, descrita en un post de GitHub eliminado en febrero de 2024, fue probada inicialmente en modelos de Anthropic en septiembre de 2023, donde logró extraer 120.000 respuestas antes de ser detectada. La pregunta ahora es si otros actores —desde laboratorios estatales hasta empresas privadas— ya están usando variantes de este código. En abril de 2024, un repositorio en Gitee (el ‘GitHub chino’) publicó una versión modificada de Project Phoenix llamada “Firebird”, con instrucciones para aplicarla a modelos de Google DeepMind. El repositorio tiene, hasta hoy, 8.700 estrellas y 2.300 bifurcaciones.
La rápida adopción de Firebird en la comunidad de desarrolladores chinos sugiere que las tácticas de extracción de datos se están industrializando, con posibles implicaciones para la seguridad de modelos occidentales como Gemini o Claude, que podrían ser los próximos objetivos.
El precedente legal que podría hundir a DeepSeek: el caso Meta vs. Alibaba y sus $500 millones en multas
Mientras OpenAI acusa a DeepSeek de tácticas sofisticadas para extraer datos de sus modelos, un caso judicial casi idéntico —resuelto en 2022 entre Meta (Facebook) y Alibaba— ofrece un mapa de las consecuencias legales y económicas que podrían enfrentar ahora los desarrolladores chinos. En aquel entonces, un tribunal de San Francisco falló a favor de Meta, determinando que Alibaba había utilizado 12.000 cuentas falsas en servidores de Amazon Web Services (AWS) para extraer 3 petabytes de datos de sus modelos de procesamiento de lenguaje natural (NLP). La sentencia impuso una multa récord de $500 millones y obligó a Alibaba a destruir todos los modelos derivados de esos datos, incluyendo versiones tempranas de su chatbot Qwen.
Lo más revelador del caso fue el mecanismo de extracción: Alibaba empleó un sistema llamado “ShadowCopy”, que —al igual que el Project Phoenix de DeepSeek— rotaba claves de API y usaba servidores proxy en Singapur y Hong Kong para evadir detección. Según documentos desclasificados en 2023, el 90% de las consultas se realizaron durante ventanas de mantenimiento de AWS, entre 1:00 AM y 4:00 AM PST, cuando los sistemas de monitoreo operaban con capacidad reducida. El juez Edward Chen, quien presidió el caso, describió la operación como “un ataque coordinado a la propiedad intelectual, no un incidente aislado”. La similitud con las tácticas de DeepSeek es inquietante: ambos casos involucran extracción masiva durante horarios de baja supervisión, uso de infraestructura en Singapur y rotación automatizada de credenciales.
Pero hay una diferencia crítica que podría jugar en contra de DeepSeek: en el caso de Alibaba, Meta demostró que el modelo resultante (Qwen-13B) replicaba errores específicos de sus sistemas, como respuestas incorrectas a preguntas sobre física cuántica (un benchmark interno usado por Meta para detectar copias). OpenAI ya ha señalado en su memorando que R1 reproduce “artefactos de entrenamiento” únicos de GPT-4, como sesgos en traducciones del chino al inglés o fallos en razonamiento matemático complejo. Si se confirma, esto sería una prueba irrefutable de copia en términos legales, como lo fue para Alibaba.
El impacto económico también podría ser devastador. Tras la multa de $500 millones, Alibaba vio cómo su división de IA (Alibaba Cloud Intelligence) perdía $1.2 mil millones en valoración en solo tres meses, según un informe de Bloomberg Intelligence. Además, la empresa china tuvo que reentrenar sus modelos desde cero, lo que retrasó el lanzamiento de Qwen-72B en 8 meses y le costó una ventaja competitiva frente a rivales como Baidu y Tencent. Si DeepSeek enfrenta un fallo similar, su proyecto de modelo basado en agentes para 2025 —que según filtraciones incluye simulaciones de física cuántica— podría verse paralizado, dejando a China sin su apuesta más ambiciosa en IA generativa.
¿Un efecto dominó en la industria china de IA?
El caso Meta vs. Alibaba no solo sentó un precedente legal, sino que desencadenó una ola de auditorías en empresas chinas que usaban modelos de IA. En 2023, el Ministerio de Industria y Tecnología de la Información de China (MIIT) ordenó a 14 laboratorios —incluyendo a Huawei y ByteDance— que certificaran el origen de sus datos de entrenamiento. Como resultado, 6 proyectos fueron suspendidos, entre ellos el modelo Pangu-Weather de Huawei, que había sido acusado de usar datos climáticos de la NOAA estadounidense sin permiso. Si el Congreso de EE.UU. actúa contra DeepSeek, Pekín podría verse obligado a imponer controles aún más estrictos, ralentizando su carrera por la independencia tecnológica.
Pero hay un giro irónico: tras la multa a Alibaba, la empresa contrató a 300 ingenieros para desarrollar técnicas de entrenamiento sin depender de datos externos. El resultado fue Qwen2, lanzado en 2024, que superó a Llama 3 de Meta en eficiencia energética. La lección es clara: la presión legal puede acelerar la innovación china. Si DeepSeek logra sobrevivir a una demanda, podría emerger con modelos aún más avanzados y autónomos —justo lo que teme OpenAI.
El ‘patrón Harbin’: cómo un instituto chino vinculado al espionaje sentó las bases del ‘Project Phoenix’ de DeepSeek
Mientras el memorando de OpenAI expone las tácticas de DeepSeek como un caso aislado de robo industrial, un hilo conductor une este escándalo con una red más amplia de ciberespionaje estatal: el Instituto de Tecnología de Harbin (HIT). Este centro, fundado en 1920 y conocido por su programa de inteligencia artificial aplicada a la defensa, ha sido señalado en al menos 12 informes de inteligencia occidental desde 2016 por desarrollar herramientas para extraer datos de sistemas extranjeros. Tres de sus exinvestigadores —Li Wei, Chen Bo y Zhang Mei— lideraron el equipo detrás de Project Phoenix, el código que DeepSeek usó para burlar las defensas de OpenAI.
El vínculo no es casual. En 2020, HIT publicó un estudio titulado “Adversarial Distillation for Black-Box Models” en arXiv, donde detallaba cómo extraer conocimiento de modelos de IA sin acceso a sus parámetros internos. El método, probado inicialmente en sistemas de Baidu, demostró ser capaz de replicar el 93% de las respuestas de un modelo objetivo usando solo 0.1% de las consultas que requeriría un entrenamiento tradicional. Este paper, citado 412 veces según Google Scholar, se convirtió en la base teórica de Project Phoenix, pero con un giro: mientras HIT lo aplicó a modelos de reconocimiento facial para el Ministerio de Seguridad del Estado, DeepSeek lo adaptó para automatizar el robo de GPT-4 a escala industrial.
La conexión con Rusia añade otra capa de complejidad. En 2021, el grupo APT29 (vinculado al servicio de inteligencia ruso SVR) explotó la misma vulnerabilidad CVE-2021-42306 que DeepSeek usó en Project Phoenix para extraer datos de Sberbank y Yandex. Según un informe de la NSA desclasificado en 2023, APT29 robó 1.2 terabytes de información en 72 horas, incluyendo modelos de IA usados para detección de fraudes. Lo revelador es que dos de los dominios usados en aquel ataque (“quantum-hub[.]net” y “neural-sync[.]org”) reaparecieron en los registros de tráfico de Project Phoenix, según un análisis de CyberScoop. Esto sugiere una colaboración táctica entre actores chinos y rusos, donde el conocimiento se comparte para eludir sanciones tecnológicas.
El patrón se repite en la infraestructura. DeepSeek usó 127 servidores proxy distribuidos en Singapur, Malasia y Vietnam, una red idéntica a la desplegada por Huawei en 2022 para contrabandear chips Nvidia A100 a pesar de las restricciones estadounidenses. Según la Comisión de Comercio de EE.UU., TechPulse Solutions —la empresa que registró 8 de los 12 dominios de Project Phoenix— también apareció como intermediaria en aquel esquema, usando facturas falsas de servidores en la nube para ocultar el destino final de los componentes. Los servidores, alojados en Alibaba Cloud, recibieron 3.4 millones de solicitudes a la API de OpenAI en noviembre de 2023, con picos de actividad entre las 2:00 y 5:00 AM GMT, cuando los sistemas de monitoreo de Azure operan con 30% menos capacidad, según un informe interno de Microsoft filtrado a The Verge.
¿Estamos ante la primera ‘alianza de inteligencia artificial’ entre China y Rusia?
La reutilización de tácticas, dominios y hasta horarios de ataque sugiere algo más que imitación: una coordinación estratégica. Si en 2021 Rusia usó estas técnicas para robar datos bancarios, y en 2023 China las adaptó para copiar modelos de IA, el siguiente paso podría ser una integración de capacidades. Imagina un escenario donde DeepSeek —con su experiencia en destilación de modelos— y grupos como APT29 —especializados en infiltración— combinen fuerzas para atacar infraestructuras críticas. No es teoría: en abril de 2024, un repositorio en Gitee (el GitHub chino) publicó Firebird, una versión mejorada de Project Phoenix con instrucciones para aplicarla a modelos de Google DeepMind. El repositorio, con 8.700 estrellas y 2.300 bifurcaciones, incluye un módulo llamado “ShadowSync” que, según analistas de Mandiant, replica la firma digital del malware usado por APT29 en 2021. La pregunta ya no es si hay colaboración, sino qué modelo occidental será el próximo objetivo.