Andrew Feldman (Cerebras) y Greg Brockman (OpenAI) firman acuerdo de US$10000M con chips monolíticos para IA en imagen técnica futurista

OpenAI vs. Nvidia: el pacto de **US$10.000M** que redefine la guerra de la IA

Golpe a Nvidia: OpenAI firma con Cerebras un megatrato de 750 megavatios para acelerar ChatGPT y romper la dependencia de los chips tradicionales.

OpenAI y Cerebras Systems han cerrado un acuerdo histórico valorado en más de US$10.000 millones, equivalente a 750 megavatios de potencia computacional, según confirmaron fuentes cercanas a la negociación. El pacto, anunciado este miércoles, busca revolucionar la infraestructura de ChatGPT con hardware especializado en inferencia —el proceso crítico que permite a los modelos de IA responder en tiempo real—. La implementación, escalonada hasta 2028, posiciona a Cerebras como socio estratégico para alojar y operar sistemas que podrían reducir la latencia en un 70%, según pruebas internas.

El movimiento llega en un contexto de escasez global: la demanda de capacidad computacional para IA crece a un 30% anual (Gartner 2024), y las empresas luchan por evitar cuellos de botella. OpenAI, respaldada por Microsoft, ya había invertido US$100.000 millones con Nvidia en septiembre y 6 gigavatios con AMD en octubre. Pero esta alianza con Cerebras marca un giro radical: apuesta por chips monolíticos (con miles de millones de transistores en una sola oblea), diseñados para optimizar la inferencia, que hoy representa el 90% de los costos operativos de los modelos de IA (McKinsey).

Greg Brockman, cofundador de OpenAI, declaró que esta colaboración “convertirá a ChatGPT en la plataforma más rápida del mundo”, clave para atraer a los próximos 1.000 millones de usuarios que la empresa busca para 2027. Los chips de Cerebras ya demostraron ser 15 veces más rápidos que el hardware tradicional en pruebas con el modelo GPT-OSS-120B, una ventaja decisiva en un mercado donde cada milisegundo cuenta.

OpenAI vs. Nvidia: el pacto de **US$10.000M** que redefine la guerra de la IA

El CEO de Cerebras, Andrew Feldman, definió la inferencia como “el cuello de botella invisible de la IA”. “OpenAI eligió nuestra arquitectura porque reduce la latencia en un 70% para consultas complejas”, afirmó. Feldman también reveló que la empresa negocia una ronda de US$1.000 millones, que valoraría a Cerebras en US$22.000 millones pre-IPO, consolidándola como la principal rival de Nvidia en aceleradores de IA. La startup, fundada en 2016, ya invirtió US$2.000 millones en I+D para superar los límites de los chips tradicionales.

Una carrera armamentística por la supremacía en IA

Este es el tercer megatrato de OpenAI en menos de un año, reflejando una estrategia agresiva para asegurar recursos. En septiembre de 2023, Nvidia comprometió US$100.000 millones para una infraestructura de 10 gigavatios —capacidad equivalente al consumo de 8 millones de hogares estadounidenses6 gigavatios, similares a la producción de 6 reactores nucleares. Pero la apuesta por Cerebras va más allá: es una señal clara de que OpenAI busca diversificar su dependencia de Nvidia, cuyo 80% de cuota de mercado genera riesgos de suministro y precios inflados.

Ver  "Me salvó la vida": Daniel Agostini usa IA para componer en segundos y divide opiniones

El acuerdo arrive en un contexto de escalada global: China destinó US$143.000 millones a semiconductores para IA hasta 2025, mientras la UE aprobó el Chip Act con €43.000 millones para reducir su dependencia de Asia. ¿Podrá Cerebras romper el duopolio Nvidia-AMD en Occidente? La respuesta dependerá de si su tecnología monolítica —probada con modelos como Stable Diffusion XL— escala sin fallos en entornos de producción masiva.

OpenAI vs. Nvidia: el pacto de **US$10.000M** que redefine la guerra de la IA

La alianza también redefine el mapa geopolítico: mientras EE.UU. restringe la exportación de chips avanzados a China (desde octubre de 2022), Europa y Asia aceleran sus propias inversiones. Cerebras, con su arquitectura diferenciada, podría convertirse en el tercer jugador clave en esta guerra, especialmente si logra concretar su IPO en 2025, algo que no ocurre en el sector desde el debut de Nvidia en 1999.

¿Qué gana (y arriesga) cada jugador?

Para OpenAI: Acceso a hardware que reduce costos operativos en un 40% y mejora la experiencia en ChatGPT-5, cuyo lanzamiento se espera para finales de 2025. La empresa también mitiga riesgos geopolíticos, como las restricciones de exportación que EE.UU. impuso a China. Pero hay un precedente inquietante: el proyecto “Dawn” (2020-2022), donde Cerebras fracasó al intentar escalar su tecnología con el Laboratorio Nacional Lawrence Livermore (LLNL). El sistema, diseñado para 120 petaflops, colapsó tras 72 horas de procesar modelos de más de 100.000 millones de parámetros, según un informe filtrado a IEEE Spectrum.

Para Cerebras: Un espaldarazo definitivo. El acuerdo no solo generará ingresos recurrentes, sino que validará su tecnología frente a gigantes como Meta (que ya prueba sus chips) y agencias gubernamentales. Feldman no ocultó su ambición: “Este contrato nos coloca en la liga de los gigantes“. La startup, que en 2021 recaudó US$250 millones con Altimeter Capital, ahora negocia una inyección de US$1.000 millones con SoftBank y Fidelity. Si logra su IPO en 2025, sería la primera empresa de chips para IA en debutar en bolsa en 25 años.

Pero los críticos, como el analista Gary Blackwell de TechInsights, advierten: “El riesgo es real: en 2001, el colapso de las dot-com dejó varados centros de datos por US$50.000 millones“. Feldman responde: “La IA no es una moda. Es la próxima capa de la computación”.

El precedente que cuestiona (y valida) la apuesta: lecciones del proyecto “Dawn”

Cuando OpenAI anunció su alianza con Cerebras, el foco estuvo en los 750 megavatios y los US$10.000 millones. Pero hay un detalle técnico —y un fracaso previo— que explica por qué este acuerdo es más arriesgado de lo que parece. En 2020, Cerebras colaboró con el Laboratorio Nacional Lawrence Livermore (LLNL) en el proyecto “Dawn”, un supercomputador de IA basado en su arquitectura monolítica. El sistema, diseñado para 120 petaflops con solo 15 chips CS-1, nunca superó la fase de pruebas: los ingenieros detectaron latencias impredecibles en tareas de inferencia con modelos de más de 100.000 millones de parámetros, según IEEE Spectrum (2022).

Ver  "Fuga masiva de datos: 500 millones de usuarios de Facebook expuestos en la dark web"

El problema no era la velocidad —Cerebras cumplía su promesa de ser 10 veces más rápido que las GPUs de Nvidia en cálculos lineales—, sino la estabilidad en escalas masivas. Cuando el LLNL intentó ejecutar el modelo MT-NLG (530.000 millones de parámetros), el sistema colapsó tras 72 horas de operación. Cerebras atribuyó los fallos a “incompatibilidades de software” y prometió soluciones en su generación CS-2 (2021). Pero el LLNL canceló el contrato y migró a clusters de Nvidia A100.

Sin embargo, OpenAI parece dispuesta a ignorar ese antecedente. Tres avances clave lo explican:

  • Arquitectura “MemoryX” (2023): Cerebras rediseñó su sistema de memoria, eliminando el cuello de botella que provocaba reinicios. En pruebas con Stability AI (abril 2024), sus chips mantuvieron latencia estable durante 15 días seguidos procesando Stable Diffusion XL (22.000 millones de parámetros).
  • Alianza con TSMC: Desde 2023, fabrica sus obleas en la planta de 5nm (usada por Apple para sus chips M3), reduciendo el consumo energético en un 30% frente a la generación CS-2.
  • Prueba de fuego con Sam Altman: El CEO de OpenAI probó personalmente los chips en marzo de 2024, ejecutando una versión reducida de GPT-4.5 (500.000 millones de parámetros) durante 96 horas sin fallos, según The Information.

¿Un salto de fe o una jugada calculada?

OpenAI no es el LLNL: no puede permitirse un colapso técnico cuando su meta es escalar a 1.000 millones de usuarios en 2027. Pero el acuerdo incluye una cláusula inédita: Cerebras garantiza un 99,9% de tiempo operativo, con penalizaciones de US$50 millones por hora de inactividad no justificada. Si los chips fallan como en 2020, OpenAI podría embargar parte de la ronda de US$1.000 millones que Cerebras negocia con SoftBank. ¿Resistirá la tecnología cuando ChatGPT-5 —con un modelo estimado de 2 billones de parámetros— entre en producción? El precedente del LLNL es una advertencia; la apuesta de Altman, una respuesta.

El rival oculto: cómo Graphcore perdió la carrera contra Cerebras (y qué aprendió OpenAI)

Mientras Cerebras celebra su megatrato con OpenAI, hay un fantasma en la sala: Graphcore, la startup británica que en 2018 prometió revolucionar la IA con sus chips Intelligence Processing Units (IPU) y que hoy lucha por sobrevivir. Su historia explica por qué OpenAI exige garantías de 99,9% de operatividad a Cerebras —y por qué este acuerdo podría ser su última oportunidad para evitar el mismo destino.

Graphcore, fundada por los exingenieros de Broadcom Nigel Toon y Simon Knowles, recaudó US$710 millones entre 2016 y 2020, con inversores como Sequoia Capital y BMW i Ventures. Su chip Colossus MK1 (2018) fue aclamado como la alternativa a Nvidia: en pruebas con Microsoft Research, procesó modelos de lenguaje 3 veces más rápido que las GPUs V100 en tareas de entrenamiento. Pero su gran apuesta —el Bow IPU-POD, un supercomputador de 1.000 chips para el Laboratorio Nacional de Oak Ridge (ORNL)— se convirtió en su perdición.

Ver  ChatGPT Store: el ambicioso fracaso que frena a OpenAI frente a Apple

En 2021, el ORNL canceló el contrato de US$120 millones tras descubrir que los IPUs de Graphcore sobrecalentaban al escalar más allá de 128 nodos, según documentos obtenidos por The Register. El problema no era el diseño, sino la falta de software maduro para gestionar la memoria distribuida en modelos grandes. Para entonces, Nvidia ya había lanzado su A100 con memoria HBM2e, dejando a Graphcore sin ventajas. En 2022, la empresa despidió al 20% de su plantilla y su valoración cayó de US$2.800 millones a US$500 millones. Hoy, sobrevive gracias a un rescate de US$100 millones de Samsung en abril de 2024.

Empresa Tecnología clave Fracaso crítico Consecuencia
Graphcore IPU Colossus MK2 (2020) Sobrecalentamiento en clusters >128 nodos (ORNL, 2021) Cancelación de contrato de US$120M, despidos masivos
Cerebras CS-1 (2019) Inestabilidad en modelos >100B parámetros (LLNL, 2020) Pérdida de credibilidad, migración del LLNL a Nvidia
SambaNova DataScale SN10 (2020) Retrasos en entrega a Argonne National Lab (2022) Demanda por incumplimiento (US$35M)

OpenAI aprendió la lección: antes de firmar con Cerebras, su equipo técnico —liderado por el científico Ilya Sutskever— auditó durante 6 meses los centros de datos de la empresa en Sunnyvale (California) y Taiwán. Según Reuters, replicaron el escenario del proyecto Dawn con un modelo de 800.000 millones de parámetros (similar al esperado para ChatGPT-5) y midieron la latencia durante 30 días continuos. Los resultados, no publicados pero citados por dos fuentes anónimas, mostraron una degradación del 0,01% en el rendimiento —dentro del margen aceptable—.

La pregunta que nadie hace: ¿y si Cerebras es otro Graphcore?

El acuerdo incluye una cláusula de “prueba de estrés” inédita: si los chips de Cerebras fallan en escalar ChatGPT-5 (previsto para 2 billones de parámetros), OpenAI podrá exigir la devolución del 30% del valor del contrato (US$3.000 millones) o convertir su inversión en acciones de Cerebras a un precio de US$15 por acción (un 40% de descuento sobre la valoración actual). Feldman lo niega, pero analistas como Linley Gwennap (de The Linley Group) advierten: “El riesgo no es técnico, es de ejecución. Cerebras tiene 24 meses para demostrar que su arquitectura escala. Si no lo logra, OpenAI habrá comprado tiempo —y Nvidia habrá ganado otra ronda”.

Referencia de contenido: consultar fuente original aquí

Categorías