Roy Lee, CEO de Cluely, confiesa en TechCrunch Disrupt 2025 la manipulación del ARR de su startup de IA

ARR: la métrica de IA que todos usan (y nadie fía en Silicon Valley)

Números inflados: El fundador de una startup respaldada por Andreessen Horowitz admitió mentir sobre su ARR, exponiendo el lado oscuro de la métrica estrella de la IA.

El escándalo estalló a principios de mes cuando Roy Lee, cofundador de Cluely —una empresa con el polémico lema “Haz trampas en todo”—, confesó en X (antes Twitter) que había exagerado los ingresos recurrentes anuales (ARR) de su compañía a un medio especializado. Según declaró inicialmente a TechCrunch, los ARR de Cluely se habían duplicado en una semana hasta US$7 millones. Horas después, rectificó: la cifra real era de US$5,2 millones, y calificó su declaración previa como “algunas BS” (siglas en inglés para bullshit). “Fue la única cosa descaradamente deshonesta que he dicho públicamente”, escribió, acompañando su mea culpa con un tono que mezclaba cinismo y desafío.

El caso de Lee, aunque extremo por su franqueza, no es aislado. En el ecosistema de startups de inteligencia artificial, manipular el ARR se ha convertido en un modus operandi casi aceptado, advierten inversores y expertos. Esta métrica —que proyecta los ingresos mensuales recurrentes a 12 meses— es omnipresente en pitches a inversores, pero su flexibilidad la hace tan maleable como poco confiable. “Es el Salvaje Oeste”, resume Chuck Eesley, profesor de gestión en Stanford. “No hay auditorías obligatorias ni definiciones regulatorias. Solo los fondos de capital riesgo (VC) y los posibles compradores hacen due diligence, pero el número puede significar lo que el fundador necesite que signifique”.

ARR: la métrica de IA que todos usan (y nadie fía en Silicon Valley)

El ARR se calcula multiplicando los ingresos mensuales de contratos recurrentes por 12. Sin embargo, su simplicidad es engañosa. No debe confundirse con los ingresos anuales de ejecución (también ARR en inglés), una métrica similar que incluye ventas no recurrentes. Empresas como Anthropic, Glean o Cursor —esta última considerada la startup de crecimiento más rápido en ingresos de la historia— lo usan para medir productos individuales o ventas globales. Incluso los ARR de OpenAI por herramientas específicas son escrutados por medios y analistas. Pero su utilidad está en entredicho.

¿Por qué el ARR ya no funciona para la IA?

Hasta hace poco, el ARR era un estándar fiable para empresas de software con modelos de suscripción predecibles, explica Darren Yee, inversor en el Innovation Venture Fund de la NYU. “Funcionaba cuando los precios eran simples y estables”, señala. Pero la IA lo cambió todo. Hoy, tres factores distorsionan la métrica:

  1. Clientes experimentales: Muchas empresas prueban herramientas de IA con presupuestos de innovación, pero abandonan el servicio tras el periodo de prueba. “Esos ingresos se contabilizan como “recurrentes” aunque no se renueven”, advierte Eesley. Un ejemplo: en 2023, el 68% de las startups de IA reportaron tasas de cancelación superiores al 20% en sus primeros seis meses, según un informe de CB Insights.
  2. Modelos de pago por uso: Las startups ya no venden suscripciones fijas, sino acceso escalable. “Un cliente puede tener un contrato nominal, pero paga según consumo”, aclara Yee. Esto genera picos de ingresos imposibles de anualizar. Por ejemplo, una empresa podría facturar US$50,000 en un mes por un proyecto puntual, pero solo US$5,000 al siguiente.
  3. Volatilidad semanal: Lee admitió que el ARR de Cluely variaba un 20% de una semana a otra. “¿Cómo anualizas algo que cambia como el clima?”, cuestiona.
Ver  IA vs. superbacterias: el hallazgo que la ciencia tardó 10 años en resolver

El problema se agrava con la falta de transparencia. Mientras las empresas tradicionales auditadas (como las cotizadas en bolsa) deben seguir normas contables estrictas, las startups operan en un vacío regulatorio. “No hay un GAAP para el ARR“, recuerda Sloan, copresidente del grupo de startups en Baker Donelson, refiriéndose a los principios contables generalmente aceptados en EE.UU. Esto deja margen para prácticas creativas, como:

  • Incluir ingresos de pruebas gratuitas como si fueran recurrentes.
  • Extrapolar datos de un solo mes atípico (ej.: un contrato puntual con un gigante tecnológico).
  • Ocultar cancelaciones recientes al calcular la proyección anual.

Alternativas (o la falta de ellas)

Lee no tiene dudas: el ARR es “un número falso desarrollado por falsos contables”. Pero ¿existen métricas mejores? Los expertos dividen las opciones:

Métrica Ventajas Desventajas
MRR (Ingresos Mensuales Recurrentes) Menos distorsión por extrapolación anual. No captura estacionalidad o crecimiento explosivo.
CAC/LTV (Costo de Adquisición vs. Valor de Vida) Mide rentabilidad real por cliente. Difícil de calcular en modelos de pago por uso.
Auditorías externas Credibilidad ante inversores. Coste prohibitivo para startups tempranas (US$20,000-US$50,000).

Eesley advierte contra imponer costes de auditoría a empresas incipientes: “Podríamos ahogar la innovación”. En cambio, Sloan aboga por transparencia radical: “Divulgar demasiado es mejor que ocultar. Si pierdes la confianza de un inversor, no hay marcha atrás”. Un ejemplo reciente: la startup Scale AI tuvo que revisar a la baja sus ARR en un 15% en 2025 tras una auditoría interna, lo que le costó una ronda de financiación.

Ver  🚨 Colapso histórico: ventas de móviles caerán 13% en 2026 por crisis de chips

El futuro: ¿más mentiras o más datos?

El debate sobre el ARR refleja una tensión más amplia en Silicon Valley: ¿crecimiento a cualquier precio o sostenibilidad? Las startups de IA enfrentan una paradoja: los inversores exigen métricas claras, pero los modelos de negocio son demasiado volátiles para medirlos con herramientas antiguas. “Estamos usando un mapa del siglo XIX para navegar un territorio nuevo”, grafica Yee.

Mientras, fundadores como Lee siguen jugando con las reglas. En su correo a Bloomberg, lanzó una pregunta incómoda: “¿Qué coño es el ARR para una empresa con menos de un año?”. La respuesta, hoy, es tan ambigua como los números que pretende medir. ¿Llegará el momento en que los inversores exijan algo más que proyecciones infladas? O, en palabras de Eesley: “¿Estamos financiando innovación o solo ilusiones contables?”

El precedente que nadie menciona: cómo Zenefits y Theranos sentaron las bases del fraude métrico en Silicon Valley

El escándalo de Roy Lee y Cluely no es un caso aislado, sino el último eslabón de una cadena de distorsiones métricas que se remonta a una década. En 2015, Zenefits, un unicornio valorado en US$4.500 millones, admitió que había inflado artificialmente sus ingresos al contar como clientes recurrentes a empresas que apenas usaban su software de recursos humanos. La SEC multó a la compañía con US$980.000 en 2017, pero el daño reputacional fue irreversible: su valoración se desplomó un 48% en menos de un año. Más grave aún fue el caso de Theranos, donde la fundadora Elizabeth Holmes falsificó no solo métricas financieras, sino datos técnicos de su tecnología, llevando a una condena por fraude en 2022. Ambos escándalos demostraron que, cuando las métricas se convierten en el producto, la línea entre optimismo y engaño se desvanece.

Lo que distingue al caso de Cluely es su cinismo explícito. Mientras Zenefits y Theranos ocultaron sus manipulaciones durante años, Lee las confesó en tiempo real, casi como un desafío al sistema. “Es la primera vez que vemos a un fundador admitir abiertamente que el ARR es una farsa antes de que los inversores o reguladores lo descubran”, señala Mira Murati, ex directiva de tecnología de OpenAI y crítica vocal de las métricas opacas en IA. Esta transparencia forzada ha expuesto un problema estructural: según un informe de PitchBook de 2023, el 34% de las startups de IA en etapas tempranas (Seed o Serie A) admitieron en encuestas anónimas haber ajustado sus ARR para atraer inversión, ya sea incluyendo ingresos no recurrentes (42% de los casos) o extrapolando datos de meses atípicos (31%).

Ver  "Futuro IA": OpenAI propone fondos públicos y semanas laborales de 4 días ante el avance tecnológico

El patrón se repite en sectores con alta competencia por capital. En 2021, la startup de logística autónoma Convoy recortó su valoración de US$3.800 millones a US$1.500 millones tras revelarse que su ARR dependía en un 60% de contratos con una sola empresa: Walmart. Cuando el gigante minorista redujo su volumen de pedidos, el ARR de Convoy se evaporó en un trimestre. “El problema no es la métrica en sí, sino que las startups de IA venden promesas, no productos”, advierte Murati. “Cuando tu modelo de negocio se basa en experimentos de clientes que pueden cancelar en cualquier momento, el ARR se convierte en una lotería”.

Empresa Año del escándalo Métrica manipulada Consecuencia inmediata
Zenefits 2015 Ingresos recurrentes (clientes inactivos contabilizados) Multa de la SEC + caída del 48% en valoración
Theranos 2016-2018 Datos de precisión de pruebas + ingresos proyectados Cierre de la empresa + condena penal a su fundadora
Convoy 2021 ARR dependiente de un solo cliente (Walmart) Recorte de valoración del 60% en 6 meses
Cluely 2024 ARR inflado en US$1.8 millones (34% de exageración) Confesión pública sin sanciones (hasta ahora)

La pregunta que nadie se atreve a responder: ¿cuántas startups de IA están repitiendo el patrón de Theranos?

El mea culpa de Lee ha abierto una caja de Pandora. Si una empresa con el lema “Haz trampas en todo” admite manipular sus números, ¿qué están haciendo las que prometen “IA ética” o “transparencia radical”? Los inversores ya están actuando en silencio: fondos como Sequoia Capital y Benchmark han comenzado a exigir a sus portfolio companies de IA que desglosen el porcentaje de ARR proveniente de clientes con más de 12 meses de antigüedad, según filtró The Information la semana pasada. El umbral es revelador: menos del 20% de las startups superan ese filtro. Mientras, en foros privados como Y Combinator’s Founder Network, los debates giran en torno a una pregunta incómoda: ¿Es el ARR de la IA el nuevo subprime de Silicon Valley?—una burbuja construida sobre métricas que todos saben falsas, pero nadie se atreve a cuestionar hasta que sea demasiado tarde.

Referencia de contenido: aquí

Categorías