High-Flyer, el fondo cuantitativo de IA detrás de la china DeepSeek

Por Eduardo Baptista

PEKÍN, 29 ene (Reuters) – El fondo de cobertura cuantitativo High-Flyer amasó una cartera de 100.000 millones de yuanes (13.790 millones de dólares) usando modelos de inteligencia artificial para tomar decisiones de inversión, pero en 2023 decidió cambiar de rumbo para centrarse en el desarrollo de la IA más de punta.

En una publicación en su cuenta oficial de WeChat, Hangzhou Huanfang Technology Ltd Co, como se llama oficialmente la empresa, dijo que se abocaría a buscar una inteligencia artificial general (IAG).

“High-Flyer concentrará sus recursos y su fuerza, se dedicará por completo, a servir a la tecnología de IA que beneficia a toda la humanidad, creará un nuevo grupo de investigación independiente y explorará la esencia de la IAG”, afirmó la empresa.

OpenAI, respaldada por Microsoft y que desarrolló ChatGPT, define la IAG como sistemas autónomos que superan a los humanos en la mayoría de las tareas económicamente valiosas.

Se trata de la próxima generación de modelos de IA y, en una publicación en X la semana pasada, el presidente ejecutivo de OpenAI, Sam Altman, afirmó que su empresa aún no había alcanzado ese hito.

El grupo de investigación independiente previsto por High-Flyer era DeepSeek, cuyos modelos han sacudido el sector tecnológico mundial en las últimas semanas. Liang Wenfeng, fundador y accionista mayoritario de High-Flyer, es también el líder de DeepSeek.

La sofisticación de los modelos de DeepSeek ha sido ampliamente elogiada por sus competidores de Silicon Valley, una primicia para un modelo chino de IA, pero las afirmaciones de la empresa emergente de que utilizaba una fracción de la potencia de cálculo desplegada por las principales empresas estadounidenses para sus propios modelos provocaron una caída de las acciones tecnológicas en todo el mundo.

No está claro hasta qué punto DeepSeek está cerca de desarrollar un modelo IAG.

Si bien el éxito de DeepSeek parece haber sucedido casi de la noche a la mañana, High-Flyer muestra cómo este meteórico ascenso se ha gestado a lo largo de más de una década.

Bajo el liderazgo de Liang, el fondo pasó años estudiando y experimentando con modelos de IA en el extranjero, aplicando esta tecnología a su negocio e invirtiendo decenas de millones de dólares en chips Nvidia de gama alta para proporcionar la potencia de computación necesaria para apoyar esta estrategia centrada en la IA, según una revisión de Reuters de los sitios web y las cuentas oficiales de WeChat de High-Flyer.

GRUPOS DE SUPERCOMPUTACIÓN

La inversión incluye la construcción de dos clústeres de supercomputación de IA, compuestos en su totalidad por los potentes chips A100 de Nvidia, que Washington prohibió exportar a China en septiembre de 2022.

Los clústeres A100 de High-Flyer se construyeron y pusieron en funcionamiento mucho antes de que se anunciaran los controles de exportación. Su primer clúster, compuesto por 1.100 chips A100, costó 200 millones de yuanes y se puso en funcionamiento en 2020, mientras que su segundo clúster, compuesto por unos 10.000 chips A100, se completó un año después con un costo de 1.000 millones de yuanes, según el sitio web de la empresa y varias publicaciones de WeChat.

En 2022, los investigadores de IA de High-Flyer presentaron en una conferencia de Nvidia una estrategia que la empresa había desarrollado para maximizar la eficiencia del segundo clúster a la hora de entrenar modelos de IA.

No está claro cuánto ha invertido High-Flyer en DeepSeek. High-Flyer tiene una oficina en el mismo edificio que DeepSeek y también es propietaria de patentes relacionadas con clústeres de chips utilizados para entrenar modelos de IA.

Liang tiene una participación del 55% en la empresa privada High-Flyer y posee el 99% de los derechos de voto, según los registros corporativos chinos. Las acciones restantes están en manos de otros ejecutivos del fondo.

Hasta ahora, DeepSeek ha dicho que usa los chips H800 y H20 de Nvidia, mucho menos potentes, para entrenar su modelo DeepSeek-V3 y su predecesor DeepSeek-V2, que desencadenó una guerra de precios de modelos de IA en China cuando salió a la venta el pasado mes de mayo.

Sin embargo, algunos ejecutivos tecnológicos han afirmado públicamente que DeepSeek dispone de mucha más potencia de cálculo.

El presidente ejecutivo de Scale AI, Alexandr Wang, dijo el jueves durante una entrevista con CNBC, sin pruebas, que DeepSeek dispone de 50.000 chips Nvidia H100, que según él no se revelaron porque eso violaría los controles de exportación de Washington, que prohibió la exportación de chips H100 a China al igual que los menos potentes A100.

DeepSeek no respondió a la solicitud de comentarios sobre la acusación. Nvidia tampoco respondió inmediatamente a un correo electrónico en el que se le pedían comentarios.

Pero la preocupación de Liang por la potencia de cálculo al hablar del futuro de DeepSeek se hace eco de la inversión masiva de su fondo cuántico en clusters de IA. En una entrevista concedida al medio de comunicación chino Waves en julio, Liang respondió a la pregunta de si High-Flyer tenía previsto separar DeepSeek de la empresa y sacarla a bolsa.

“No tenemos planes de recaudar dinero a corto plazo, el problema al que nos enfrentamos nunca ha sido el dinero, sino el embargo de chips de gama alta”

(1 dólar = 7,2507 yuanes chinos)

(Reporte de Eduardo Baptista; edición en español de Javier López de Lérida)

tagreuters.com2025binary_LYNXNPEL0S0KL-VIEWIMAGE