Alibaba publica un modelo de inteligencia artificial que dice que supera a DeepSeek-V3

Por Eduardo Baptista

PEKÍN, 29 ene (Reuters) – La empresa tecnológica china Alibaba lanzó el miércoles una nueva versión de su modelo de inteligencia artificial Qwen 2.5 que, afirmó, supera al aclamado DeepSeek-V3.

El inusual momento de la presentación de Qwen 2.5-Max, el primer día del Año Nuevo Lunar, cuando la mayoría de los chinos no trabajan y están con sus familias, apunta a la presión que el meteórico ascenso de la empresa china de inteligencia artificial DeepSeek en las últimas tres semanas ha ejercido no sólo sobre sus rivales extranjeros, sino también sobre su competencia nacional.

“Qwen 2.5-Max supera prácticamente a GPT-4o, DeepSeek-V3 y Llama-3.1-405B”, afirma la unidad de nube de Alibaba en un anuncio publicado en su cuenta oficial de WeChat, en referencia a los modelos de IA de código abierto más avanzados de OpenAI y Meta.

El lanzamiento el 10 de enero del asistente de IA de DeepSeek, basado en el modelo DeepSeek-V3, así como el lanzamiento el 20 de enero de su modelo R1, han conmocionado a Silicon Valley y han provocado el desplome de las acciones tecnológicas. Los supuestos bajos costos de desarrollo y uso de la empresa emergente china han llevado a los inversores a cuestionar los enormes planes de gasto de las principales empresas de IA de Estados Unidos.

Pero el éxito de DeepSeek también ha provocado una lucha entre sus competidores nacionales por mejorar sus propios modelos de IA.

Dos días después del lanzamiento de DeepSeek-R1, ByteDance, propietaria de TikTok, publicó una actualización de su modelo insignia de IA, que, según afirmaba, superaba al o1 de OpenAI, respaldado por Microsoft, en AIME, una prueba de referencia que mide la capacidad de los modelos de IA para comprender y responder a instrucciones complejas.

DeepSeek afirma que su modelo R1 rivaliza con el o1 de OpenAI en varias pruebas de rendimiento.

DEEPSEEK FRENTE A LOS COMPETIDORES NACIONALES

El predecesor del modelo V3 de DeepSeek, DeepSeek-V2, desencadenó una guerra de precios de modelos de IA en China tras su lanzamiento el pasado mes de mayo.

El hecho de que DeepSeek-V2 fuera de código abierto y tuviera un precio sin precedentes, sólo 1 yuan (0,14 dólares) por 1 millón de tokens -o unidades de datos procesados por el modelo de IA-, llevó a la unidad en la nube de Alibaba a anunciar recortes de precios de hasta el 97% en una serie de modelos.

Otras empresas tecnológicas chinas siguieron su ejemplo, como Baidu, que lanzó el primer equivalente chino a ChatGPT en marzo de 2023, y la empresa de Internet más valiosa del país, Tencent.

Liang Wenfeng, el enigmático fundador de DeepSeek, dijo en julio, en una rara entrevista con el medio chino Waves, que a la empresa emergente “no le importaba” la guerra de precios y que su principal objetivo era lograr la AGI (inteligencia artificial general).

OpenAI define la AGI como sistemas autónomos que superan a los humanos en la mayoría de las tareas de valor económico.

Mientras que grandes empresas tecnológicas chinas como Alibaba tienen cientos de miles de empleados, DeepSeek funciona como un laboratorio de investigación, formado principalmente por jóvenes licenciados y estudiantes de doctorado de las mejores universidades chinas.

Liang dijo en su entrevista de julio que creía que las mayores empresas tecnológicas chinas podrían no ser adecuadas para el futuro de la industria de la IA, contrastando sus elevados costos y sus estructuras jerárquicas con el funcionamiento ágil y el estilo de gestión flexible de DeepSeek.

“Los grandes modelos fundacionales requieren una innovación continua, las capacidades de los gigantes tecnológicos tienen sus límites”, afirmó.

(Reporte de Eduardo Baptista; Editado en Español por Ricardo Figueroa)

Read more