DeepSeek, la “búsqueda profunda” china en la carrera tecnológica y digital

142

Paula Giménez y Matías Caciabue

El reciente lanzamiento de DeepSeek (“búsqueda profunda”, en inglés) ha sacudido el escenario mundial de despliegue intensivo y extensivo del sector tecnológico que acaparó la mirada (y las finanzas) de los últimos dos años: la Inteligencia Artificial.

Desarrollada por High-Flyer Capital Management, esta innovación tecnológica china ha generado un impacto considerable, tanto en el ámbito económico como en el geopolítico, situando a China en una posición disruptiva frente a Estados Unidos en la carrera por “ganar el siglo XXI”, que llevaba la delantera en el desarrollo de modelos de IA de acceso masivo.DeepSeek AI Agent Price Soars 1,174%, But Traders Buy A Rival

DeepSeek, un modelo IA de código abierto, ha superado a sus principales competidores occidentales en varios aspectos técnicos, incluyendo eficiencia energética, capacidad de procesamiento y costos de operación. A diferencia de modelos previos como GPT-4 de OpenAI o LLaMA-3 de Facebook-Meta, DeepSeek utiliza una arquitectura basada en el ‘modelo de experto’, lo que le permite activar modos específicos para tareas concretas, optimizando así su desempeño y reduciendo la carga computacional.

Esta capacidad ha permitido que empresas tecnológicas chinas como Huawei y Alibaba anuncien rápidamente su adopción para mejorar sus procesos productivos. No obstante, el éxito de DeepSeek no es solo el resultado de un avance puntual, sino el reflejo de una estrategia integrada del despliegue económico chino para disputar la hegemonía tecnológica en el marco del denominado Enfrentamiento del G2.

El factor distintivo del lanzamiento de ésta IA tiene que ver con haber hecho público el modo de entrenamiento del modelo. DeepSeek no es el primer modelo de IA de código abierto en el mercado. Sin ir más lejos, muchos de los modelos LlaMa (cuyo dueño es Meta) han sido de código abierto. Pero el paper de lanzamiento de la versión de DeepSeek anunciada a principios de este año incluyó, como novedad, la publicación de los modos de entrenamiento del modelo, basados en resultados destilados de otros modelos más grandes (principalmente Qwen, de Alibaba, y Llama, de Meta).

Llama 3 vs Qwen 2: The Best Open Source AI Models of 2024 | by Novita AI |  MediumEs decir, la disrupción generada por este lanzamiento no sólo tuvo que ver con la posibilidad de entrenar un modelo superior a otros en muchos aspectos, y con una infraestructura digital (hardware) mucho menos costosa, con mayor eficiencia energética, entre otras virtudes, sino que además fue entrenado de una manera cualitativamente distinta a los modelos que logró superar.

Sin ir más lejos, su lanzamiento se realizó pocos días después de otro evento de gran relevancia geopolítica mundial: el anuncio de apoyo de Donald Trump al Stargate Project, el mega plan de OpenAIOracle y SoftBank que contempla una inversión en EEUU de 500.000 millones de dólares en cuatro años.

Lejos de ser un desarrollo aislado, DeepSeek representa la convergencia de esfuerzos financieros, tecnológicos y estatales chinos, en una clásica dinámica económica de desarrollo desigual y combinado, donde el gigante asiático intenta, todavía corriendo desde atrás, consolidar sus capacidades tecnológicas y productivas para ganar el siglo XXI.

*Giménez es Licenciada en Psicología y Magister en Seguridad y Defensa de la Nación y en Seguridad Internacional y Estudios Estratégicos, Directora de NODAL. Caciabue es Licenciado en Ciencia Política. Ambos son investigadores del Centro Latinoamericano de Análisis Estratégico (CLAE).