
DeepSeek: el ‘momento Sputnik’ para la IA global
Si has estado pendiente de las últimas noticias en inteligencia artificial, probablemente te hayas topado con el nombre DeepSeek. Esta joven startup china, fundada en 2023 por Liang Wenfeng, acaba de dar un golpe sobre la mesa con el lanzamiento de DeepSeek-R1, un modelo de lenguaje avanzado que, a pesar de competir directamente con gigantes occidentales, ha logrado desarrollarse con un presupuesto sorprendentemente más reducido. ¿La clave? Una forma diferente de entender la IA y un aprovechamiento mucho más inteligente de los recursos computacionales.
El modelo DeepSeek-R1 se ha ganado la atención de la industria gracias a su capacidad de razonamiento y a que no depende de grandes cantidades de hardware especializado (empujada por las restricciones impuestas a China en la importación de microchips). En lugar de requerir un arsenal de chips de alto rendimiento, este modelo ha adoptado una estrategia de entrenamiento optimizada que reduce la necesidad de infraestructura costosa. Dicho de otro modo, los responsables de DeepSeek han perfeccionado la forma de entrenar el modelo, sacando más partido al aprendizaje por refuerzo para que la IA vaya desarrollando comportamientos complejos de forma progresiva. La consecuencia inmediata ha sido un ahorro significativo en costes de desarrollo y despliegue, una noticia que no ha pasado desapercibida en los mercados financieros, donde las acciones de algunas empresas de procesadores (Nvidia, por ejemplo) han sufrido pérdidas muy numerosas tras el anuncio.
DeepSeek ha optado por la filosofía de código abierto, lo que abre un nuevo abanico de dudas y reflexiones
Y aunque esto ha sido lo más llamativo, haciendo pensar en un empeoramiento de las perspectivas del sector, realmente puede ser todo lo contrario ya que todo esto ha vuelto a poner sobre la mesa la paradoja de Jevons, esa teoría del siglo XIX que nos recuerda que mejorar la eficiencia de un recurso a menudo termina aumentando su consumo. En el mundo de la IA, esto podría significar que, si crear y utilizar estos modelos es cada vez más barato y sencillo, la demanda de aplicaciones y servicios basados en inteligencia artificial crecerá como la espuma, disparando el uso de recursos computacionales. Así que, en lugar de calmar nuestra sed de capacidad de procesamiento, inventos como DeepSeek-R1 podrían, de hecho, estimularla aún más, planteando además preguntas acerca del impacto medioambiental que conlleva tanto gasto energético.
Por si fuera poco, DeepSeek ha optado por la filosofía de código abierto, lo que abre un nuevo abanico de dudas y reflexiones. Por un lado, la transparencia suele ser bienvenida en cualquier proyecto tecnológico. Por otro, hablamos de una empresa que opera en China y que, según algunos informes, mantiene lazos con infraestructuras estatales, lo que podría implicar tensiones sobre propiedad intelectual o la privacidad de los datos. Al final, cualquier negocio que quiera integrar esta tecnología tendría que valorar detenidamente riesgos y beneficios, sobre todo cuando está en juego la seguridad de la información.
Para muchos analistas, la entrada de DeepSeek en el circuito de la IA supone un auténtico ‘momento Sputnik’: ese instante que marca un antes y un después y que puede acelerar la competencia y la innovación a un ritmo frenético. Bien podría repetirse el fenómeno que vimos en anteriores revoluciones tecnológicas, cuando gobiernos, inversores y empresas se volcaron en nuevas investigaciones y alianzas para no quedarse atrás. En este contexto, la eficiencia y la ética se convierten en los pilares sobre los que la IA deberá sostener su rápido crecimiento, una vez que parece claro que jugará un papel crucial en el futuro de la economía, la seguridad y, en definitiva, de la sociedad en su conjunto.