deepseek
Carlos Gómez Director IA DATA

DeepSeek: o “momento Sputnik” da IA global

Se tem estado atento às últimas notícias sobre inteligência artificial, provavelmente já se cruzou com o nome DeepSeek. Esta jovem startup chinesa, fundada em 2023 por Liang Wenfeng, acaba de fazer furor com o lançamento do DeepSeek-R1, um modelo linguístico avançado que, apesar de competir diretamente com os gigantes ocidentais, conseguiu desenvolver com um orçamento surpreendentemente mais reduzido. O segredo? Uma compreensão diferente da IA e uma utilização muito mais inteligente dos recursos computacionais.


O modelo DeepSeek-R1 ganhou a atenção da indústria devido às suas capacidades de raciocínio e ao facto de não depender de grandes quantidades de hardware especializado (motivado pelas restrições da China às importações de microchips). Em vez de necessitar de um arsenal de chips de alto desempenho, este modelo adotou uma estratégia de aprendizagem otimizada que reduz a necessidade de infraestruturas dispendiosas. Por outras palavras, o DeepSeek aperfeiçoou a forma como o modelo é treinado, recorrendo mais à aprendizagem por reforço para permitir que a IA desenvolva progressivamente comportamentos complexos. A consequência imediata foi uma poupança significativa nos custos de desenvolvimento e implementação, notícia que não passou despercebida nos mercados financeiros, onde as ações de algumas empresas de processadores (Nvidia, por exemplo) sofreram grandes perdas após o anúncio.

DeepSeek has opted for the open source philosophy, which opens up a whole new range of questions and reflections

E, embora este facto tenha sido muito marcante, sugerindo um agravamento das perspetivas para o setor, pode, na verdade, ser o oposto, uma vez que trouxe de volta à mesa o Paradoxo de Jevons, a teoria do século XIX que nos recorda que a melhoria da eficiência de um recurso acaba frequentemente por aumentar o seu consumo. No mundo da IA, isto pode significar que, se a criação e utilização destes modelos se tornar mais barata e mais fácil, a procura de aplicações e serviços baseados em IA irá disparar, aumentando a utilização de recursos computacionais. Assim, em vez de saciar a nossa sede de poder de processamento, invenções como o DeepSeek-R1 podem, na verdade, estimulá-la ainda mais, levantando questões sobre o impacto ambiental de tal gasto de energia.

Para além disso, o DeepSeek optou por uma filosofia de código aberto, o que abre um novo leque de dúvidas e reflexões. Por um lado, a transparência é normalmente bem-vinda em qualquer projeto tecnológico. Por outro lado, estamos a falar de uma empresa que opera na China e que, de acordo com alguns relatórios, mantém laços com infraestruturas estatais, o que pode implicar tensões sobre a propriedade intelectual ou a privacidade dos dados. No final, qualquer empresa que pretenda integrar esta tecnologia terá de ponderar cuidadosamente os riscos e os benefícios, especialmente quando está em causa a segurança da informação.


Para muitos analistas, a entrada da DeepSeek no circuito da IA é um verdadeiro “momento Sputnik”: aquele instante que marca um antes e um depois que pode acelerar a concorrência e a inovação a um ritmo frenético. Poderá ser uma repetição do fenómeno a que assistimos nas revoluções tecnológicas anteriores, quando governos, investidores e empresas se lançaram em novas investigações e alianças para não ficarem para trás. Neste contexto, a eficiência e a ética tornam-se os pilares sobre os quais a IA terá de sustentar o seu rápido crescimento, pois parece claro que desempenhará um papel crucial no futuro da economia, da segurança e, em última análise, da sociedade no seu conjunto.