Pular para o conteúdo
Tecnologia

DeepSeek não quer apenas competir com ChatGPT: a startup chinesa está tentando desmontar a dependência global da Nvidia peça por peça

Enquanto o Ocidente disputa quem cria o modelo de IA mais poderoso, a DeepSeek segue um caminho diferente: desenvolver inteligências artificiais eficientes o suficiente para funcionar sem os chips mais avançados dos Estados Unidos. E isso pode mudar completamente o equilíbrio tecnológico global nos próximos anos.
Por

Tempo de leitura: 4 minutos

A explosão causada pela DeepSeek R1, há cerca de um ano e meio, serviu como um alerta para o Vale do Silício: a China estava avançando muito rápido na corrida da inteligência artificial. Agora, a chegada da DeepSeek-V4-Pro pode representar algo ainda mais importante. O novo modelo talvez não seja o mais poderoso do mercado, mas revela uma estratégia muito mais ambiciosa por trás da startup chinesa.

O objetivo da empresa não parece ser simplesmente vencer OpenAI, Google ou Anthropic na disputa pelos melhores chatbots. O verdadeiro plano é criar uma infraestrutura chinesa de IA capaz de funcionar sem depender da Nvidia, da TSMC ou das tecnologias controladas pelos Estados Unidos.

A IA chinesa ficou barata demais para ignorar

Deepseek R1
© Justin Sullivan – Getty Images – Gizmodo

Na última semana, a DeepSeek anunciou que o desconto promocional de 75% no uso do modelo DeepSeek-V4-Pro se tornaria permanente. O movimento chamou atenção porque tornou o sistema extremamente barato em comparação com os rivais ocidentais.

Embora o desempenho ainda fique um pouco abaixo dos modelos mais avançados da OpenAI ou do Google, testes independentes da plataforma Artificial Analysis mostram que o custo-benefício da IA chinesa é impressionante. Isso é especialmente relevante em tarefas “agênticas” — aquelas em que agentes de IA executam processos longos e consomem enormes quantidades de tokens.

Na prática, a DeepSeek está tornando aplicações avançadas de IA muito mais acessíveis financeiramente.

O verdadeiro problema da China não é software

Cenário Que A China Prevê Para 2049s
© X – @RepublicaNepal

O maior obstáculo chinês na corrida da inteligência artificial continua sendo hardware.

As sanções impostas pelos Estados Unidos impedem empresas chinesas de acessar os chips mais avançados da Nvidia e também limitam o uso da litografia ultravioleta extrema (UVE), tecnologia dominada pela holandesa ASML e essencial para fabricar semicondutores de ponta.

Sem conseguir competir diretamente em capacidade bruta de processamento, a estratégia chinesa passou a ser outra: criar modelos de IA que precisem de menos poder computacional para entregar resultados parecidos.

E é exatamente aí que a DeepSeek entra.

As arquiteturas que podem mudar tudo

A startup vem apostando em arquiteturas extremamente eficientes, especialmente nas técnicas chamadas Mixture of Experts (MoE) e Multi-head Latent Attention (MLA).

A MoE funciona ativando apenas partes específicas do modelo durante cada consulta, em vez de usar todos os parâmetros simultaneamente. Isso reduz drasticamente o consumo de recursos sem comprometer tanto a precisão.

Já a MLA atua sobre um elemento fundamental dos grandes modelos de linguagem: a chamada KV Cache, memória usada para manter o contexto das conversas.

Segundo análises compartilhadas pelo especialista GDP na rede X, a técnica da DeepSeek reduz essa necessidade de memória em cerca de 90%.

O impacto é gigantesco.

Para processar um milhão de tokens, o DeepSeek-V4-Pro precisaria de apenas 5,48 GB de memória HBM. Modelos concorrentes chineses, como o GLM 5 da Zhipu AI, exigem cerca de 60 GB. Já o Qwen 3, da Alibaba, chega a consumir 89 GB.

Menos dependência da Nvidia

Nvidia 1
© VectorAnalisis – X

Essa eficiência cria uma consequência estratégica importante: a IA da DeepSeek pode funcionar com memórias mais simples e baratas produzidas dentro da China.

Isso abre espaço para empresas chinesas como a YMTC, fabricante de memória Flash NAND, e a CXMT, especializada em DRAM. Em vez de depender exclusivamente das caríssimas memórias HBM usadas pela Nvidia, a DeepSeek começa a adaptar seus sistemas para operar até com SSDs convencionais.

A empresa também apresentou uma solução chamada Engram, voltada justamente para reduzir ainda mais a dependência das memórias HBM.

O objetivo é claro: construir uma cadeia tecnológica chinesa completa.

O desafio ao domínio do CUDA

A Nvidia não domina apenas pelos chips. Seu maior trunfo talvez seja o CUDA, plataforma de software usada mundialmente para programar GPUs voltadas à IA.

A DeepSeek também começou a atacar essa frente.

A startup desenvolveu o Tile Kernels, um conjunto de núcleos de software criado com TileLang, uma linguagem derivada de Python pensada especificamente para controlar chips de inteligência artificial.

Isso significa que empresas chinesas podem começar a desenvolver alternativas próprias sem depender totalmente do ecossistema da Nvidia.

Huawei aparece nos bastidores

Outro elemento importante nessa estratégia é a Huawei.

Recentemente, a empresa confirmou que seus novos supernós Ascend AI oferecem suporte completo aos modelos DeepSeek V4. Isso fortalece ainda mais a possibilidade de um ecossistema chinês independente.

Até poucos anos atrás, a Nvidia reinava praticamente sozinha nesse setor. Agora, a combinação entre DeepSeek, Huawei e fabricantes chineses de memória começa a desenhar um cenário muito diferente.

O plano não é vencer o ChatGPT

A grande diferença entre DeepSeek e empresas como OpenAI está no modelo de negócios.

A startup chinesa publica os pesos abertos de seus modelos, compartilha avanços técnicos e incentiva outras empresas a adotarem suas arquiteturas. Em vez de fechar seu ecossistema, ela tenta transformá-lo em padrão da indústria.

O cálculo é estratégico: se o mercado inteiro passar a desenvolver hardware otimizado para técnicas como MoE e MLA, a dependência global das soluções da Nvidia pode diminuir gradualmente.

E a DeepSeek pretende acelerar ainda mais esse processo. A empresa prepara uma rodada de investimento de cerca de US$ 10 bilhões, o que pode elevar sua avaliação para até US$ 50 bilhões.

Ainda distante das cifras astronômicas da OpenAI, mas suficiente para mostrar que a disputa pela inteligência artificial talvez esteja entrando em uma fase muito mais profunda: a da guerra pela infraestrutura tecnológica do futuro.

 

[ Fonte: Xataka ]

 

Partilhe este artigo

Artigos relacionados