A corrida da inteligência artificial ganhou um novo capítulo — e ele vem da China. Um modelo chamado GLM-5.2 começou a circular entre programadores e pesquisadores com uma promessa que mistura desempenho, privacidade e custo mais baixo. Segundo seus criadores, ele consegue enfrentar rivais como ChatGPT e Claude em tarefas de programação e raciocínio, mas com uma diferença importante: foi desenhado para funcionar também no hardware do próprio usuário, sem depender apenas de servidores remotos.
A aposta da nova IA chinesa vai além do desempenho
O GLM-5.2 foi lançado pela Z.ai, empresa chinesa anteriormente conhecida como Zhipu AI, e ganhou destaque por sua proposta de código aberto e pelo foco em uso local. Em vez de exigir que tudo passe por servidores de grandes empresas, o modelo pode ser baixado, adaptado e executado diretamente na máquina do usuário — algo que interessa especialmente a empresas e desenvolvedores preocupados com privacidade, autonomia e custos de assinatura.
Nos testes da plataforma Code Arena, voltada para avaliação de modelos em tarefas de programação, o sistema apareceu entre os melhores colocados do mundo. Segundo os dados divulgados, ele ficou atrás apenas do Claude Fable 5, da Anthropic, e superou o GPT-5.5 em tarefas práticas como correção de falhas de software e provas de matemática.
Outro ponto que chama atenção é a janela de contexto de 1 milhão de tokens. Em termos simples, isso significa que a IA consegue processar volumes enormes de informação de uma vez, como livros inteiros, bases extensas de código ou bibliotecas completas de documentação, sem precisar quebrar tudo em partes menores.
A grande vantagem vem com uma barreira enorme de hardware
O problema é que essa liberdade não sai barata em termos técnicos. O GLM-5.2 foi construído com arquitetura Mixture-of-Experts, um formato que divide o processamento em redes menores e especializadas para ganhar eficiência. Ainda assim, o modelo trabalha com algo entre 744 bilhões e 753 bilhões de parâmetros, um volume gigantesco mesmo para os padrões atuais da IA.
Sem compressão, os arquivos ocupam cerca de 1,5 terabyte. Para torná-lo viável em máquinas comerciais, os desenvolvedores recorrem à quantização, técnica que reduz o tamanho do modelo sacrificando o mínimo possível de precisão. Mesmo assim, a exigência continua brutal: o sistema ainda precisa de cerca de 240 GB de memória RAM para rodar localmente.
Na prática, isso limita o uso doméstico a máquinas de altíssimo desempenho, como desktops profissionais e configurações avançadas de Mac Studio. Ou seja, a promessa de independência da nuvem existe, mas ainda está longe de caber em qualquer notebook.
O lançamento também virou peça de um tabuleiro geopolítico
A chegada do GLM-5.2 acontece em um momento de tensão crescente entre Estados Unidos e China no setor de IA. Pouco antes do anúncio, o Departamento de Comércio americano ordenou que a Anthropic restringisse o acesso internacional a seus modelos mais avançados. A Z.ai aproveitou a brecha e lançou seu modelo aberto no dia seguinte, sob licença MIT, tentando ocupar um espaço deixado pelos rivais ocidentais.
O movimento teve efeito imediato no mercado. A empresa passou a ser avaliada em cerca de US$ 128 bilhões na Bolsa de Hong Kong, e a combinação entre uso gratuito do modelo baixado e serviços de nuvem mais baratos reforçou a percepção de que as gigantes americanas podem enfrentar pressão de preço nos próximos meses.
No fim, o GLM-5.2 não parece importante apenas por “vencer” ou não o ChatGPT em benchmarks. O que ele sinaliza é algo maior: a disputa global pela IA está ficando mais aberta, mais geopolítica e, possivelmente, mais barata para quem usa.
[Fonte: Canaltech]