Durante anos, acreditou-se que as inteligências artificiais “pensavam” em inglês. Parecia lógico — afinal, a maior parte da internet, e portanto dos dados usados para treinar esses sistemas, está nesse idioma. Mas uma pesquisa recente virou essa suposição de cabeça para baixo. O idioma que as máquinas mais compreendem é o polonês.
Um resultado que desafia a lógica
O estudo, conduzido por pesquisadores da Universidade de Maryland em parceria com a Microsoft, avaliou o desempenho de vários modelos de linguagem — entre eles OpenAI, Google Gemini, Llama, DeepSeek e Qwen — em 26 idiomas diferentes.
O resultado surpreendeu: o polonês alcançou 88% de precisão, seguido por francês (87%), italiano (86%) e espanhol (85%). O inglês ficou apenas em sexto lugar, com 83,9%, enquanto o chinês, apesar de dominar a internet, ficou entre os últimos colocados.
A ironia foi celebrada até pelo Escritório Polonês de Patentes, que publicou: “Os humanos têm dificuldade com o polonês — mas a IA, aparentemente, não.”

Por que a IA entende tão bem o polonês?
A grande questão é: como uma língua com tão pouca presença online pode superar o inglês? Os cientistas sugerem que o segredo está na estrutura gramatical altamente regular do polonês. Seu uso consistente de prefixos e sufixos torna os padrões mais previsíveis, algo que as IAs conseguem decodificar com extrema facilidade.
Enquanto os humanos se atrapalham com suas declinações, os modelos de IA conseguem mapear as repetições e estruturas com eficiência matemática. Ou seja, menos ambiguidade, mais precisão.
O espanhol também se destacou pelo mesmo motivo: regras claras e poucas exceções, além de sua ampla presença global, o que fornece uma base de dados sólida e diversa.
Um novo paradigma para o aprendizado das máquinas
A descoberta tem implicações que vão além da linguística. Se a eficácia da IA não depende apenas da quantidade de dados, mas também da coerência estrutural do idioma, isso pode mudar a forma como treinamos os modelos no futuro.
Os pesquisadores afirmam que o desempenho da IA está mais ligado à consistência lógica de uma língua do que ao seu prestígio global. O polonês, com sua gramática sistemática, oferece justamente esse tipo de ambiente “matematicamente limpo” para o aprendizado automático.
Em resumo, o estudo revela algo fascinante: as máquinas não “pensam” como nós. E no mundo digital, a clareza vence o volume. Nesse novo mapa linguístico da IA, o polonês reina — e o espanhol segue logo atrás, desafiando o império do inglês.