Durante algumas semanas, não houve pausas para café, nem bate-papo entre colegas ou festas de aniversário. Ainda assim, a empresa funcionou. Ou pelo menos, tentou funcionar.
A ideia parece saída de um filme de ficção científica: uma companhia de software onde todos os cargos — de programadores a responsáveis por RH — são ocupados por agentes de inteligência artificial. O experimento, porém, não veio do Vale do Silício, e sim da Carnegie Mellon University (CMU), uma das instituições mais respeitadas do mundo em ciência e tecnologia.
Uma empresa inteira nas mãos da IA

Os pesquisadores da CMU criaram a The Agent Company, uma empresa simulada com funções baseadas em tarefas reais: desenvolvimento de software, análise de dados, administração e finanças. Cada papel foi atribuído a um agente de IA diferente. A meta? Avaliar até que ponto as máquinas podem, sozinhas, substituir os humanos no ambiente de trabalho.
Segundo Yufan Song, um dos autores do estudo, não havia até então um ambiente que reproduzisse com fidelidade o cotidiano de um escritório. Por isso, eles montaram equipes, distribuíram projetos, integraram navegadores e ferramentas reais, e até simularam conversas entre “colegas virtuais”.
As tarefas variavam entre simples — como preencher documentos ou buscar informações online — e complexas, como corrigir bugs em Python, manter a coerência em decisões interligadas ou configurar sistemas. As IAs usaram um sistema chamado OpenHands, com suporte de modelos como Claude 3.5 Sonnet, Gemini 2.0 e GPT-4o.
Quando a IA tropeça no óbvio
O desempenho foi uma mistura de fascínio e decepção. O agente com melhor performance (Claude 3.5 Sonnet) completou apenas 24% das tarefas. Não por falta de potência, mas por não entender instruções básicas.
Uma tarefa simples, por exemplo, pedia que se salvasse um arquivo como “answer.docx”. A IA interpretou como texto simples, ignorando o formato Word. Situações assim mostram que a IA ainda carece de senso comum.
Outros problemas incluíram falhas ao interpretar páginas da web ou ao seguir instruções condicionais com base em tempo. Em uma situação, um agente “decidiu” que dez minutos haviam se passado — sem nenhum critério — e agiu de forma precipitada.
Além disso, os agentes não conseguiram lidar bem com interfaces feitas para humanos. Fluxos visuais complexos, regras implícitas e formulários específicos foram obstáculos quase intransponíveis.
Mas também houve momentos brilhantes

Apesar das falhas, houve destaques. Em um dos testes mais difíceis, com apoio do Gemini 2.5 Pro, um agente conseguiu configurar um ambiente local, navegar em um site privado, modificar arquivos e compilar o sistema — tudo isso em apenas 8 minutos, ao custo de US$ 2,41.
Segundo os pesquisadores, o valor do experimento não está nos acertos, mas nos erros. “Entender por que as IAs falham é mais útil do que comemorar o que elas já fazem bem”, explicou Song.
O que o futuro reserva para os trabalhadores (e para as IAs)
A principal conclusão é clara: a IA não está nem perto de substituir um ser humano no trabalho diário. As tarefas com alta carga social, como colaborar, escalar problemas ou lidar com atrasos, ainda estão fora do alcance das máquinas.
Para Boxuan Li, outro pesquisador do projeto, o futuro do trabalho será uma parceria. Humanos não serão substituídos, mas passarão a atuar como supervisores, estrategistas e coordenadores das IAs. Saber usar bem uma IA será tão importante quanto saber executar uma tarefa.
Em resumo, a IA avança a passos largos — mas ainda engatinha quando o assunto é lidar com o imprevisível, o implícito e o humano. A revolução não será instantânea, e sim gradual. Até lá, seguimos testando, corrigindo e ensinando. Porque, antes de alcançar o futuro, é preciso simular.
[ Fonte: Infobae ]