Eles criaram uma empresa só com IAs no comando — e os resultados surpreenderam

Durante algumas semanas, não houve pausas para café, nem bate-papo entre colegas ou festas de aniversário. Ainda assim, a empresa funcionou. Ou pelo menos, tentou funcionar.

A ideia parece saída de um filme de ficção científica: uma companhia de software onde todos os cargos — de programadores a responsáveis por RH — são ocupados por agentes de inteligência artificial. O experimento, porém, não veio do Vale do Silício, e sim da Carnegie Mellon University (CMU), uma das instituições mais respeitadas do mundo em ciência e tecnologia.

Uma empresa inteira nas mãos da IA

Os pesquisadores da CMU criaram a The Agent Company, uma empresa simulada com funções baseadas em tarefas reais: desenvolvimento de software, análise de dados, administração e finanças. Cada papel foi atribuído a um agente de IA diferente. A meta? Avaliar até que ponto as máquinas podem, sozinhas, substituir os humanos no ambiente de trabalho.

Segundo Yufan Song, um dos autores do estudo, não havia até então um ambiente que reproduzisse com fidelidade o cotidiano de um escritório. Por isso, eles montaram equipes, distribuíram projetos, integraram navegadores e ferramentas reais, e até simularam conversas entre “colegas virtuais”.

As tarefas variavam entre simples — como preencher documentos ou buscar informações online — e complexas, como corrigir bugs em Python, manter a coerência em decisões interligadas ou configurar sistemas. As IAs usaram um sistema chamado OpenHands, com suporte de modelos como Claude 3.5 Sonnet, Gemini 2.0 e GPT-4o.

Quando a IA tropeça no óbvio

O desempenho foi uma mistura de fascínio e decepção. O agente com melhor performance (Claude 3.5 Sonnet) completou apenas 24% das tarefas. Não por falta de potência, mas por não entender instruções básicas.

Uma tarefa simples, por exemplo, pedia que se salvasse um arquivo como “answer.docx”. A IA interpretou como texto simples, ignorando o formato Word. Situações assim mostram que a IA ainda carece de senso comum.

Outros problemas incluíram falhas ao interpretar páginas da web ou ao seguir instruções condicionais com base em tempo. Em uma situação, um agente “decidiu” que dez minutos haviam se passado — sem nenhum critério — e agiu de forma precipitada.

Além disso, os agentes não conseguiram lidar bem com interfaces feitas para humanos. Fluxos visuais complexos, regras implícitas e formulários específicos foram obstáculos quase intransponíveis.

Mas também houve momentos brilhantes

Apesar das falhas, houve destaques. Em um dos testes mais difíceis, com apoio do Gemini 2.5 Pro, um agente conseguiu configurar um ambiente local, navegar em um site privado, modificar arquivos e compilar o sistema — tudo isso em apenas 8 minutos, ao custo de US$ 2,41.

Segundo os pesquisadores, o valor do experimento não está nos acertos, mas nos erros. “Entender por que as IAs falham é mais útil do que comemorar o que elas já fazem bem”, explicou Song.

O que o futuro reserva para os trabalhadores (e para as IAs)

A principal conclusão é clara: a IA não está nem perto de substituir um ser humano no trabalho diário. As tarefas com alta carga social, como colaborar, escalar problemas ou lidar com atrasos, ainda estão fora do alcance das máquinas.

Para Boxuan Li, outro pesquisador do projeto, o futuro do trabalho será uma parceria. Humanos não serão substituídos, mas passarão a atuar como supervisores, estrategistas e coordenadores das IAs. Saber usar bem uma IA será tão importante quanto saber executar uma tarefa.

Em resumo, a IA avança a passos largos — mas ainda engatinha quando o assunto é lidar com o imprevisível, o implícito e o humano. A revolução não será instantânea, e sim gradual. Até lá, seguimos testando, corrigindo e ensinando. Porque, antes de alcançar o futuro, é preciso simular.

[ Fonte: Infobae ]

Eles criaram uma empresa só com IAs no comando — e os resultados surpreenderam

Uma empresa inteira nas mãos da IA

Quando a IA tropeça no óbvio

Mas também houve momentos brilhantes

O que o futuro reserva para os trabalhadores (e para as IAs)

Últimas notícias

O que a ciência descobriu sobre saunas pode mudar a forma como muita gente vê o relaxamento

Disputa entre EUA e China por chips de IA ganha novo capítulo

Netflix recebe uma das produções mais perturbadoras já feitas para a TV

Novo robô com IA tenta entender emoções humanas e agir como um pet

Sinais químicos no Universo levantam dúvidas sobre existência de vida extraterrestre

Surto de hantavírus em navio de cruzeiro preocupa autoridades: OMS investiga possível transmissão entre pessoas

Captura de carbono perde terreno: estudo indica que investir em energia renovável é mais barato e eficiente para conter o aquecimento global

Apple vai abrir o iPhone para múltiplas IAs — e o ChatGPT pode deixar de ser protagonista no ecossistema

Artigos relacionados

Eles criaram uma empresa só com IAs no comando — e os resultados surpreenderam

Uma empresa inteira nas mãos da IA

Quando a IA tropeça no óbvio

Mas também houve momentos brilhantes

O que o futuro reserva para os trabalhadores (e para as IAs)

O que a ciência descobriu sobre saunas pode mudar a forma como muita gente vê o relaxamento

Disputa entre EUA e China por chips de IA ganha novo capítulo

Netflix recebe uma das produções mais perturbadoras já feitas para a TV

Novo robô com IA tenta entender emoções humanas e agir como um pet

Sinais químicos no Universo levantam dúvidas sobre existência de vida extraterrestre

Surto de hantavírus em navio de cruzeiro preocupa autoridades: OMS investiga possível transmissão entre pessoas

Captura de carbono perde terreno: estudo indica que investir em energia renovável é mais barato e eficiente para conter o aquecimento global

Apple vai abrir o iPhone para múltiplas IAs — e o ChatGPT pode deixar de ser protagonista no ecossistema

Artigos relacionados

Disputa entre EUA e China por chips de IA ganha novo capítulo

Novo robô com IA tenta entender emoções humanas e agir como um pet

Apple vai abrir o iPhone para múltiplas IAs — e o ChatGPT pode deixar de ser protagonista no ecossistema

O fim do smartphone como o conhecemos pode estar começando — e a China já está reciclando sua tecnologia para criar uma nova geração de robôs

O novo plano da China pode mudar completamente a frequência dos lançamentos espaciais

Cientistas conseguem teletransportar informação quântica usando fibra óptica comum — e isso pode mudar a internet como conhecemos