Pular para o conteúdo
Tecnologia

OpenAI afirma que seu novo modelo atingiu nível humano em um teste de “inteligência geral”. O que isso significa?

O sistema o3 da OpenAI alcançou uma pontuação de 85% no teste ARC-AGI, muito acima do 55% anterior, igualando o desempenho médio humano. Entenda o impacto desse avanço.
Por

Tempo de leitura: 2 minutos

Em 20 de dezembro, o sistema o3 da OpenAI alcançou resultados de nível humano no teste ARC-AGI, projetado para medir a “inteligência geral”. Com uma pontuação de 85%, superou significativamente o recorde anterior das IAs, de 55%, e equiparou-se ao desempenho médio humano. Além disso, o modelo também obteve ótimos resultados em um teste avançado de matemática.

Criar uma inteligência artificial geral (AGI, na sigla em inglês) é o objetivo principal dos maiores laboratórios de pesquisa em IA. Esse resultado sugere que a OpenAI pode ter dado um grande passo nessa direção.

Embora ainda haja ceticismo, muitos especialistas em IA acreditam que esse avanço torna a ideia da AGI mais realista e urgente do que se pensava anteriormente.

O que é inteligência geral e por que importa?

Para entender o significado do resultado do sistema o3, é importante compreender o teste ARC-AGI. Ele mede a “eficiência de amostra” de um sistema de IA, ou seja, quantos exemplos o sistema precisa observar para aprender a resolver problemas novos.

Modelos como o ChatGPT (baseado no GPT-4) são treinados com milhões de exemplos de textos humanos, o que permite construir regras probabilísticas sobre combinações de palavras. Esse treinamento resulta em um bom desempenho em tarefas comuns, mas limita sua capacidade de resolver problemas menos frequentes, devido à menor quantidade de dados disponíveis.

A capacidade de resolver problemas desconhecidos com base em poucos exemplos é chamada de generalização. Essa habilidade é considerada fundamental para qualquer sistema de inteligência avançado. Sem ela, as IAs permanecem úteis apenas para tarefas repetitivas, onde falhas ocasionais são aceitáveis.

O teste ARC-AGI: grilhas e padrões

O teste ARC-AGI avalia a capacidade de adaptação eficiente da IA por meio de problemas baseados em grades. O sistema precisa identificar o padrão que transforma a grade inicial em uma grade final.

Esse tipo de teste não envolve apenas regras pré-estabelecidas; exige que o sistema extrapole e aplique lógica a situações novas, com poucos dados de referência. É exatamente essa capacidade que aproxima as IAs da inteligência geral.

O que vem a seguir?

Embora o avanço do sistema o3 seja significativo, ainda existem desafios para alcançar a verdadeira AGI. Sistemas como este ainda precisam demonstrar consistência em uma ampla variedade de tarefas complexas, além de operar com ética e segurança.

No entanto, o resultado reforça a ideia de que a AGI está cada vez mais próxima. Para especialistas e desenvolvedores, esse marco da OpenAI representa um grande salto na jornada para criar máquinas verdadeiramente inteligentes e adaptáveis.

Este avanço coloca novas questões sobre o futuro da inteligência artificial e sua integração na sociedade, trazendo expectativas e desafios para os próximos anos.

Partilhe este artigo

Artigos relacionados