Com a promessa de usar a tecnologia para moldar e divulgar informações de forma ética e acessível, a IDI busca estabelecer um marco na preservação e aplicação do saber humano.
O que é a Institutional Data Initiative?
A IDI, lançada em 12 de dezembro, é uma iniciativa de Harvard que pretende alimentar modelos de IA com dados de alta qualidade provenientes de instituições renomadas, como a Biblioteca Pública de Boston e Google Books. Os projetos iniciais incluem:
- Digitalização de acervos: digitalização de milhões de páginas de jornais de domínio público.
- Acesso a livros: liberação de dados de um milhão de livros de domínio público da coleção do Google Books.
Com apoio de Microsoft, Google e OpenAI, a IDI objetiva preservar e tornar acessível o conhecimento acumulado ao longo dos séculos.
Um “momento prometeico” para o conhecimento
Greg Leppert, diretor executivo da IDI, descreve a iniciativa como um “momento prometeico”, comparando-a a grandes avanços históricos no acesso ao saber. Harvard acredita que, ao usar IA para estruturar e divulgar dados, é possível moldar o futuro digital enquanto amplia o acesso a informações anteriormente restritas.
Benefícios esperados
- Representação global: maior diversidade linguística e cultural em modelos de IA.
- Democratização do conhecimento: redução de barreiras para a criação de modelos e acesso ao aprendizado.
- Avanços científicos: possibilidades de descobertas médicas e científicas a partir de dados estruturados.
Parceria entre tecnologia e conhecimento humano
A IDI propõe colaborar com bibliotecas, universidades e outras instituições para estruturar dados e torná-los acessíveis para usos variados, incluindo IA. O objetivo é alinhar os interesses das instituições do conhecimento com os criadores de modelos, garantindo que nenhum dado relevante seja ignorado.
Fonte: La Gaceta