União Europeia está a criar versão própria do ChatGPT. E também vai falar português

A União Europeia está a criar o seu próprio modelo de linguagem, o OpenEuroLLM, uma alternativa ao ChatGPT, com o objetivo de lançar a primeira versão em meados de 2026. O projeto, financiado com 37,4 milhões de euros de fundos europeus, reunirá 20 organizações, incluindo universidades, empresas e centros de computação.

O OpenEuroLLM será um projeto de código aberto e multilíngue, abrangendo todos os idiomas da UE, segundo anunciou a Comissão Europeia. A iniciativa pretende oferecer uma solução adaptável, uma espécie de ChatGPT comunitário, para empresas e administrações públicas, promovendo a diversidade linguística e a competitividade europeia no setor da inteligência artificial (IA).

A criação deste modelo de linguagem europeia começou este mês e irá prolongar-se durante três anos, com um primeiro lançamento em 2026 e a versão final em 2028.

“Dada a velocidade com que os modelos estão a chegar ao mercado, vamos esforçarmos para acelerar os tempos o máximo possível”, indicaram os responsáveis do projeto OpenEuroLLM.

O que significa ser um projeto de código aberto?

A iniciativa europeia terá código aberto, o que significa que qualquer indivíduo ou empresa poderá usá-lo e executá-lo para seus próprios propósitos. “[O código] pode ser refinado e personalizado de acordo com as necessidades específicas de cada indústria e do setor público”, detalha a iniciativa. Ou seja, a Europa fornecerá a ferramenta inicial e as empresas, administrações e indivíduos poderão adaptar esta versão às suas necessidades.

Os dados para treinar o modelo serão obtidos através de duas empresas que geram coleções de dados específicas para treinar IA, nomeadamente a High Performance Language Technologies (HPLT) e CoommonCrawl. Além disso, espera-se que outras fontes sejam adicionadas e o banco de dados seja enriquecido.

O OpenEuroLLM será nativo em todos os idiomas europeus, algo que o modelo de linguagem líder de mercado, OpenAI , não oferece. Portanto, terá um nível avançado em espanhol, português, francês e alemão, tendo menos fluência em italiano, polonês, sueco e demais idiomas do grupo. Além disso, a intenção do modelo europeu é preservar a linguística, as nuances e a diversidade de cada língua.

Artigos relacionados