Programa de IA em português fica nas mãos da Nova e do Técnico
Medida anunciada por Luís Montenegro na abertura da Web Summit será executada por centros ligados a duas universidades de Lisboa, em articulação com a FCT e o Centro para a IA Responsável.
O programa de inteligência artificial (IA) anunciado na segunda-feira pelo primeiro-ministro, durante a abertura da Web Summit 2024 (WS 2024), vai assentar num modelo de linguagem em larga escala (LLM na sigla habitual, do inglês Large Language Model) em português desenvolvido por um consórcio colaborativo de centros de investigação ligados a universidades de Lisboa (Faculdade de Ciências e Tecnologia da Nova e Instituto Superior Técnico, da Universidade de Lisboa), em articulação com a Fundação para a Ciência e a Tecnologia e o Centro para a IA Responsável.
A informação foi dada pelo gabinete de Luís Montenegro, que anunciou o lançamento deste LLM no palco principal da WS 2024, durante a cerimónia de abertura, mas sem dar detalhes. O objectivo, diz agora o executivo, numa nota explicativa que partilhou após questões do PÚBLICO, é reduzir os "sérios riscos" da "dependência de LLM estrangeiros".
"A dependência de LLM estrangeiros apresenta sérios riscos a Portugal como a perda de representatividade cultural ou a dificuldade em diferenciar variantes do português, nomeadamente a variante europeia", afirma o Governo.
O PÚBLICO também contactou, sem sucesso, o Ministério da Juventude e Modernização Administrativa, que fica com a tutela deste assunto, para perceber quanto vai custar, como vai ser financiado e quando é que esta tecnologia fica disponível. Informações que, por agora, continuam desconhecidas.
Um LLM assemelha-se a uma rede neuronal que é "ensinada" com doses maciças de informação que lhe é fornecida e que, depois, vai permitir ter um programa, que as pessoas usam através de um interface visual, para explorar as funções que lhe forem dedicadas. Por exemplo, reconhecimento, interpretação ou geração de texto, imagens ou sons.
É isso que permite, por exemplo, ter um programa de correio electrónico que sugere a palavra seguinte quando alguém está a escrever uma mensagem. Com base no que está escrito, o programa de IA vai ao modelo de linguagem em larga escala e pode, pelas probabilidades, sugerir palavras seguintes. Ou pode até escrever toda uma mensagem de correio completa, se o utilizador der as instruções para tal e o modelo tiver sido ensinado com informação suficiente, e posteriormente melhorado e afinado.
Segundo o Governo, "o LLM português dará aos cidadãos, empresas, administração pública e academia a possibilidade de utilizar soluções de inteligência artificial que respeitam e preservam a soberania da língua portuguesa, as nuances da nossa história e o património cultural". "No contexto europeu, o caso mais próximo é o de Espanha, onde está a ser desenvolvido um LLM que visa manter a representatividade cultural e das línguas oficiais faladas em território espanhol", acrescenta.
Por se tratar de um LLM em português – e porque um dos LLM mais conhecidos da actualidade é o ChatGPT (desenvolvido pela norte-americana OpenAI e que pode ser usado em português, de resto) – já se noticia que o Governo anunciou o lançamento de um "ChatGPT português". É um baptismo apressado, já que não se sabe exactamente que semelhanças existirão.
O que se sabe é o que o Governo pretende: "Uma solução que estará disponível para todos", de uso "autónomo e fácil". E estará "disponível na Internet para descarregar e utilizar localmente ou através de integração com outros serviços". Ou seja, o modelo a desenvolver por aqueles centros de investigação poderá ser "combinado com outros LLM estrangeiros, assegurando que estes geram conteúdos fiáveis e verídicos sobre Portugal, respeitando e preservando as especificidades da língua, história e cultura portuguesa".