Inteligência artificial

Google Gemini é novo modelo de IA para fazer frente à OpenAI

O Gemini é capaz de compreender texto, imagens, áudio e explicar exercícios de matemática. O novo modelo da Google chega ao chatbot Bard como alternativa ao modelo pago da OpenAI.

Karla Pequenino

6 de Dezembro de 2023, 17:45

Google Gemini chega esta quarta-feira a alguns produtos e serviços da Google DR

Ouça este artigo

00:00

04:26

Gostaria de ouvir? Assine já

O novo modelo de inteligência artificial (IA) da Google, o Gemini, chega esta quarta-feira a vários dos produtos e serviços da empresa, incluindo o chatbot Bard, contrariando rumores de que apenas seria lançado em 2024. O Gemini foi construído para ser multimodal, ou seja capaz de compreender e combinar diferentes tipos de informações incluindo texto, imagens, áudio, vídeo e código informático. Isto faz com que seja mais fácil usar o modelo para identificar erros e corrigir equações, passo a passo, a partir de uma fotografia.

Numa apresentação a jornalistas em que o PÚBLICO participou, a empresa mostrou o modelo a ser usado para pôr chatbots a resolver e corrigir provas de matemática, a dar sugestões para melhorar trabalhos manuais, e a jogar ao "pedra, papel, ou tesoura". Um dos casos de uso sugeridos é ajudar pais a rever os trabalhos de casa dos filhos.

O sistema vem competir com outros já existentes como o GPT-4, o modelo da OpenAI por detrás da versão paga do ChatGPT que levou os avanços da Google em IA a serem questionados no arranque de 2023. A OpenAI foi a primeira empresa a mostrar que era possível criar programas informáticos capazes de compreender humanos em contexto de conversa.

A Google diz que ainda não tem planos sobre a monetização do Gemini, mas não rejeita a possibilidade. Alguns produtos e serviços que vão incluir o modelo são pagos: é o caso das ferramentas de produtividade da Google para empresas (Duet AI) e do telemóvel topo de gama Pixel 8 Pro. O Gemini vai permitir que o gravador do smartphone crie resumos de transcrições de gravações áudio melhor e mais rapidamente, e vai melhorar as sugestões do teclado do telemóvel.

No futuro outros aparelhos com o sistema operativo Android 14, desenvolvido para a Google, também devem incluir o Gemini.

O modelo pode ser testado gratuitamente, a partir desta quarta-feira, no Bard, a versão do ChatGPT da Google.

Treinado para tudo

Durante a apresentação a jornalistas, a Google afastou preocupações de que o modelo se aproximasse da chamada “inteligência artificial geral” (AGI na sigla inglesa). Trata-se da capacidade hipotética de um agente inteligente compreender e aprender qualquer tarefa intelectual desempenhada por um ser humano, incluindo raciocinar e descobrir novas formas de resolver um desafio. Não há consenso científico sobre se é possível alcançar a AGI, mas vários investigadores preocupam-se com a falta de limites que existem para a criação deste tipo de tecnologia.

As capacidades do Gemini dependem da forma como o sistema foi treinado. Até agora, a abordagem padrão para criar modelos de IA multimodais passava por treinar componentes separadas em diferentes modalidades (matemática, leitura, visão computacional) e depois juntar estas componentes. O Gemini foi treinado em diferentes modalidades ao mesmo tempo.

A empresa vai disponibilizar três versões do Gemini (Ultra, Pro e Nano), consoante o poder computacional e os dados dos sistemas em que será utilizado.

“Acredito que a transição que estamos a ver agora com a IA será a mais profunda das nossas vidas, muito maior do que a mudança para dispositivos móveis ou para a web”, defendeu o presidente executivo da Gemini, Sundar Pichai, na apresentação do Gemini. Para o líder da Google, o Gemini mostra como as ferramentas de IA podem “impulsionar o conhecimento, a aprendizagem, a criatividade e a produtividade numa escala nunca antes vista.”

A Google não dá detalhes sobre as bases de dados usadas para treinar o Gemini, mas nota que foram construídos “classificadores de segurança” para identificar e rotular conteúdos problemáticos (por exemplo, violência e estereótipos negativos). A capacidade de o modelo ignorar conteúdo tóxico foi testada através de ferramentas desenvolvidas pelo Allen Institute of AI, o laboratório de informática sem fins lucrativos criado por Paul Allen, co-fundador da Microsoft.

As novas ferramentas de IA generativas, como o Bard e o ChatGPT, capazes de criar conteúdo original a partir de enormes bases de dados, levantam preocupações sobre o aumento de esquemas de desinformação e engenharia social (phishing) para obter credenciais e dados privados. Somam-se preocupações sobre fraude académica, a utilização destas ferramentas em contexto escolar, e o efeito que as ferramentas têm em pessoas vulneráveis, que se sentem sozinhas, e que podem confundir as ferramentas como seres humanos reais.

O lançamento do Gemini chega numa altura em que vários países debatem leis para evitar os efeitos negativos da tecnologia. Esta quarta-feira, os representantes do Parlamento Europeu, Comissão Europeia e Conselho da UE reúnem-se para tentar chegar à versão final de uma proposta de regulação para programas e serviços de IA na União Europeia.

Comentários

Últimas publicações

Tópicos disponíveis

Escolha um dos seguintes tópicos para criar um grupo no Fórum Público.

Ao criar um novo grupo de discussão, tornar-se-à administrador e será responsável pela moderação desse grupo. Os jornalistas do PÚBLICO poderão sempre intervir.

Saiba mais sobre o Fórum Público.