Google Gemini é novo modelo de IA para fazer frente à OpenAI

O Gemini é capaz de compreender texto, imagens, áudio e explicar exercícios de matemática. O novo modelo da Google chega ao chatbot Bard como alternativa ao modelo pago da OpenAI.

Foto
Google Gemini chega esta quarta-feira a alguns produtos e serviços da Google DR
Ouça este artigo
00:00
04:26

O novo modelo de inteligência artificial (IA) da Google, o Gemini, chega esta quarta-feira a vários dos produtos e serviços da empresa, incluindo o chatbot Bard, contrariando rumores de que apenas seria lançado em 2024. O Gemini foi construído para ser multimodal, ou seja capaz de compreender e combinar diferentes tipos de informações incluindo texto, imagens, áudio, vídeo e código informático. Isto faz com que seja mais fácil usar o modelo para identificar erros e corrigir equações, passo a passo, a partir de uma fotografia.

Numa apresentação a jornalistas em que o PÚBLICO participou, a empresa mostrou o modelo a ser usado para pôr chatbots a resolver e corrigir provas de matemática, a dar sugestões para melhorar trabalhos manuais, e a jogar ao "pedra, papel, ou tesoura". Um dos casos de uso sugeridos é ajudar pais a rever os trabalhos de casa dos filhos.

O sistema vem competir com outros já existentes como o GPT-4, o modelo da OpenAI por detrás da versão paga do ChatGPT que levou os avanços da Google em IA a serem questionados no arranque de 2023. A OpenAI foi a primeira empresa a mostrar que era possível criar programas informáticos capazes de compreender humanos em contexto de conversa.

A Google diz que ainda não tem planos sobre a monetização do Gemini, mas não rejeita a possibilidade. Alguns produtos e serviços que vão incluir o modelo são pagos: é o caso das ferramentas de produtividade da Google para empresas (Duet AI) e do telemóvel topo de gama Pixel 8 Pro. O Gemini vai permitir que o gravador do smartphone crie resumos de transcrições de gravações áudio melhor e mais rapidamente, e vai melhorar as sugestões do teclado do telemóvel.

No futuro outros aparelhos com o sistema operativo Android 14, desenvolvido para a Google, também devem incluir o Gemini.

O modelo pode ser testado gratuitamente, a partir desta quarta-feira, no Bard, a versão do ChatGPT da Google.

Treinado para tudo

Durante a apresentação a jornalistas, a Google afastou preocupações de que o modelo se aproximasse da chamada “inteligência artificial geral” (AGI na sigla inglesa). Trata-se da capacidade hipotética de um agente inteligente compreender e aprender qualquer tarefa intelectual desempenhada por um ser humano, incluindo raciocinar e descobrir novas formas de resolver um desafio. Não há consenso científico sobre se é possível alcançar a AGI, mas vários investigadores preocupam-se com a falta de limites que existem para a criação deste tipo de tecnologia.

As capacidades do Gemini dependem da forma como o sistema foi treinado. Até agora, a abordagem padrão para criar modelos de IA multimodais passava por treinar componentes separadas em diferentes modalidades (matemática, leitura, visão computacional) e depois juntar estas componentes. O Gemini foi treinado em diferentes modalidades ao mesmo tempo.

A empresa vai disponibilizar três versões do Gemini (Ultra, Pro e Nano), consoante o poder computacional e os dados dos sistemas em que será utilizado.

“Acredito que a transição que estamos a ver agora com a IA será a mais profunda das nossas vidas, muito maior do que a mudança para dispositivos móveis ou para a web”, defendeu o presidente executivo da Gemini, Sundar Pichai, na apresentação do Gemini. Para o líder da Google, o Gemini mostra como as ferramentas de IA podem “impulsionar o conhecimento, a aprendizagem, a criatividade e a produtividade numa escala nunca antes vista.”

A Google não dá detalhes sobre as bases de dados usadas para treinar o Gemini, mas nota que foram construídos “classificadores de segurança” para identificar e rotular conteúdos problemáticos (por exemplo, violência e estereótipos negativos). A capacidade de o modelo ignorar conteúdo tóxico foi testada através de ferramentas desenvolvidas pelo Allen Institute of AI, o laboratório de informática sem fins lucrativos criado por Paul Allen, co-fundador da Microsoft.

As novas ferramentas de IA generativas, como o Bard e o ChatGPT, capazes de criar conteúdo original a partir de enormes bases de dados, levantam preocupações sobre o aumento de esquemas de desinformação e engenharia social (phishing) para obter credenciais e dados privados. Somam-se preocupações sobre fraude académica, a utilização destas ferramentas em contexto escolar, e o efeito que as ferramentas têm em pessoas vulneráveis, que se sentem sozinhas, e que podem confundir as ferramentas como seres humanos reais.

O lançamento do Gemini chega numa altura em que vários países debatem leis para evitar os efeitos negativos da tecnologia. Esta quarta-feira, os representantes do Parlamento Europeu, Comissão Europeia e Conselho da UE reúnem-se para tentar chegar à versão final de uma proposta de regulação para programas e serviços de IA na União Europeia.

Sugerir correcção
Comentar