A ascensão das máquinas que sabem línguas

Após décadas de desenvolvimento, os tradutores automáticos usam agora tecnologia inspirada no cérebro humano. Estamos mais perto de um mundo em que todos se percebem.

Foto
Fred Lancelot / Reuters

Ocorreu mais uma batalha entre homem e máquina. De um lado, quatro tradutores profissionais, do outro, três tradutores automáticos.

A competição aconteceu no final do mês passado, na Universidade de Sejong, na Coreia do Sul. Em velocidade, as máquinas pareciam ganhar: enquanto os humanos perdiam tempo a teclar as respostas e a consultar dicionários digitais, os sistemas de tradução do Google, do motor de busca coreano Naver, e da empresa de tradução Systran transformavam blocos de texto de uma língua para a outra em instantes (ou, pelo menos, à velocidade que a ligação à Internet permitia). Mas o que estava a ser analisado era a qualidade.

“As pessoas estão preocupadas com a possibilidade de os tradutores humanos deixarem de ser necessários se a tecnologia de tradução automática se continuar a desenvolver”, explica ao PÚBLICO Kang Dae-young, o organizador do concurso. “A ideia é averiguar o nível de desenvolvimento das tecnologias de tradução automática mais facilmente disponíveis, e perceber até que ponto podem substituir ou complementar a tradução humana.” 

Cada um dos tradutores automáticos na competição incorporou no ano passado novos mecanismos de tradução, que utilizam redes neuronais. São sistemas de inteligência artificial inspirados no cérebro humano, que conseguem analisar o contexto das frases e escolher a tradução mais adequada após estudar extensas bases de dados de materiais traduzidos.

Dae-young, que também é o director da divisão da Associação Internacional de Intérpretes Tradutores (IITA) da Coreia do Sul, acredita o desenvolvimento de redes neuronais é uma das grandes tendências na inteligência artificial. A notícia de que o mercado de serviços linguísticos de tradução e interpretação está a crescer – a uma taxa anual de 6%, de acordo com o relatório de 2016 do analista de mercado Common Sense Advisory –, parece não acalmar os tradutores humanos que têm de competir, cada vez mais, contra máquinas que produzem resultados quase instantaneamente, a tempo inteiro, sem ficarem cansadas. 

Há mais de meio século que se procura um “cérebro electrónico” capaz de traduzir sem ajuda de um humano. Foi em 1954 que a expressão surgiu nos jornais pela primeira vez. “Russo foi traduzido para inglês por um ‘cérebro’ electrónico”, lê-se no comunicado de imprensa da IBM da altura, que parece anunciar o fim das barreiras linguísticas. “Uma jovem que não entendia uma única palavra da língua dos soviéticos escreveu as mensagens russas nos cartões da IBM [na altura, os computadores usavam cartões perfurados]. O ‘cérebro’ enviou as suas traduções em inglês para uma impressora automática.” Com uma máquina capaz de converter russo em inglês à velocidade de duas linhas e meio de texto por segundo, acreditava-se que o problema da tradução automática estaria resolvido num período de três a cinco anos.

“Mais um obstáculo para a comunicação inter-cultural terá sido removido – mais um passo em direcção a uma maior compreensão”, disse na altura Leon Dostert, o linguista da universidade de Georgetown por detrás do projecto.

Não foi o caso. No final da década de 1960, o Governo americano contratou o linguista israelita Yehoshua Bar-Hillel para averiguar a viabilidade de se conseguir criar um sistema de tradução completamente automatizado num futuro próximo. “Completamente fora de questão” foi a conclusão do linguista, porque o significado de uma palavra depende frequentemente do resto da frase. Bar-Hillel deu o exemplo da palavra pen, que em inglês significa caneta e, ao mesmo tempo, uma espécie de berço para crianças pequenas. Sem a capacidade de interpretação contextual, a tradução automática total seria uma ilusão.

Houve uma diminuição drástica no investimento dos Estados Unidos na área, mas a saga pelo "cérebro" da tradução continuou. Um dos grandes avanços ocorreu no final dos anos 1980, quando se começou a apostar na criação de algoritmos que permitiam às máquinas utilizar extensas bases de dados com os textos originais e as respectivas traduções. Estes modelos estatísticos de tradução popularizaram-se globalmente na década passada, especialmente com a crescente fama do sistema de tradução online do Google.

Actualmente, com a introdução de sistemas neuronais, as máquinas deram um novo passo. O tradutor português Nuno Fernandes, que trabalha na gestão da empresa Found in Translation, explicou as vantagens ao PÚBLICO: “A tradução neuronal parte de uma base contextual. Ou seja, é definida uma área (desporto, por exemplo) e depois são aproveitados apenas os conteúdos traduzidos [guardados no sistema] aplicáveis a desporto. A base de erro ao nível do tom, do estilo e da terminologia é logo aqui reduzida.”

Esta tecnologia tem permitido que as máquinas aprendam mais depressa. Os investigadores do Google Tradutor – um dos sistemas a competir contra humanos em Sejong – já revelaram que a nova rede neuronal consegue trabalhar com pares de línguas nunca antes traduzidos sem ser treinada. O fenómeno, a que a equipa do Google chama de zero-shot translation (tradução do zero), mostra que o Google precisa de cada vez menos exemplos para aprender a completar uma tarefa.

“Se o sistema aprende algo depois de ver apenas um exemplo, chamamos one-shot learning [aprendizagem de uma vez]. Se aprende uma tarefa sem ver quaisquer exemplos, chamamos zero-shot learning, ou seja, aprendizagem do zero”, esclarece ao PÚBLICO Melvin Johnson, um dos engenheiros de software do Google.

Há vantagens ao nível do tempo e da qualidade: “Imagine que se quer traduzir algo de português para tâmil [uma língua falada no sul da Índia]. Um sistema de tradução típico traduz a frase do português para inglês, e só depois para tâmil.” É uma abordagem que torna o processo mais longo, mas que é necessária, porque é uma combinação rara de línguas, diz Johnson. Nestes casos os sistemas de tradução normalmente obrigam o inglês a agir como uma espécie de língua-ponte. Isto não é ideal porque se perde muita informação, por exemplo ao nível da formalidade, que não existe em inglês. “[O nosso] sistema aprende implicitamente a sua própria língua-ponte (que chamamos de "interlingua") de tal forma que pode traduzir entre idiomas sem perder informações”, explica Johnson.

Existem muitas vantagens em melhorar estes serviços para a comunidade em geral, diz Anabela Barreiro, investigadora na área da tradução automática: “[As traduções] apresentam frequentemente erros semântico-sintácticos e estilísticos, entre outros, mas são de grande utilidade ao possibilitarem a compreensão do tema de um texto ou conversa”, explica ao PÚBLICO. “A eventual falta de precisão não impede a compreensão da ideia geral.”

Embora imperfeitos, a investigadora pensa que estes sistemas facilitam amizades e contactos profissionais entre pessoas de nacionalidades distintas. Há cada vez mais: além de sites como o Facebook e o Twitter que traduzem mensagens entre várias línguas, o Skype tem um serviço de tradução das chamadas em tempo real. Já nem é preciso conhecer a língua em que um site foi escrito para o conseguir ler: browsers como o Chrome, do Google, traduzem-nos automaticamente. Árabe, francês, japonês (entre muitos outros) tornam-se português com um só clique. Esta semana, o teclado do Google para telemóveis Android passou a traduzir instantaneamente para outras línguas à medida que se escreve.

Humanos vencem

As recentes conquistas do Google não foram o suficiente para alcançar a vitória contra os tradutores humanos em Sejong. Os três tradutores automáticos ficaram atrás dos profissionais. Desta vez o problema não foi o contexto, mas a falta de capacidade das máquinas para analisarem o seu próprio trabalho.

“Em comparação com os seres humanos, a maior falha dos tradutores automáticos é que ainda não têm a capacidade de rever o seu trabalho para detectar e corrigir erros”, observa Dae-young. O comité de avaliação da Associação Internacional de Tradutores e Interpretes deu 25 pontos em 30 aos seres humanos, enquanto o melhor dos tradutores automáticos, o Google, apenas conquistou 15.

Foto
O tradutor automático do Google durante a competição em Sejong Universidade de Sejong

Embora as máquinas tenham falhado ao nível da tradução de jornais e textos literários, revelaram muito potencial ao nível de conteúdos mais simples e directos. Como tal, Dae-young acredita que serão uma ferramenta cada vez mais útil ao ser humano: “Para nos adaptarmos à nova era dos tradutores automáticos, temos de aprender a trabalhar com as várias ferramentas existentes. O papel do tradutor humano no futuro é completar a tradução final que vem de máquinas.”

O conceito não é estranho para os profissionais da área. O tradutor Nuno Fernandes diz que os pedidos de revisão de conteúdos traduzidos por mecanismos automatizados são cada vez mais comuns. “Se bem utilizada, [a tradução automática] reduz os tempos de tradução e aumenta a consistência e a qualidade do trabalho final. Permite fazer mais e melhor em menos tempo. Mas, se mal utilizada, resulta em traduções de fraca qualidade, em verdadeiros desastres. E são estes desastres que acabam por dar má reputação à tradução automática”, explica.

Simbiose

A startup portuguesa Unbabel, fundada em 2013, é um exemplo da crescente simbiose entre o tradutor humano e artificial. O serviço – que também vai actualizar o seu sistema de tradução automático online para trabalhar com os novos sistemas de redes neuronais– permite que tradutores amadores possam utilizar os seus conhecimentos em línguas para ganhar algum dinheiro extra ao rever conteúdos de tradução automática.

O fundador da Unbabel, Vasco Pedro, diz que o serviço não compete com os tradutores automáticos, porque não existem tradutores profissionais suficientes para colocar o mundo inteiro a comunicar.  “É uma gota de água se pensarmos no mundo inteiro. Não há um tradutor automático perfeito, mas também não existem tradutores suficientes para a ambição de pôr todo o mundo a conversar e a perceber-se”, diz Vasco Pedro. “O melhor é utilizar a comunidade mundial de pessoas que consegue falar mais do que uma língua e unir as suas capacidades às máquinas.”

Depois de o texto passar por um Unbabler (nome dado aos correctores humanos do sistema), passa a integrar a base de dados para que as máquinas possam aprender com a revisão. Para acelerar o processo, a Unbabel está a desenvolver um sistema de avaliação de qualidade que comprova se a tradução automática inicial precisa de passar por revisor humano.

Para Vasco Pedro, as três áreas da tradução – automática, humana, ou combinada – destinam-se a propósitos muito diferentes. “Os tradutores automáticos estão cada vez melhores e já resolvem muito sozinhos. Quando apenas se quer perceber uma página na Internet, noutra língua, o tradutor automático dá para se perceber a ideia do que está a ser dito”, esclarece Vasco Pedro. “Por outro lado, em termos de copyright, questões legais e de textos literários, muitas vezes não se está a falar da mera da tradução de algo, mas da recriação do conteúdo. Aí a Unbabel não é suficiente.”

“O nosso serviço nunca vai substituir os tradutores humanos, porque há nuances e subjectividades a nível cultural”, conclui Vasco Pedro. “Com a crescente evolução da tradução automática, o ser humano vai gerir os processos de inteligência artificial numa simbiose cada vez maior entre homem e máquina.”

Texto editado por João Pedro Pereira

Artigo corrigido: uma versão anterior do artigo utilizava o termo neural em vez de neuronal. "Rede neuronal" é a expressão portuguesa correcta para falar dos novos sistemas de tradução automáticos inspirados no funcionamento das células do sistema nervoso (neurónios). 

Sugerir correcção
Ler 4 comentários