Estudante norte-americano criou um programa que descobre se um texto foi escrito pelo ChatGPT
Programa criado por Edward Tian nas férias de Natal parece ter 98% de eficácia. Durante o desenvolvimento do GPTZero, mais de 35 mil professores ficaram em lista de espera para o experimentar.
Enquanto o mundo se questionava sobre como o ChatGPT podia significar o fim de textos originais, um estudante norte-americano decidiu, durante as férias do Natal de 2022, criar uma forma de detectar se um texto foi, ou não, escrito pelo programa de inteligência artificial de que tanto se tem falado. Edward Tian tem 22 anos, estuda na Universidade de Princeton, em Nova Jérsia, e é o responsável pelo GPTZero, uma espécie de antídoto para o ChatGPT.
Segundo a New Scientist, a ferramenta não só avalia a probabilidade de um texto ter sido escrito por inteligência artificial, como vê de que forma essa probabilidade varia ao longo do texto. Nos testes realizados, o programa mostrou um nível de precisão de 98%.
Para verificar se um texto é de origem humana, como explica um artigo da NPR, o GPTZero utiliza dois indicadores: perplexidade e ruptura. A perplexidade relaciona-se com a complexidade do texto. Quanto mais complexo é um texto, mais perplexo fica o GPTZero e maior é a probabilidade de ter origem humana. A ruptura está relacionada com a variação nas frases. Os seres humanos tendem a escrever com uma mistura de frases complexas e simples. Um texto escrito por inteligência artificial é, normalmente, mais uniforme.
Entre professores, a ferramenta criada por Edward Tian já é um sucesso. Segundo o El País, durante o desenvolvimento da versão do GPTZero direccionada a docentes, chegou a haver 35 mil professores em lista de espera para a experimentar.
Quando Tian, durante as férias de Natal, visitou a sua antiga escola, uma professora confessou-lhe que os alunos já tinham começado a utilizar o ChatGPT. Segundo o jornal espanhol, Edward Tian considera que o GPTZero é visto pelos professores com alívio: “Muitos dizem que é reconfortante saber que o GPTZero existe.”
O estudante universitário não tem dúvidas de que a tecnologia por detrás do ChatGPT “é incrível”. Porém, sublinhou à NPR que é importante agir com responsabilidade: “Acredito que é o futuro. Mas, ao mesmo tempo, é como se abríssemos uma caixa de Pandora. E precisamos de salvaguardar que o adoptamos de forma responsável.”
Apesar da eficácia do GPTZero, já houve especialistas que alertaram para o facto de este se poder tornar menos exacto à medida que o ChatGPT se for actualizando, revela o El País.
O laboratório de inteligência artificial (IA) responsável pela criação do ChatGPT também tem demonstrado preocupação com o impacto da ferramenta. Para isso, criou um programa com o intuito de verificar se um texto foi escrito por inteligência artificial. De acordo com o resultado, a probabilidade de se ter usado IA podia classificar-se como “muito improvável”, “improvável”, “possível” ou “provável”. Porém, o próprio laboratório reconheceu a falibilidade do programa, que só identificou correctamente 26% dos textos escritos por IA.
O ChatGPT foi lançado a 30 de Novembro de 2022 e, passados três meses, já ultrapassou os 100 milhões de utilizadores mensais. Segundo a Forbes, é a aplicação web com o crescimento mais rápido de sempre. A empresa OpenAI, co-fundada por Elon Musk, está, actualmente, avaliada em 27,1 mil milhões de euros.
Apesar de ser um programa de computador criado para responder a perguntas, cedo começaram a levantar-se questões sobre a capacidade que este terá de escrever textos sobre um determinado tema ou mesmo peças de ficção.
Como indica o nome, o programa utiliza o Generative Pre-Trained Transformer (GPT). Um transformer é um modelo de linguagem que encontra padrões em sequências de dados e procura a melhor palavra para encaixar numa determinada frase, até formar um texto.
Para saber que palavra escolher, o ChatGPT utiliza bases de dados maciças. Para referência, o modelo de linguagem GPT-3 (anterior ao GPT3.5, utilizado pelo chat GPT) conhecia, no final de Novembro de 2022, 175 gigabytes de texto. Algo semelhante a um livro com 11 milhões de páginas.