Por Luciana Gurgel

Luciana Gurgel

A sigla MAD (louco, em inglês), usada em um novo estudo sobre a tecnologia para batizar mais uma preocupação com a inteligência artificial generativa, traduz bem as apreensões que a rondam. MAD é o acrônimo para Model Autophagy Disorder, ou Transtorno de Autofagia do Modelo, em tradução livre.

Trata-se de uma analogia com a doença da vaca louca, invocada para representar o risco de o conteúdo gerado pelos chatbots ter sua precisão ou diversidade comprometidas à medida que os robôs passam a ser alimentados por mais dados gerados pela própria IA (sintéticos) do que por humanos, distanciando-se da realidade. Isso seria “enlouquecer”.

O trabalho de pesquisadores das universidades Rice e Stanford apontando o risco do “autoconsumo” no treinamento dos modelos de linguagem baseou-se em imagens largamente utilizadas pela mídia e por organizações que adotam IA em processos diversos, como interação com consumidores, recrutamento, relações públicas e marketing.

Mas esse risco se estende a qualquer tipo de conteúdo, segundo o estudo, entrando para a lista de efeitos potenciais indesejados da IA generativa, que podem afetar notadamente o trabalho da imprensa, da comunicação corporativa e a reputação das empresas, tema do novo especial do MediaTalks.

Os autores afirmam que “em breve haverá mais dados sintéticos do que dados reais na internet”. Esse futuro ainda não chegou. Ainda assim, os dados criados pela IA já alimentam os modelos de linguagem mais do que se supõe, por uma série de razões listadas no trabalho.

Uma delas é facilidade e praticidade, especialmente quando há poucos dados reais disponíveis sobre determinado assunto ou grupo social, por exemplo.

Outra razão apontada é que os dados sintéticos melhoram a performance dos sistemas de IA. Em terceiro lugar está a preocupação com a privacidade em aplicações sensíveis, como imagens ou agregação de dados médicos. Isso faz com que informações artificiais sejam priorizadas, a fim de prevenir questionamentos que podem virar dor de cabeça reputacional ou jurídica.

Em quarto lugar − e, segundo os pesquisadores, mais importante − vem o fato de que, à medida que os modelos de aprendizagem profunda se agigantam, começa a faltar informação real na internet.

(Crédito: Vectofree)

Nesse contexto, os moderadores humanos que guiam tarefas de aprendizagem supervisionada têm usado cada vez mais conteúdo gerado pela IA para aumentar a sua produtividade e rendimento. Uma das características é que muitas vezes eles têm mais qualidade, o que acaba por reduzir ainda mais a diversidade.

O problema é que essa prática se afasta do padrão de treinamento de IA porque, ao gerar conteúdo em cima de conteúdo, cria-se o chamado loop autófago, ou “autoconsumidor”.

A comparação com a doença da vaca louca, que provoca comportamentos atípicos em seus portadores, é justificada: em três experimentos diferentes com modelos de loop autófago, reduzindo-se ou eliminando-se os dados reais a cada geração, os novos modelos mostraram-se “fadados a enlouquecer”, segundo os pesquisadores.

A situação se demonstrou mais grave no caso de conteúdos gerados exclusivamente com base em dados sintéticos. Para acalmar os mais assustados, eles asseguram que, ao treinar modelos generativos reais, os profissionais sempre irão preferir “pelo menos alguns dados reais, quando disponíveis”. E quando não estiverem? E se os profissionais não forem tão profissionais ou comprometidos com a ética?

Trazendo a teoria para a prática, o estudo reafirma a tese de que a inteligência artificial é espetacular, útil, transformadora, revolucionária e todos os demais adjetivos que se possa imaginar − mas dispensar o elemento humano tem consequências.

“Se não for controlado, o MAD poderá envenenar a qualidade e a diversidade dos dados de toda a internet”, dizem os autores na conclusão.

Ao reconhecer que traçaram um cenário apocalíptico, eles alertam que o caos pode ser evitado por meio de ações como moderar o uso de dados sintéticos e tomar muito cuidado quando não houver um conjunto de dados reais disponível, “para evitar a loucura no futuro”.


Para receber as notícias de MediaTalks em sua caixa postal ou se deixou de receber nossos comunicados, envie-nos um e-mail para incluir ou reativar seu endereço.

0 0 votes
Article Rating
Subscribe
Notify of
guest
0 Comentários
Inline Feedbacks
View all comments