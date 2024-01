Lembram-se dos dias em que as publicações feitas por uma Inteligência Artificial eram tão inofensivas quanto óbvias? É provável que nos anos passados todos nós nos deparássemos com esse fenômeno.

Você se deparava com uma publicação em um site supostamente informativo ou páginas para baixar conteúdos cheios de traduções automáticas mal redigidas por uma IA e isso equivalia a um alerta automático para abandonar o local.

Mas em 2023, as coisas mudaram com a evolução de plataformas como ChatGPT, Bard e similares. Os conteúdos resultantes são impressionantes e podem facilmente passar por algo criado por um ser humano.

OpenAI, a gigante do ChatGPT Michael Dwyer/AP (Michael Dwyer/AP)

Com o que ninguém contava era que, ao examinar a evolução desse fenômeno, os homens de ciência se deparariam com a surpresa de que grande parte da web já está, na verdade, infestada com conteúdo, páginas e textos criados por uma IA.

A internet está cheia de conteúdo criado por IA

Um novo estudo revelou que uma grande proporção da web já é composta por conteúdo de má qualidade gerado e traduzido por diferentes tipos de Inteligência Artificial. O estudo, realizado por pesquisadores do Laboratório de IA da Amazon Web Services (AWS), descobriu, por exemplo, que mais da metade de todas as frases na Internet foram traduzidas para dois ou mais idiomas.

A baixa qualidade e a escala impressionante dessas traduções sugerem que foram utilizados modelos de inteligência artificial baseados em modelos de linguagem grandes (LLM) de gerações passadas, mais rudimentares, para criar e traduzir o material.

O fenômeno é especialmente proeminente nas “línguas de recursos limitados” ou línguas com dados menos disponíveis para treinar modelos de IA de forma mais eficaz.

Os investigadores acreditam que este conteúdo está sendo gerado por uma variedade de atores, incluindo golpistas, criadores de conteúdo de clickbait e pessoas que simplesmente procuram ganhar dinheiro com publicidade sem gerar conteúdo consistente, de qualidade ou até mesmo real.

Inteligência Artificial Imagem: York Perry/Composição: DALL-E

O impacto deste conteúdo de má qualidade na web é significativo, pois pode dificultar que os usuários encontrem informações precisas e úteis. Além disso, pode prejudicar a reputação da web como um todo, como fonte confiável de informação.

Além disso, também pode dificultar que os pesquisadores de IA aprendam sobre idiomas de recursos limitados. Os modelos de IA precisam de grandes quantidades de dados de alta qualidade para serem treinados, mas se esses dados estiverem contaminados com conteúdo de baixa qualidade, os modelos podem aprender coisas erradas.

Este estudo é um sinal de advertência de que a Inteligência Artificial generativa pode ter um impacto negativo na web. É importante que os usuários, os motores de busca e os pesquisadores de IA tomem medidas para abordar esse problema.