CiênciasInteligência Artificial

ChatGPT: O Poluidor Digital que Ameaça o Futuro da IA

A ascensão meteórica do ChatGPT, lançado pela OpenAI em novembro de 2022, transformou a internet em um vasto depósito de conteúdos artificiais de baixa qualidade, apelidados de “AI slop” (lixo de IA). Segundo artigo publicado pela Futurism em 16 de junho de 2025, essa poluição digital está comprometendo o desenvolvimento de novos modelos de inteligência artificial, em um fenômeno conhecido como “colapso de modelo”. À medida que IAs treinam com dados gerados por outras IAs, a originalidade e a qualidade diminuem, criando um ciclo vicioso que pode travar avanços na área.

O Que é o Colapso de Modelo?

O colapso de modelo ocorre quando IAs, como o ChatGPT, são treinadas com dados sintéticos produzidos por outras IAs, em vez de conteúdos humanos autênticos. Maurice Chiodo, pesquisador da Universidade de Cambridge, compara isso à contaminação do aço por radiação após testes nucleares de 1945. Assim como o “aço de baixo fundo” pré-1945 é valioso para equipamentos sensíveis, dados anteriores a 2022, antes da explosão do ChatGPT, são considerados “limpos”. Após essa data, a internet está “suja” com textos artificiais, como posts de redes sociais, releases corporativos e até ensaios acadêmicos, que carecem de profundidade e criatividade.

Impactos na Internet e na IA

A poluição causada pelo ChatGPT é vasta. Um estudo de 2023, citado pela Futurism, mostrou que a proporção de textos gerados por modelos de linguagem em releases corporativos saltou de 2-3% para 24% até o final de 2023. Esse “lixo” digital, que inclui conteúdos de marketing e postagens automáticas, forma um ciclo onde IAs aprendem com suas próprias criações, perdendo a capacidade de replicar a riqueza do pensamento humano. Técnicas como geração aumentada por recuperação (RAG), que busca dados em tempo real na internet, agravam o problema ao incorporar conteúdos já contaminados.

Leia Também:  MIT Revela: ChatGPT Pode Reduzir Criatividade e Atividade Cerebral em Estudantes

Desafios para o Futuro

Chiodo, coautor de um artigo de 2024, alerta que a poluição de dados dá vantagem injusta a pioneiros como a OpenAI, que treinaram seus modelos com dados mais “puros” pré-2022. A limpeza desses dados é considerada “proibitivamente cara, provavelmente impossível”. Além disso, a resistência da indústria à regulação, como rotulagem de conteúdos de IA, dificulta soluções. Rupprecht Podszun, professor de direito na Universidade de Düsseldorf, observa que a falta de regras reflete uma fase inicial de inovação desregulada, mas necessária para o progresso a longo prazo.

Para Entender de Forma Simples

Imagine a internet como um lago onde IAs jogam lixo (textos artificiais). Quanto mais lixo, mais difícil é encontrar água limpa (dados humanos) para treinar novas IAs. Com o tempo, as IAs ficam menos inteligentes, como se bebessem água contaminada, afetando sua capacidade de criar algo útil ou original.

Consequências Além da Tecnologia

Além de prejudicar a IA, a poluição digital tem impactos sociais. A disseminação de conteúdos sintéticos amplifica desinformação, como em campanhas políticas ou decisões automatizadas em saúde e finanças. No Brasil, onde a desinformação já é um desafio, o aumento de “AI slop” pode agravar problemas em eleições ou debates públicos. A educação também sofre, com estudantes usando ChatGPT para tarefas, o que pode comprometer o aprendizado crítico, como apontado em posts no X.

Leia Também:  Google perde espaço para ChatGPT na nova era das buscas online

O Caminho Adiante

Resolver a poluição digital exige regulamentações, como a rotulagem de conteúdos de IA, e investimentos em fontes de dados limpos. No entanto, a relutância da indústria e a escala do problema tornam o futuro incerto. A comparação com o aço contaminado sugere que, assim como recorremos a navios afundados em 1919 para obter materiais puros, os dados pré-2022 podem ser a última esperança para salvar a IA do colapso. A OpenAI, pioneira na criação do problema, enfrenta agora o desafio de liderar soluções, enquanto a sociedade lida com um ecossistema digital cada vez mais comprometido.

Fontes: Futurism, The Register, Nature,

Compartilhar: