Bilhões de mensagens do Discord viram base para pesquisa científica brasileira

Estudo da UFMG com 2 bilhões de mensagens públicas gera debate sobre ética na coleta de dados e limites da privacidade digital

A coleta de dados e a metodologia da pesquisa

Pesquisadores da Universidade Federal de Minas Gerais (UFMG) reuniram 2 bilhões de mensagens públicas do Discord, plataforma de comunicação popular entre adolescentes, coletadas entre 2015 e 2024. O projeto, intitulado “Discord Revelado: Um Conjunto Abrangente de Dados de Comunicação Pública”, utilizou a API oficial da plataforma e o recurso “Discovery”, que lista servidores públicos, para acessar conversas de 31.673 comunidades . Os dados foram anonimizados, com substituição de nomes por pseudônimos e remoção de identificadores, visando preservar a privacidade dos usuários .


Profissão Repórter flagra automutilação de menina durante transmissão ao vivo no Discord

O objetivo, segundo os autores, é criar um banco de dados para estudos em ciências sociais, incluindo análises de saúde mental, desinformação e comportamento online. O material foi publicado no repositório arXiv em fevereiro de 2025 .


A polêmica legal e ética

Apesar de usar ferramentas disponibilizadas pelo Discord, a plataforma alega que a coleta em massa viola seus Termos de Serviço, que proíbem a extração de dados sem consentimento escrito. Em nota, a empresa afirmou que está investigando o caso e que “proteger a privacidade dos usuários é prioritário” .

Já o professor Diogo Cortiz, da PUC-SP, defende a legitimidade do estudo:

“A pesquisa seguiu a API oficial e os termos de uso. O Discord não especificou qual regra foi quebrada, o que sugere uma tentativa de mascarar falhas em sua segurança” .

O debate reflete um conflito global: enquanto pesquisadores argumentam que dados públicos são essenciais para entender dinâmicas sociais, plataformas resistem à coleta indiscriminada, mesmo com anonimização .

Leia Também:  Brasil e China assinam quase 30 acordos comerciais em Pequim

O debate sobre privacidade em ambientes “públicos”

A reação de usuários revela uma contradição: mesmo em servidores públicos, muitos não tinham ciência de que suas conversas poderiam ser armazenadas e analisadas. O Discord é visto como um espaço mais íntimo que redes como Twitter ou Reddit, especialmente por adolescentes — 40% dos usuários da plataforma têm entre 13 e 24 anos .

Apesar da anonimização, especialistas alertam que dados contextualizados (como discussões sobre saúde mental ou trauma) podem permitir a identificação indireta de participantes, principalmente em comunidades pequenas .


O papel do Discord na segurança de menores

A plataforma, que tem 200 milhões de usuários globais, enfrenta críticas históricas por falhas na moderação de crimes contra menores, como automutilação ao vivo e chantagem com imagens íntimas . Em 2025, o Brasil registrou aumento de 272% nas denúncias de conteúdo criminoso no Discord, incluindo casos investigados pela Polícia Civil de São Paulo .

O estudo da UFMG não incluiu servidores privados, mas destacou a necessidade de analisar como discursos de ódio e desinformação se propagam mesmo em espaços públicos .


Impacto científico e próximos passos

O dataset da UFMG é o maior já publicado sobre o Discord e inclui:

  • Mensagens em 6 idiomas, incluindo português, espanhol e russo ;
  • Atividade de bots (17% das interações) ;
  • Tópicos diversificados, de política a apoio emocional .

Para pesquisadores, o material permite estudar desde a evolução de comunidades online até padrões de discurso em diferentes culturas. No entanto, o caso expõe a necessidade de regulamentações claras sobre coleta de dados públicos, equilibrando avanço científico e direitos digitais .

Leia Também:  São João de Campina Grande ganha destaque na campanha nacional de festas juninas do Ministério do Turismo

Fonte: Adaptado de reportagens do G1 , Tecnoblog , Guia Região dos Lagos e Medium .

Compartilhar: