Bilhões de mensagens do Discord viram base para pesquisa científica brasileira

Estudo da UFMG com 2 bilhões de mensagens públicas gera debate sobre ética na coleta de dados e limites da privacidade digital
A coleta de dados e a metodologia da pesquisa
Pesquisadores da Universidade Federal de Minas Gerais (UFMG) reuniram 2 bilhões de mensagens públicas do Discord, plataforma de comunicação popular entre adolescentes, coletadas entre 2015 e 2024. O projeto, intitulado “Discord Revelado: Um Conjunto Abrangente de Dados de Comunicação Pública”, utilizou a API oficial da plataforma e o recurso “Discovery”, que lista servidores públicos, para acessar conversas de 31.673 comunidades . Os dados foram anonimizados, com substituição de nomes por pseudônimos e remoção de identificadores, visando preservar a privacidade dos usuários .
O objetivo, segundo os autores, é criar um banco de dados para estudos em ciências sociais, incluindo análises de saúde mental, desinformação e comportamento online. O material foi publicado no repositório arXiv em fevereiro de 2025 .
A polêmica legal e ética
Apesar de usar ferramentas disponibilizadas pelo Discord, a plataforma alega que a coleta em massa viola seus Termos de Serviço, que proíbem a extração de dados sem consentimento escrito. Em nota, a empresa afirmou que está investigando o caso e que “proteger a privacidade dos usuários é prioritário” .
Já o professor Diogo Cortiz, da PUC-SP, defende a legitimidade do estudo:
“A pesquisa seguiu a API oficial e os termos de uso. O Discord não especificou qual regra foi quebrada, o que sugere uma tentativa de mascarar falhas em sua segurança” .
O debate reflete um conflito global: enquanto pesquisadores argumentam que dados públicos são essenciais para entender dinâmicas sociais, plataformas resistem à coleta indiscriminada, mesmo com anonimização .
O debate sobre privacidade em ambientes “públicos”
A reação de usuários revela uma contradição: mesmo em servidores públicos, muitos não tinham ciência de que suas conversas poderiam ser armazenadas e analisadas. O Discord é visto como um espaço mais íntimo que redes como Twitter ou Reddit, especialmente por adolescentes — 40% dos usuários da plataforma têm entre 13 e 24 anos .
Apesar da anonimização, especialistas alertam que dados contextualizados (como discussões sobre saúde mental ou trauma) podem permitir a identificação indireta de participantes, principalmente em comunidades pequenas .
O papel do Discord na segurança de menores
A plataforma, que tem 200 milhões de usuários globais, enfrenta críticas históricas por falhas na moderação de crimes contra menores, como automutilação ao vivo e chantagem com imagens íntimas . Em 2025, o Brasil registrou aumento de 272% nas denúncias de conteúdo criminoso no Discord, incluindo casos investigados pela Polícia Civil de São Paulo .
O estudo da UFMG não incluiu servidores privados, mas destacou a necessidade de analisar como discursos de ódio e desinformação se propagam mesmo em espaços públicos .
Impacto científico e próximos passos
O dataset da UFMG é o maior já publicado sobre o Discord e inclui:
- Mensagens em 6 idiomas, incluindo português, espanhol e russo ;
- Atividade de bots (17% das interações) ;
- Tópicos diversificados, de política a apoio emocional .
Para pesquisadores, o material permite estudar desde a evolução de comunidades online até padrões de discurso em diferentes culturas. No entanto, o caso expõe a necessidade de regulamentações claras sobre coleta de dados públicos, equilibrando avanço científico e direitos digitais .
Fonte: Adaptado de reportagens do G1 , Tecnoblog , Guia Região dos Lagos e Medium .