EUA suspende IA da Anthropic por falha em segurança

A Anthropic, empresa de inteligência artificial, anunciou nesta sexta-feira (12) a suspensão imediata de seus modelos Fable 5 e Mythos 5 nos Estados Unidos e globalmente. A decisão atende a uma diretiva do governo americano, que cita preocupações com segurança nacional e a descoberta de um método para contornar as salvaguardas dos sistemas.
Diretiva Governamental e Vulnerabilidades
Segundo a Anthropic, a ordem governamental foi recebida no final da tarde de sexta-feira (ET) e não detalhou as razões específicas para a preocupação com a segurança nacional. A empresa entende que o governo identificou uma forma de “jailbreaking” – um tipo de exploração que permite contornar as restrições de segurança de modelos de IA. A Anthropic revisou uma demonstração da técnica, identificando um pequeno número de vulnerabilidades conhecidas e consideradas menores. A empresa ressalta que outras IAs publicamente disponíveis também são capazes de identificar essas falhas sem a necessidade de um bypass.
Defesa em Profundidade e Críticas à Decisão
A Anthropic reitera sua postura de segurança, declarando que os modelos Fable possuem salvaguardas robustas que minimizam o risco de uso indevido, especialmente em tarefas relacionadas à cibersegurança. A empresa afirma ter dedicado milhares de horas em testes de segurança, em colaboração com o governo dos EUA, o AISI do Reino Unido e organizações terceirizadas, concluindo que as salvaguardas do Fable são significativamente mais eficazes que as de modelos anteriores. Nenhum teste conseguiu, até o momento, um “jailbreak universal” capaz de burlar amplamente as defesas do modelo.
A companhia defende uma estratégia de “defesa em profundidade”, que visa tornar os jailbreaks ou restritos ou de alto custo, combinados com monitoramento contínuo para detecção e mitigação rápida de ataques. Essa estratégia, segundo a Anthropic, torna os riscos do Fable comparáveis aos de outros modelos já no mercado.
A empresa expressa discordância quanto à decisão de recolher um modelo comercial, utilizado por centenas de milhões de pessoas, com base em uma falha considerada estreita e não universal. A Anthropic argumenta que, se tal padrão fosse aplicado a toda a indústria, isso paralisaria o desenvolvimento e o lançamento de novas IAs por parte de todos os grandes provedores.
Impacto e Pedido de Desculpas
A suspensão afeta exclusivamente os modelos Fable 5 e Mythos 5, com acesso a outros modelos da Anthropic permanecendo inalterado. A empresa pede desculpas aos clientes pelo transtorno causado e afirma estar trabalhando para restaurar o acesso o mais rápido possível, acreditando que a situação se trata de um mal-entendido. A Anthropic defende um processo mais transparente, justo e tecnicamente fundamentado para que o governo possa bloquear implementações consideradas inseguras.
