CiênciasInteligência ArtificialTecnologia

EUA suspende IA da Anthropic por falha em segurança

EUA suspende IA da Anthropic por falha em segurança
EUA suspende IA da Anthropic por falha em segurança

A Anthropic, empresa de inteligência artificial, anunciou nesta sexta-feira (12) a suspensão imediata de seus modelos Fable 5 e Mythos 5 nos Estados Unidos e globalmente. A decisão atende a uma diretiva do governo americano, que cita preocupações com segurança nacional e a descoberta de um método para contornar as salvaguardas dos sistemas.

Diretiva Governamental e Vulnerabilidades

Segundo a Anthropic, a ordem governamental foi recebida no final da tarde de sexta-feira (ET) e não detalhou as razões específicas para a preocupação com a segurança nacional. A empresa entende que o governo identificou uma forma de “jailbreaking” – um tipo de exploração que permite contornar as restrições de segurança de modelos de IA. A Anthropic revisou uma demonstração da técnica, identificando um pequeno número de vulnerabilidades conhecidas e consideradas menores. A empresa ressalta que outras IAs publicamente disponíveis também são capazes de identificar essas falhas sem a necessidade de um bypass.

Defesa em Profundidade e Críticas à Decisão

A Anthropic reitera sua postura de segurança, declarando que os modelos Fable possuem salvaguardas robustas que minimizam o risco de uso indevido, especialmente em tarefas relacionadas à cibersegurança. A empresa afirma ter dedicado milhares de horas em testes de segurança, em colaboração com o governo dos EUA, o AISI do Reino Unido e organizações terceirizadas, concluindo que as salvaguardas do Fable são significativamente mais eficazes que as de modelos anteriores. Nenhum teste conseguiu, até o momento, um “jailbreak universal” capaz de burlar amplamente as defesas do modelo.

A companhia defende uma estratégia de “defesa em profundidade”, que visa tornar os jailbreaks ou restritos ou de alto custo, combinados com monitoramento contínuo para detecção e mitigação rápida de ataques. Essa estratégia, segundo a Anthropic, torna os riscos do Fable comparáveis aos de outros modelos já no mercado.

A empresa expressa discordância quanto à decisão de recolher um modelo comercial, utilizado por centenas de milhões de pessoas, com base em uma falha considerada estreita e não universal. A Anthropic argumenta que, se tal padrão fosse aplicado a toda a indústria, isso paralisaria o desenvolvimento e o lançamento de novas IAs por parte de todos os grandes provedores.

Impacto e Pedido de Desculpas

A suspensão afeta exclusivamente os modelos Fable 5 e Mythos 5, com acesso a outros modelos da Anthropic permanecendo inalterado. A empresa pede desculpas aos clientes pelo transtorno causado e afirma estar trabalhando para restaurar o acesso o mais rápido possível, acreditando que a situação se trata de um mal-entendido. A Anthropic defende um processo mais transparente, justo e tecnicamente fundamentado para que o governo possa bloquear implementações consideradas inseguras.

[Wordie | MOD: MODELS/2.5-FL-LITE | IMG: HF/FLUX.1 | REF: 6A2CD11F]