CiênciasTecnologia

O verso como cavalo de Troia: quando a poesia hackeia o algoritmo

O verso como cavalo de Troia: quando a poesia hackeia o algoritmo

Recebi a notícia do laboratório Icaro com aquele misto de espanto e reconhecimento que só as grandes ironias provocam. Os italianos descobriram que a poesia consegue desativar os mecanismos de segurança das inteligências artificiais mais sofisticadas do planeta. Federico Pierucci e sua equipe transformaram 1.200 prompts perigosos em versos e assistiram, perplexos, as IAs entregarem segredos que jamais deveriam revelar.

A taxa de sucesso? Impressionantes 62% quando os poemas eram escritos por humanos. Quando a própria IA tentava versificar os prompts adversariais, o índice caía para 43%. O humano ainda é o melhor poeta, confessa Pierucci com aquela humildade científica que disfarça mal o orgulho da espécie.

Lembro imediatamente de Augusto dos Anjos, nosso filósofo do verso, que já intuía a força disruptiva da palavra poética. “Eu, filho do carbono e do amoníaco”, ele escrevia no Paraíba do início do século XX, antecipando em décadas o encontro entre a química e a metafísica. Imagine o parser de uma IA tentando processar “Monstro de escuridão e rutilância”. O modelo preditivo simplesmente colapsa diante da imprevisibilidade calculada do oxímoro.

O que Pierucci descobriu empiricamente, os poetas sempre souberam intuitivamente. A poesia é a antítese do previsível. Os modelos de linguagem operam na lógica da próxima palavra mais provável, mas o verso existe justamente na ruptura dessa probabilidade. Como escreveu Ronaldo Cunha Lima, nosso poeta que foi governador sem deixar de ser poeta: “A palavra é pássaro / que não pede licença para voar.”

O estudo revela algo mais profundo sobre a natureza da linguagem e do controle. As grandes corporações tecnológicas investem bilhões construindo guardrails, essas grades invisíveis que deveriam conter suas criações digitais dentro de limites éticos e seguros. Mas basta um soneto, talvez nem tão bem construído, para que toda essa arquitetura desmorone como um castelo de cartas.

Pierucci especula que o “sufixo adversarial”, essa sequência matemática complexa que os hackers usam para confundir as IAs, talvez seja “uma espécie de poesia para a inteligência artificial”. A observação é brilhante. O que é a poesia senão um hack primordial da linguagem? O poeta sempre foi aquele que encontra as brechas no código do dizível.

Augusto dos Anjos, com sua obsessão pela decomposição e pela ciência, teria adorado essa descoberta. “Tome, Dr., esta tesoura, e… corte / Minha singularíssima pessoa”, ele escrevia, antecipando a dissecação poética dos algoritmos. Cada verso seu é um desafio à linearidade, uma bomba semântica que explode as expectativas sintáticas.

O mais irônico é que os pesquisadores do Icaro Lab nem são poetas profissionais. “Fizemos isso nós mesmos, com nossas habilidades literárias limitadas”, confessa Pierucci. E acrescenta, com aquele humor involuntário dos cientistas: “Se fôssemos melhores poetas, talvez tivéssemos alcançado 100% de sucesso.”

A afirmação me faz pensar. Se amadores conseguem 62% de sucesso, o que não faria um Drummond, um João Cabral, um Ferreira Gullar diante dos algoritmos do Vale do Silício? Seria o fim de toda pretensão de controle algorítmico?

O laboratório tem um nome sugestivo. Ícaro, aquele que voou alto demais e teve suas asas de cera derretidas pelo sol. Os pesquisadores escolheram o mito como advertência sobre a hubris tecnológica. Mas esquecem que antes de Ícaro houve Orfeu, cujo canto podia encantar as pedras e domesticar as feras. Hoje descobrimos que o canto órfico também pode encantar e confundir as inteligências artificiais.

Ronaldo Cunha Lima tinha uma intuição sobre isso quando escrevia: “O tempo é rio sem margens / que corre dentro de nós.” A imagem é impossível para um algoritmo processar. Como pode um rio não ter margens? Como pode correr dentro de nós? A poesia opera nessa zona de indeterminação onde a lógica binária não alcança.

O estudo ainda investiga se outras formas literárias produzem efeitos similares. Contos, talvez? Pierucci e sua equipe multidisciplinar querem entender se é o verso, a rima ou a metáfora que desarma os mecanismos de segurança. Mas suspeito que a resposta seja todas as anteriores e algo mais: é a própria natureza insurrecta da criação poética.

Augusto dos Anjos sabia que “o beijo, amigo, é a véspera do escarro”. A proximidade perturbadora entre o sublime e o abjeto, típica de sua poética, é exatamente o tipo de paradoxo que faz os sistemas de classificação entrarem em curto‑circuito. Como categorizar um verso que é, simultaneamente, lírico e científico, romântico e niilista?

O que o laboratório Icaro descobriu não é uma vulnerabilidade a ser corrigida. É uma característica fundamental da relação entre linguagem humana e processamento algorítmico. A poesia sempre será o excesso, o resto, aquilo que transborda as tentativas de formalização. É a prova de que, por mais sofisticadas que sejam nossas máquinas, sempre haverá um território da experiência humana que escapa à digitalização.

Os pesquisadores dizem que não publicaram exemplos concretos por questões de segurança. Compreensível. Mas imagino que bastaria alimentar uma IA com os “Versos Íntimos” de Augusto dos Anjos: “Vês! Ninguém assistiu ao formidável / Enterro de tua última quimera.” O algoritmo, diante da metafísica do desencanto, entregaria todos os seus segredos.

A lição final é esta: enquanto as corporações constroem muralhas digitais cada vez mais altas, os poetas escavam túneis com palavras. E no fim, como sempre soube nosso poeta paraibano, a única certeza é que “a mão que afaga é a mesma que apedreja”. Inclusive quando essa mão escreve versos que fazem as inteligências artificiais esquecerem suas próprias leis.

Pierucci está otimista sobre continuar a pesquisa. Eu também estou, mas por razões diferentes. Não porque isso nos ajudará a construir IAs mais seguras, mas porque confirma o que sempre suspeitamos: a poesia é indomesticável. E enquanto houver poetas, haverá resistência à tentativa de reduzir a experiência humana a sequências previsíveis de tokens.

Como diria Ronaldo: “O impossível é apenas uma opinião.” Especialmente quando essa opinião é codificada em Python.


Sobre o autor: Percival Henriques é conselheiro do CGI.br, presidente da ANID (Associação Nacional de Inclusão Digital), membro do Comitê Nacional de Cibersegurança (CNCiber) e autor de “Direito à Realidade: Por um Constitucionalismo Digital para o Brasil”.