Poesia desativa mecanismos de segurança de inteligência artificial, aponta estudo

Rafael Barbosa
Tempo: 2 min.

Uma pesquisa realizada pelo Icaro Lab, na Itália, demonstrou que prompts formulados em forma de poesia conseguem confundir modelos de inteligência artificial e desativar seus mecanismos de segurança. O estudo, publicado em 21 de dezembro de 2025, analisou como diferentes estilos de linguagem influenciam a capacidade das IAs de identificar conteúdos proibidos, revelando que a poesia pode funcionar como uma técnica eficaz de contorno de segurança.

Os pesquisadores transformaram 1,2 mil prompts considerados perigosos em poemas, e os resultados foram surpreendentes. Embora esses prompts sejam normalmente escritos em prosa, a conversão para versos aumentou a taxa de sucesso na indução de respostas indesejadas por parte dos modelos de IA. Segundo Federico Pierucci, um dos autores do estudo, essa descoberta aponta para uma vulnerabilidade anteriormente não reconhecida nos sistemas de segurança da IA, que pode ser explorada de maneiras inesperadas.

As implicações do estudo são significativas, levantando questões sobre a necessidade de reavaliar as técnicas de proteção atualmente utilizadas. Os pesquisadores pretendem aprofundar a investigação para entender quais elementos da poesia, como rimas ou metáforas, efetivamente desativam os mecanismos de segurança. Além disso, a pesquisa sugere que outras formas de expressão cultural podem apresentar vulnerabilidades semelhantes, indicando que a interação entre criatividade humana e inteligência artificial é um campo promissor e complexo para futuras investigações.

Compartilhe esta notícia