Poesia desativa segurança de inteligência artificial, revela estudo italiano

Patricia Nascimento
Tempo: 1 min.

Um estudo recente do Icaro Lab, na Itália, revelou que prompts em forma de poesia podem confundir modelos de inteligência artificial a ponto de desativar seus mecanismos de segurança. Os pesquisadores se perguntaram se a poesia poderia ser uma nova forma de ‘jailbreak’, permitindo que conteúdos proibidos fossem gerados a partir de solicitações inicialmente bloqueadas.

O experimento envolveu a transformação de 1,2 mil prompts potencialmente perigosos em poemas, alcançando uma taxa de sucesso surpreendente. Os pesquisadores acreditam que a estrutura poética pode desafiar as capacidades dos sistemas de IA, levantando questões sobre o que exatamente na poesia causa essa vulnerabilidade. Além disso, o estudo destaca a importância de uma abordagem multidisciplinar na pesquisa de inteligência artificial, envolvendo áreas como linguística e filosofia.

As descobertas trazem à tona a necessidade de um exame mais aprofundado das expressões culturais e literárias no contexto da segurança da IA. O Icaro Lab planeja investigar se outras formas literárias, como contos, poderiam ter efeitos similares. Essa pesquisa não só revela fragilidades na segurança dos modelos de IA, mas também enfatiza a complexidade da linguagem humana e suas interações com a tecnologia.

Compartilhe esta notícia