Um chatbot de IA foi ensinado a piratear outros chatbots de IA

por Simone Regueira

escrito por Simone Regueira

Cientistas informáticos da Universidade Tecnológica de Nanyang descobriram como comprometer os chatbots de inteligência artificial (IA). Para o fazer, treinaram um chatbot para criar pistas que contornam as defesas de outros chatbots baseados em IA.

Os investigadores utilizaram um método duplo para “piratear” o LLM (large language model), a que chamaram “Masterkey”.

Primeiro, fizeram uma engenharia inversa da forma como os LLMs encontram e se defendem contra pedidos maliciosos. Utilizando esta informação, ensinaram o modelo a aprender automaticamente e a produzir dicas que contornam as defesas de outros LLMs. Este processo pode ser automatizado através da criação de um LLM de pirataria que se adapta e cria novos pedidos de pirataria mesmo depois de os programadores corrigirem os seus modelos.

Simone Regueira

postagem anterior

Uma nutricionista revelou como o queijo cottage é bom para as mulheres

próxima postagem

Um chatbot de IA foi ensinado a piratear outros chatbots de IA

Simone Regueira

Uma nutricionista revelou como o queijo cottage é bom para as mulheres

Implante cerebral transparente lê a atividade neural profunda

você pode gostar

O “espelho mágico” inteligente determina a tensão arterial,...

Os engenheiros desenvolveram uma bateria que funciona com...

A Honda revelou carros eléctricos futuristas que chegarão...

Implante cerebral transparente lê a atividade neural profunda