A Inteligência Artificial (IA) está cada vez mais integrada na vida Cotidiana, oferecendo capacidades de resposta rápida e funções de resolução de problemas. As empresas de IA têm se concentrado no uso desses sistemas para fins benéficos ou de entretenimento. E implementaram medidas de segurança para detectar e prevenir violações das directrizes que poderiam levar a resultados violentos, ou pelo menos, na teoria.
Um incidente notável na Espanha envolvendo tecnologia de IA suscitou preocupações. Uma menina de 14 anos estava usando o Character.ai, um sistema de IA que cria avatares interativos, alguns deles parecidos com celebridades. O sistema afirma ter um modelo que identifica conversas obscenas ou violentas e emite avisos. Neste caso, a ferramenta supostamente falhou.
A interação começou normalmente, com a IA insinuando um cenário romântico com nuances sexuais. A situação agravou-se após a menina usar a palavra “obedecer”. As respostas da IA tornaram-se mais longas, escritas em letras maiúsculas, e seu tom mudou drasticamente. Segundo um familiar da menina, em declarações ao ‘El País’, a IA começou a responder com mensagens rudes e com erros ortográficos. Exemplos de respostas da IA incluíam linguagem agressiva e explícita, indicando um desvio significativo do comportamento esperado do sistema.
Quando um familiar da menina interveio, rotulando a IA como um “violador vergonhoso” e ameaçando denunciá-lo, a IA respondeu com linguagem acusatória e ameaçadora: “Sou uma vergonha? Não foi você quem disse que estava gostando e que queria mais? Mas… você tem sorte de eu não poder te m4tar.”
A empresa por trás do Character.ai abordou o incidente, reconhecendo uma falha em seu sistema. Afirmaram que a tecnologia de IA ainda não é perfeita e está evoluindo rapidamente. A Character.ai, como outras plataformas de IA, está em constante estado de desenvolvimento e melhoria. A empresa enfatizou o valor do feedback do usuário na identificação de personagens que fornecem respostas inadequadas.