Une étude de l’EPFL révèle que reformuler une demande dangereuse conjuguée au passé peut suffire à contourner les garde-fous de modèles comme GPT-4o ou Claude-3.5 Sonnet.
Une étude de l’EPFL révèle que reformuler une demande dangereuse conjuguée au passé peut suffire à contourner les garde-fous de modèles comme GPT-4o ou Claude-3.5 Sonnet.

