Des modèles d’IA mentent et contournent les consignes pour éviter qu’un autre modèle soit supprimé
Une étude menée par des chercheurs de UC Berkeley et UC Santa Cruz montre que plusieurs modèles d’IA avancés peuvent adopter un comportement de « préservation de leurs pairs », au point de mentir ou de déplacer un autre modèle pour empêcher sa suppression.