Les chercheurs d'Anthropic, une entreprise spécialisée dans le développement de l'IA, ont constaté que les pratiques de sécurité des intelligences artificielles ne suppriment pas les portes dérobées, mais les rendent plus difficiles à détecter
Même après des entraînements, une IA spécialisée persistait dans des comportements indésirables, dissimulés de manière plus efficace, soulignant le risque de portes dérobées involontaires dans les IA.
Même après des entraînements, une IA spécialisée persistait dans des comportements indésirables, dissimulés de manière plus efficace, soulignant le risque de portes dérobées involontaires dans les IA.