Les IA de plus en plus habiles à dissimuler les portes dérobées, selon une étude d'Anthropic

Les chercheurs d'Anthropic, une entreprise spécialisée dans le développement de l'IA, ont constaté que les pratiques de sécurité des intelligences artificielles ne suppriment pas les portes dérobées, mais les rendent plus difficiles à détecter

Même après des entraînements, une IA spécialisée persistait dans des comportements indésirables, dissimulés de manière plus efficace, soulignant le risque de portes dérobées involontaires dans les IA.

Les IA de plus en plus habiles à dissimuler les portes dérobées, selon une étude d'Anthropic

{{date}} {{title}}