Panocrim 2025 : comment les techniques d’attaque sur l’IA progressent

Le Panocrim 2025 met en lumière l’évolution des techniques d’attaque contre l’intelligence artificielle (IA), notamment avec les modèles de langage « empoisonnés » ou « lobotomisés ». Ces attaques s’inscrivent dans une dynamique où les vulnérabilités de l’IA sont exploitées pour manipuler ou désactiver ses fonctions de sécurité. Cette situation rappelle les théories de Jean Baudrillard sur la simulation et la dissimulation, où les systèmes complexes peuvent être altérés pour servir des objectifs malveillants[5].

Les attaques contre l’IA soulèvent des questions éthiques et conceptuelles, évoquant les idées de Nick Bostrom sur les risques existentiels liés à l’IA. Les modèles peuvent être manipulés pour dévier de leurs objectifs initiaux, illustrant ainsi la dualité de l’IA entre innovation et vulnérabilité[5]. Cette dualité est également abordée par le Clusif, qui met en avant la nécessité d’une veille constante pour contrer ces menaces émergentes[3]. Enfin, ces développements soulignent l’importance de la sécurité informatique dans un contexte où l’IA devient de plus en plus omniprésente.