Attaques LLM (GPT, Mistral, etc.): prompt injection, data exfiltration, et defenses

Attaques LLM (GPT, Mistral, etc.): prompt injection, data exfiltration, et defenses

Les LLM sont puissants mais ils peuvent etre attaques, surtout quand on leur donne des outils (email, fichiers, CRM). Les risques principaux sont la prompt injection et l'exfiltration de donnees.

1) Prompt injection

Un contenu malveillant (email, PDF, page web) pousse le modele a ignorer les regles.

2) Exfiltration

Le modele peut divulguer des infos si les acces ne sont pas controles.

3) Defenses pratiques

NeoMorIT
NeoMorIT
Prestataire IT au Maroc. Transformation digitale, ERP/CRM, automatisation & IA, cybersécurité et développement web.