Audit-Vorlage

ai-llm

Prüfe deine LLM-Features so, wie es ein Angreifer und ein ehrlicher Nutzer tun würden.

Mappt auf: OWASP LLM Top 10 · NIST AI RMF

Vollständigen Prompt ansehen

Dein Code

Spezialisten, parallel

Prompt-InjectionJailbreaksOutput-HandlingAgent/Tool-SafetyRAGHalluzination

Priorisierte Issues

Jeder Befund ist belegbasiert und übersteht ≥2-von-3 adversarielle Skeptiker.

Wie dieses Audit arbeitet

Provider- und Framework-agnostisch kartiert dieses Audit zuerst jede Stelle, an der ein LLM aufgerufen wird, und jede Trust-Boundary, an der untrusted Input — Nutzertext, abgerufene Dokumente, Tool-Ergebnisse — in einen Prompt gelangt. Zwölf Spezialisten prüfen dann Prompt-Injection, Jailbreaks, System-Prompt- und Secret-Leakage, Output-Handling, Tool-/Agent-Agency, RAG-Grounding, Halluzination, Evals und Kosten — jeder Befund auf die OWASP LLM Top 10 gemappt und P0–P3 bewertet. Jede Aussage ist auf ein konkretes Artefakt zurückgeführt und übersteht unabhängige Skeptiker, bevor sie eingereicht wird.

Wann du es einsetzt

RAG-Support-Bot ausliefern

Dein Assistent antwortet aus internen Docs und einer geteilten Knowledge-Base. Das Audit prüft, ob das Retrieval die Berechtigungen pro Nutzer respektiert, ob der Bot bei fehlendem Kontext abbricht oder halluziniert und ob in einem abgerufenen Dokument versteckte Anweisungen den System-Prompt überschreiben können (indirekte Injection).

Einem Agenten echte Tools geben

Dein Agent kann auf Modell-Geheiß E-Mails senden, die Datenbank abfragen oder interne APIs aufrufen. Das Audit prüft den Blast-Radius jedes Tools — kann es eine destruktive oder irreversible Aktion ohne Human-Gate auslösen? —, validiert die vom Modell erzeugten Argumente und verfolgt jeden Output-Sink auf XSS, SQL oder eval-Injection.

Vor dem Skalieren eines öffentlichen LLM-Endpoints

Du öffnest ein KI-Feature gleich für untrusted Traffic. Das Audit sucht die Cost-Caps pro Nutzer und global, die Runaway-Spend und Missbrauch stoppen, die Evals, die deine High-Stakes-Pfade absichern, und das Provider-Retention- und PII-Handling, das du brauchst, bevor Nutzerdaten deine Maschine verlassen.

Was du bekommst

Eine Scorecard pro Dimension, eine Trust-Boundary- und Data-Flow-Map und verifizierte Befunde als nach Priorität sortierte GitHub-Issues — jedes mit OWASP-LLM-Mapping, redigiertem Repro und konkretem Vorher/Nachher-Fix.

Die anderen Audits ansehen