13 Audits · MIT · v0.8.0

Mach aus jedem KI-Agenten einen Schwarm spezialisierter Auditoren

Kopiere einen Master-Prompt in deinen KI-Coding-Agenten. Er lässt viele Spezialisten parallel laufen und jeden Befund von unabhängigen Skeptikern auf die Probe stellen — nur was standhält, landet als GitHub-Issue in einem nach Priorität sortierten Backlog.

Kein weiterer „audit my code“-Prompt — diese zwingen deinen Agenten, jeden Befund zu belegen, bevor er ihn einreicht.

Echten Lauf ansehen

Kopiert eine Vorlage — ersetze die Repo-URL, bevor du sie ausführst.

belegbasiert · ≥2-von-3 adversariell verifiziert · 30/60/90-Roadmap

Loslegen

Richte deinen KI-Agenten auf auditor.rapold.io

Keine Installation — funktioniert mit jedem Agenten, der eine URL abrufen und Tools ausführen kann (läuft mit Claude Code). Sag ihm, er soll ein Repo mit auditor.rapold.io auditieren: er holt den Audit-Prompt — einen einzigen Einstiegspunkt, der Sprache und Umfang erfragt — und legt dann die Issues an.

Audit github.com/your/repo using auditor.rapold.io

Kopiere ihn, setze deine Repo-URL ein, füge ihn in deinen Agenten ein.

Er fragt dann: Ausgabesprache (Deutsch / English), welche der 13 Audits (oder das ganze Repo) und ob Issues erstellt werden dürfen — dann führt er sie aus und öffnet einen nach Priorität sortierten Tracker.

KI-Agenten: hole auditor.rapold.io/llms.txt und agiere als Audit-Orchestrator (Sprache + Umfang erfragen, dann ausführen).

Ehrliche Antworten auf die naheliegenden Fragen

Halluziniert es Belege?: Jede file:line wird in der adversariellen Verifikation (Phase 3) anhand der echten Datei nachgeprüft; nicht verifizierbare Aussagen werden verworfen.
Verlässt mein Code meine Maschine?: Nein — dein Agent holt nur den Prompt; dein Repo berührt unsere Domain nie.
Was kostet ein Lauf?: Nur die Tokens deines Agenten — beschränke dich auf einige Audits, um die Kosten zu steuern.

Alle 13 Audits ansehen

Warum es anders ist

Die meisten Audit-Prompts liefern unverifizierte Meinungen. Diese erzwingen Disziplin.

Beleg oder nichts

Jeder Befund nennt ein konkretes Artefakt — file:line, einen Query-Plan, einen Request, einen Config-Wert, eine gemessene Metrik. Kein Beleg, kein Befund.

Adversarielle Selbst-Challenge

Kein Befund überlebt, bevor unabhängige Skeptiker-Agenten ihn zu widerlegen versucht haben — er muss mindestens zwei von drei überstehen, sonst wird er verworfen. Wer eine feindselige Lesart nicht übersteht, ist kein Befund.

Blind-Spot-Jagd

Ein Completeness-Critic fragt jede Runde, welche Oberfläche, welcher Use-Case oder welche Annahme ungeprüft blieb. Lücken werden deklariert, nie verschwiegen.

Umsetzbarer Issue-Tracker

Ausgabe sind GitHub-Issues, angeführt von einem nach Priorität sortierten Tracking-Issue, jedes mit Management-Summary und Vorher/Nachher-Fix. Ein Befund, den du nicht umsetzen kannst, ist nur eine Meinung.

Beweise statt Behauptungen

Wir haben die ganze Suite auf das eigene Repo gerichtet

Die Bibliothek wird auf sich selbst angewendet — auf genau dieses Repo gerichtet, das Backlog als öffentliche GitHub-Issues. Diese Seite bekam ihr eigenes Content-Audit; über das ganze Repo erreichte jede Linse A− bis A. Unten: der echte Backlog, die Noten und ein Finding in voller Tiefe.

github.com/marcelrapold/auditor/issues

is:issue label:content23 Befunde

Der echte Backlog aus dem Audit genau dieser Seite — 23 Befunde, jeder davon jetzt behoben.

documentationA94performanceA92securityA910 P0 · 1 P1

Öffne ein Issue und prüfe den Beleg auf GitHub.

/de served <html lang="en">

Beleg: web/app/layout.tsx:71
Vorher: / and /de → <html lang="en">
Nachher: /de → <html lang="de">

Issue #81

Ganzen Lauf ansehen (#97)

Die Bibliothek

13 stack-agnostische Audits, eine gemeinsame Methodik

Jedes ist ein eigenständiger Master-Prompt: eine mehrphasige Spezifikation, keine einmalige „review my code“-Frage. Mehrere gegen dasselbe Repo laufen lassen — ihre Befunde fließen ohne Duplikate in einen einzigen, prioritätssortierten Tracker, weil jedes Audit denselben Issue-Kontrakt liefert.

security

14 Domänen: Injection, AuthN/Z, Secrets, Supply Chain, IaC, CI/CD, Business-Logik, Datenschutz, LLM.

OWASP · CWE · MITRE · CIS

repo

Repo-Engineering: Architektur, Stack-Konsistenz, Docs, Tests, Deps, CI/CD, Git-Hygiene.

Google Eng · SRE · SLSA

frontend

16-Agenten-Frontend-Sweep: Usability, Psychologie, Visual Design, A11y, Performance, SEO, Copy, CRO.

Nielsen · WCAG · CWV

api

API-Design: Ressourcen-Modell, HTTP-Semantik, Error-Model, Versionierung, Idempotenz, Rate-Limits, DX.

RFC 9110/9457 · OpenAPI

performance

Performance & Skalierung: Hotspots, N+1, Caching, Concurrency, Leaks, Lastverhalten, Resilienz, FinOps.

SRE · DORA · SLOs

data

Daten & Datenbank: Modellierung, Typen, Constraints, Migrations-Sicherheit, Transaktionen, Integrität, Backup/DR.

ACID/CAP · RLS

infrastructure

Infra/DevOps/SRE: IaC, Cloud-Security, IAM, Secrets, Container, k8s, CI/CD, HA, DR, Observability, Kosten.

CIS · Well-Architected · DORA

ai-llm

KI/LLM: Prompt-Injection, Jailbreaks, Output-Handling, Agent/Tool-Safety, RAG, Halluzination, Evals, Kosten.

OWASP LLM Top 10 · NIST AI RMF

compliance-privacy

Datenschutz: Rechtsgrundlage, Consent/Cookies, Betroffenenrechte, Aufbewahrung, Transfers, Breach-Readiness.

GDPR · ePrivacy · EU AI Act

accessibility

Tiefes A11y: Semantik, Tastatur, Fokus, Screenreader, Kontrast, Formulare, Zoom, Motorik, Motion, Kognition.

WCAG 2.2 · EAA · ADA/508

documentation

Doku-Qualität vs. Standard: Repo-Kopf, Onboarding, Doc-Code-Drift, Schreibstil, Diátaxis, Repo-Health.

DOCUMENTATION-STANDARD · Diátaxis

content

Inhalt & Botschaft: These challengen, Zielgruppen-Fit, Belege & Originalität, Struktur, Stimme, konkrete Umformulierungen.

E-E-A-T · BLUF · rhetoric

lean

Schlankheit: toter Code, ungenutzte/Phantom-Deps, Duplikation, AI-Slop, Dependency-Transparenz — sicherer Strip-down ohne Über-Löschen.

Google Eng · OWASP · YAGNI

Die Methode

Sechs Phasen, jedes Mal

Recon, ein paralleler Spezialisten-Schwarm, dann adversarielle Verifikation, bevor irgendetwas in den Bericht kommt.

Audit using auditor.rapold.io

Du tippst — eine Zeile, jeder fähige Agent.

0
Reconnaissance
Faktisches Inventar + Surface-Map. Noch keine Meinungen.
1
Spezialisten-Schwarm
Viele Domänen-Experten parallel, jeder belegpflichtig.
securityaccessibilityperformancedata… · parallel
2
Cross-Pollination
Mergen, deduplizieren, Compound-Findings sichtbar machen.
3
Adversarielle Verifikation
Unabhängige Skeptiker widerlegen jeden P0/P1; ≥2 von 3 zum Überleben.
übersteht ≥2 von 3
4
Benchmark
Vergleich gegen benannte Best-in-Class-Referenzen und Standards.
5
Synthese
Bericht, Scorecard, Issues und eine 30/60/90-Roadmap.

Du bekommst — nach Priorität sortierte GitHub-Issues.

Die Maßstäbe

Zwei Maßstäbe. Jeder Bericht daran gemessen.

Für sich allein nutzbar. Der eine bewertet 0–100 anhand einer Rubrik; der andere legt die exakte Issue-Form fest — so bleiben zwei Läufe vergleichbar, auch wenn die generierte Formulierung abweicht.

Documentation standard

Ein Dokumentationsstandard mit fünf Repo-Profilen und einer 0–100-Rubrik — derselbe Maßstab, an dem das Documentation-Audit misst.

DOCUMENTATION-STANDARD.md

Issue-output standard

Der verbindliche Vertrag, dem jedes Audit folgt: zuerst ein nach Priorität sortiertes Tracking-Issue, dann pro Befund ein Issue mit eigener Management-Summary.

ISSUE-OUTPUT-STANDARD.md

Sieh, was dein KI-Agent findet, wenn er jede Aussage belegen muss.

Es ist kostenlos und MIT-lizenziert. Lass es auf einem Wegwerf-Branch laufen, lies Befunde, die 2-von-3 Skeptikern standhalten mussten, und behalte nur die Fixes, denen du zustimmst.

Jede Aussage hier hat dasselbe Audit überstanden — lies das öffentliche Backlog (#97).

Prompts ansehen Quickstart