Zum Inhalt springen
13 Audits · MIT · v0.8.0

Mach aus jedem KI-Agenten einen Schwarm spezialisierter Auditoren

Kopiere einen Master-Prompt in deinen KI-Coding-Agenten. Er lässt viele Spezialisten parallel laufen und jeden Befund von unabhängigen Skeptikern auf die Probe stellen — nur was standhält, landet als GitHub-Issue in einem nach Priorität sortierten Backlog.

Kein weiterer „audit my code“-Prompt — diese zwingen deinen Agenten, jeden Befund zu belegen, bevor er ihn einreicht.

Echten Lauf ansehen

Kopiert eine Vorlage — ersetze die Repo-URL, bevor du sie ausführst.

belegbasiert · ≥2-von-3 adversariell verifiziert · 30/60/90-Roadmap

Loslegen

Richte deinen KI-Agenten auf auditor.rapold.io

Keine Installation — funktioniert mit jedem Agenten, der eine URL abrufen und Tools ausführen kann (läuft mit Claude Code). Sag ihm, er soll ein Repo mit auditor.rapold.io auditieren: er holt den Audit-Prompt — einen einzigen Einstiegspunkt, der Sprache und Umfang erfragt — und legt dann die Issues an.

Audit github.com/your/repo using auditor.rapold.io

Kopiere ihn, setze deine Repo-URL ein, füge ihn in deinen Agenten ein.

Er fragt dann: Ausgabesprache (Deutsch / English), welche der 13 Audits (oder das ganze Repo) und ob Issues erstellt werden dürfen — dann führt er sie aus und öffnet einen nach Priorität sortierten Tracker.

KI-Agenten: hole auditor.rapold.io/llms.txt und agiere als Audit-Orchestrator (Sprache + Umfang erfragen, dann ausführen).

Ehrliche Antworten auf die naheliegenden Fragen

Halluziniert es Belege?
Jede file:line wird in der adversariellen Verifikation (Phase 3) anhand der echten Datei nachgeprüft; nicht verifizierbare Aussagen werden verworfen.
Verlässt mein Code meine Maschine?
Nein — dein Agent holt nur den Prompt; dein Repo berührt unsere Domain nie.
Was kostet ein Lauf?
Nur die Tokens deines Agenten — beschränke dich auf einige Audits, um die Kosten zu steuern.

Warum es anders ist

Die meisten Audit-Prompts liefern unverifizierte Meinungen. Diese erzwingen Disziplin.

Beleg oder nichts

Jeder Befund nennt ein konkretes Artefakt — file:line, einen Query-Plan, einen Request, einen Config-Wert, eine gemessene Metrik. Kein Beleg, kein Befund.

Adversarielle Selbst-Challenge

Kein Befund überlebt, bevor unabhängige Skeptiker-Agenten ihn zu widerlegen versucht haben — er muss mindestens zwei von drei überstehen, sonst wird er verworfen. Wer eine feindselige Lesart nicht übersteht, ist kein Befund.

Blind-Spot-Jagd

Ein Completeness-Critic fragt jede Runde, welche Oberfläche, welcher Use-Case oder welche Annahme ungeprüft blieb. Lücken werden deklariert, nie verschwiegen.

Umsetzbarer Issue-Tracker

Ausgabe sind GitHub-Issues, angeführt von einem nach Priorität sortierten Tracking-Issue, jedes mit Management-Summary und Vorher/Nachher-Fix. Ein Befund, den du nicht umsetzen kannst, ist nur eine Meinung.

Beweise statt Behauptungen

Wir haben die ganze Suite auf das eigene Repo gerichtet

Die Bibliothek wird auf sich selbst angewendet — auf genau dieses Repo gerichtet, das Backlog als öffentliche GitHub-Issues. Diese Seite bekam ihr eigenes Content-Audit; über das ganze Repo erreichte jede Linse A− bis A. Unten: der echte Backlog, die Noten und ein Finding in voller Tiefe.

Der echte Backlog aus dem Audit genau dieser Seite — 23 Befunde, jeder davon jetzt behoben.

documentationA94performanceA92securityA910 P0 · 1 P1

Öffne ein Issue und prüfe den Beleg auf GitHub.

P1

/de served <html lang="en">

Beleg
web/app/layout.tsx:71
Vorher
/ and /de → <html lang="en">
Nachher
/de → <html lang="de">
Issue #81

Die Bibliothek

13 stack-agnostische Audits, eine gemeinsame Methodik

Jedes ist ein eigenständiger Master-Prompt: eine mehrphasige Spezifikation, keine einmalige „review my code“-Frage. Mehrere gegen dasselbe Repo laufen lassen — ihre Befunde fließen ohne Duplikate in einen einzigen, prioritätssortierten Tracker, weil jedes Audit denselben Issue-Kontrakt liefert.

Die Methode

Sechs Phasen, jedes Mal

Recon, ein paralleler Spezialisten-Schwarm, dann adversarielle Verifikation, bevor irgendetwas in den Bericht kommt.

Audit using auditor.rapold.io

Du tippst — eine Zeile, jeder fähige Agent.

  1. 0

    Reconnaissance

    Faktisches Inventar + Surface-Map. Noch keine Meinungen.

  2. 1

    Spezialisten-Schwarm

    Viele Domänen-Experten parallel, jeder belegpflichtig.

    securityaccessibilityperformancedata… · parallel
  3. 2

    Cross-Pollination

    Mergen, deduplizieren, Compound-Findings sichtbar machen.

  4. 3

    Adversarielle Verifikation

    Unabhängige Skeptiker widerlegen jeden P0/P1; ≥2 von 3 zum Überleben.

    übersteht ≥2 von 3
  5. 4

    Benchmark

    Vergleich gegen benannte Best-in-Class-Referenzen und Standards.

  6. 5

    Synthese

    Bericht, Scorecard, Issues und eine 30/60/90-Roadmap.

Du bekommst — nach Priorität sortierte GitHub-Issues.

Die Maßstäbe

Zwei Maßstäbe. Jeder Bericht daran gemessen.

Für sich allein nutzbar. Der eine bewertet 0–100 anhand einer Rubrik; der andere legt die exakte Issue-Form fest — so bleiben zwei Läufe vergleichbar, auch wenn die generierte Formulierung abweicht.

Sieh, was dein KI-Agent findet, wenn er jede Aussage belegen muss.

Es ist kostenlos und MIT-lizenziert. Lass es auf einem Wegwerf-Branch laufen, lies Befunde, die 2-von-3 Skeptikern standhalten mussten, und behalte nur die Fixes, denen du zustimmst.

Jede Aussage hier hat dasselbe Audit überstanden — lies das öffentliche Backlog (#97).