Was macht ein KI-Agent konkret in einer WP-Praxis?

Ein KI-Agent zieht die Mandanten-Buchhaltung (DATEV, SAP, Lexware, Sage), fuehrt vollumfaengliches Journal Entry Testing nach IDW PS 261 auf der gesamten Buchungs-Population aus, entwirft die Risikobeurteilung nach IDW PS 261/330, faehrt aussagebezogene Pruefungshandlungen, klassifiziert Belege gegen die Pruefungshandlung, formuliert das Arbeitspapier und Bestandteile des Bestaetigungsvermerks und legt nur ungewoehnliche Faelle dem Berufstraeger vor.

Wie unterscheidet sich das von MindBridge oder Caseware Extractly?

MindBridge und Caseware Extractly haben 2025-2026 KI-Funktionen fuer Voll-Populations-Testing und Dokumenten-Extraktion ergaenzt - ueberwiegend innerhalb ihrer eigenen Plattform. Ein eigener KI-Agent ist ein Workflow-Agent ueber die Plattformgrenzen hinweg: ueber die Audit-Plattform, die Mandanten-Buchhaltung, das Konzern-Reporting, IDW-konforme Arbeitspapiere und die firmen-spezifische Pruefungsmethodik hinweg.

Ist KI-gestuetztes aussagebezogenes Testing rechtssicher nach IDW PS 200 ff.?

Ja, wenn der Agent so gebaut ist. Der Berufstraeger bleibt nach WPO § 43 verantwortlich; der Agent bereitet nur Pruefungshandlungen vor und schlaegt Schlussfolgerungen vor. Der Agent erfuellt die Dokumentationsstandards nach IDW PS 460. IDW PS 861 (Maerz 2023) liefert den Rahmen fuer die Pruefung von KI-Systemen.

Welcher ROI ist fuer eine Mittelstand-WP-Praxis realistisch?

Fuer eine typische WP-Praxis mit 25 bis 80 Mandaten und 8 bis 30 Berufstraegern plus Pruefungsassistenten entlasten KI-Agenten 30 bis 45 Prozent der Pruefungs-Stunden pro Mandant innerhalb von zwei Pruefungssaisons. Die groessten Einzelgewinne: Journal Entry Testing auf der Voll-Population (statt Sample), Belegerfassung fuer aussagebezogenes Testing (80 Prozent Kostenreduktion pro Beleg), Lead-Schedule-Abgleich und Working-Paper-Generierung.

Wie halten wir die Mandanten-Verschwiegenheit nach WPO § 43 bei Cloud-KI ein?

Drei Regeln. Erstens muss der KI-Anbieter ein EU-residentes Deployment anbieten. Zweitens muss der AVV das Berufsgeheimnis nach WPO § 43 und § 203 StGB ausdruecklich abdecken. Drittens duerfen Prompts und Outputs nicht fuer Vendor-Modell-Training verwendet werden. Mit diesen drei Punkten ist Cloud-KI nach WPK-Guidance zulaessig.

Und die CSRD-Pruefungspflicht und IDW EPS Nachhaltigkeit?

Das CSRD-Umsetzungsgesetz bringt die Pruefungspflicht fuer die Nachhaltigkeitsberichterstattung; bis 1. Oktober 2026 als Pruefung mit begrenzter Sicherheit, danach mit hinreichender Sicherheit. Nach der EU-Omnibus-Vereinfachung 2025 sind nur noch Unternehmen mit ueber 1.000 Mitarbeitenden UND ueber 450 Mio. EUR Umsatz im Anwendungsbereich. KI-Agenten helfen, indem sie ESRS-relevante Daten aus dem Nachhaltigkeitsbericht extrahieren, auf das ESEF-Tagging mappen und gegen Lagebericht und Jahresabschluss abgleichen.

Erfuellt der KI-Agent die IDW PS 861 Standards fuer die Pruefung von KI?

IDW PS 861 (Maerz 2023) regelt die Pruefung von KI-Systemen, nicht den Einsatz von KI in der Pruefung. Aber dieselbe Logik gilt fuer die WP-Praxis, die KI im eigenen Workflow einsetzt: Kriterien fuer Datenqualitaet, Modellintegritaet, Erklaerbarkeit, Robustheit, Sicherheit muessen erfuellt sein. Ein korrekt gebauter Agent liefert Dokumentation zu allen fuenf.

Brauchen wir ein eigenes IT-Team, um einen KI-Agenten zu betreiben?

Nein. Die meisten WP-Praxen arbeiten mit einem externen Partner fuer Build, Integration und laufende Modellpflege und betreiben den Agenten dann taeglich selbst. Die WP-Praxis besitzt die Pruefungsmethodik, die IDW-PS-Mappings, die Arbeitspapier-Vorlagen und die Pruefschlange. Die technische Arbeit liegt beim Partner.

Was kann schief gehen und wie verhindert man es?

Vier Dinge gehen am haeufigsten schief. Erstens: unsaubere Mandanten-Buchhaltung erzeugt falsche Journal-Entry-Ergebnisse - die Stammdaten in Phase 1 pruefen. Zweitens: Agenten ohne Konfidenzschwellen erzeugen Bestaetigungsvermerks-Risiken - immer Berufstraeger-Sign-off auf jeder Pruefungshandlung verlangen. Drittens: fehlende Audit-Trails lassen die Pruefung selbst eine APAS-Inspektion scheitern. Viertens: ohne AVV mit Berufsgeheimnis-Klausel entsteht ein § 203 StGB-Risiko.

Zurück zum Blog

KI bei Wirtschaftsprüfern und Audit-Firmen: Wie Mittelstand-WPs Substantive Testing und IDW PS-Dokumentation mit eigenen KI-Agenten automatisieren

16. Mai 202633 Min. Lesezeit

Henri Jung

Co-Gründer bei Superkind

Eine dunkle Metall-Lupe mit orangefarbenem Akzentring um die Linse - das tägliche Verb jedes Wirtschaftsprüfers, der prüft, abzeichnet und unterzeichnet

Dienstagmorgen im März, mittlere deutsche WP-Praxis. Ein Prüfungsassistent öffnet um 7:42 Uhr Caseware Working Papers. 142 offene Prüfungshandlungen für den 14. Mittelstand-Mandanten der Saison, eine seit drei Wochen ausstehende Saldenbestätigung der Hausbank, eine Mail vom Buchhalter des Mandanten mit “noch einer kurzen Frage” und eine Whiteboard-Erinnerung, dass der Bestätigungsvermerk für Mandant 12 am Freitag rausgeht. Das Telefon klingelt. Der Wirtschaftsprüfer fragt, ob die Wesentlichkeitsbeurteilung für Mandant 7 schon dokumentiert ist.

Der Berufsstand redet seit zehn Jahren über Digitalisierung. Inzwischen hat die Mathematik das Reden eingeholt. Die Wirtschaftsprüferkammer (WPK) ist im Januar 2026 für rund 21.000 Mitglieder bundesweit zuständig, davon etwa 15.000 Berufsträger und der Rest WP-Gesellschaften und Vereidigte Buchprüfer¹². Der WP-Nachwuchsmangel ist das meistgenannte Strukturrisiko der Branche, die Prüfungsdichte steigt mit CSRD, und APAS-Inspektionen verschärfen jährlich die Dokumentationslatte¹³. Einstellen ist keine Strategie mehr. Prüfungs-Stunden pro Mandant sind die Engstelle.

Dieser Leitfaden richtet sich an den Sozius, den WP-Inhaber oder den Prüfungsleiter, der den KI-Hype zwei Jahre lang beobachtet hat und jetzt eine konkrete Antwort auf eine Frage will: Kann ein eigener KI-Agent tatsächlich Journal Entry Testing, Belegerfassung, Lead-Schedule-Abgleich, IDW-konforme Working-Paper-Entwürfe und ESEF-Tagging-Prüfung in Caseware übernehmen - und wenn ja, wie?

TL;DR

Ein KI-Agent für eine WP-Praxis zieht die Mandanten-Buchhaltung, führt vollumfängliches Journal Entry Testing nach IDW PS 261, entwirft aussagebezogene Prüfungshandlungen, erzeugt IDW-PS-460-konforme Arbeitspapiere, gleicht Lead Schedules ab und legt nur Ausnahmen vor - keine reine ChatGPT-Oberfläche neben Caseware.

Sechs Use Cases liefern schnellen Payback: Risikobeurteilung, Journal Entry Testing, Belegerfassung & Substantive Testing, Lead Schedule & Saldenanalyse, ESEF-/Lagebericht-/CSRD-Prüfung und IDW-PS-460-Arbeitspapier-Generierung.

60 Tage genügen, um einen fokussierten Pilot vom Kick-off bis zu den ersten messbar gesparten Stunden auf einem Prüfungsmandanten zu bringen.

IDW PS, WPO § 43 und IDW PS 861 sind die entscheidenden Rahmen. Der Agent muss Prüfungshandlungen, Arbeitspapiere und Schlussfolgerungen erzeugen, die APAS-Inspektion und Berufsaufsicht standhalten.

Die Wachstumsfrage verschiebt sich: dasselbe WP-Team führt 25 bis 35 Mandate statt 15 bis 20, absorbiert die CSRD-Welle ohne proportionales Einstellen und entlastet erfahrene Berufsträger für Bestätigungsvermerks-Argumentation und Mandantenberatung.

Die WP-Engstelle

Der Grund, warum Prüfungsarbeit so viel Zeit frisst, ist selten die Prüfung selbst. Es ist alles drum herum: die 14. Lieferantenrechnung an einem Morgen tickmarken, denselben Arbeitspapier-Header 200 Mal in einer Saison tippen, Saldenliste-Beträge aus PDF ins Caseware-Lead-Schedule kopieren, den richtigen IDW-PS-Paragraphen für die dritte Risiko-Buchung der Woche nachschlagen, denselben Verfahrensdokumentations-Abschnitt für den vierten Konzernmandanten formulieren. Mal 35 Mandate, und die Rechnung wird schnell hässlich.

~21.000 WPK-Mitglieder bundesweit - Die WPK ist im Januar 2026 für rund 21.000 Mitglieder zuständig: Wirtschaftsprüfer, Vereidigte Buchprüfer, WP-Gesellschaften und BPG’s¹².
WP-Nachwuchsmangel strukturell - Der Berufsstand meldet seit über einem Jahrzehnt einen Nachwuchsmangel; die WPK-Jahresstatistik zeigt stagnierende Berufsträger-Zahlen gegen steigende Prüfungsdichte (CSRD, ESEF, NIS2)²
CSRD-Prüfungspflicht erweitert das Volumen - Das CSRD-Umsetzungsgesetz erweitert die Prüfungspflicht auf die Nachhaltigkeitsberichterstattung für Unternehmen über 1.000 Mitarbeitende UND 450 Mio. EUR Umsatz; zunächst als Prüfung mit begrenzter Sicherheit, ab 1. Oktober 2026 mit hinreichender Sicherheit¹⁷¹⁸
IDW PS 861 setzt den KI-Audit-Massstab - Seit März 2023 liefert IDW PS 861 einen kriterienbasierten Rahmen für die Prüfung von KI-Systemen; dieselben fünf Prinzipien (Datenqualität, Modellintegrität, Erklärbarkeit, Robustheit, Sicherheit) gelten jetzt auch, wenn WP-Praxen KI im eigenen Workflow einsetzen⁵⁶
MindBridge analysiert 100% der Transaktionen - Plattformen wie MindBridge basieren auf einem Jahrzehnt finance-nativer KI, trainiert auf über 260 Mrd. Transaktionen über 3.000+ ERP-Systeme mit 8.000+ eingebetteten GAAP-Regeln - die sample-basierte Prüfung wird durch Voll-Populations-Prüfung schnell ersetzt²⁰²¹
Caseware AI Substantive Testing - Caseware Extractly verwandelt Stunden in Minuten für KI-gestütztes Substantive Testing, nativ in den Caseware-Working-Papers-Workflow, den die meisten deutschen Mittelstand-WPs bereits nutzen²²
APAS-Inspektionen verschärfen die Dokumentation - Die Abschlussprüferaufsichtsstelle inspiziert WP-Praxen im zyklischen Turnus; Dokumentationslücken nach IDW PS 460 sind der häufigste Beanstandungspunkt²⁸

Kernzahl

Der Prüfungsassistent verbringt 40 bis 60 Prozent der Audit-Stunden mit Belegerfassung, Lead-Schedule-Abgleich und Arbeitspapier-Dokumentation - die hochgradig repetitiven 60 Prozent, die KI-Agenten jetzt aus der Hand nehmen. Die verbleibenden 40 Prozent (Wesentlichkeitsbeurteilung, kritische Schätzungen, Bestätigungsvermerks-Argumentation, Mandantengespräch) sind genau das, wofür der WP Senior-Zeit braucht.

Das Ergebnis ist eine WP-Praxis, in der die erfahrensten Prüfer den grössten Teil ihrer Saison mit den repetitivsten Aufgaben verbringen, während Mandantengespräch, Wesentlichkeitsbeurteilung und Bestätigungsvermerks-Argumentation in die letzte Stunde des Tages gequetscht werden. KI-Agenten lösen das nicht, indem sie schlau sind. Sie lösen es, indem sie die wiederkehrenden 60 Prozent entfernen, die niemand auf beiden Seiten des Schreibtischs gerne macht.

Kennzahl	Status quo	Quelle
WPK-Mitglieder bundesweit	~21.000	WPK Jan 2026¹
IDW PS 861 für KI-Prüfung	seit März 2023	IDW⁵
CSRD Limited-Assurance-Phase	bis 1. Okt 2026	CSRD-UG¹⁷
CSRD Reasonable-Assurance-Phase	ab 1. Okt 2026	CSRD-UG¹⁷
CSRD-Schwellen (nach Omnibus)	1.000+ MA UND 450 Mio. EUR Umsatz	CSRD-UG¹⁸
MindBridge trainiert auf Transaktionen	260+ Mrd.	MindBridge²⁰
Eingebettete GAAP-Regeln	8.000+	MindBridge²⁰
EU AI Act vollständig anwendbar	2. Aug 2026	EU AI Act²⁶

Was ein KI-Agent in der Prüfung tatsächlich tut

Der Markt ist voll mit Produkten unter der Aufschrift “KI für die Wirtschaftsprüfung”. Die meisten sind Anomalie-Detektion-Widgets oder Dokumenten-Klassifizierer. Ein echter KI-Agent geht deutlich weiter: Er besitzt den Workflow, nicht nur die Datenextraktion. So sieht der Unterschied in WP-Sprache aus.

Die Agent-Schleife in einer Prüfung

Erfassen - Holt Mandanten-Buchhaltung aus DATEV, SAP, Lexware, Sage, Microsoft Dynamics, Oracle NetSuite oder proSAP; Saldenliste, Buchungsjournal, Anlagenspiegel, Lohnjournal; Belege aus PDF, XRechnung, ZUGFeRD, Foto, Scanner; Konzern-Reporting aus BPS, Lucanet, Tagetik, Oracle HFM.
Klassifizieren - Erkennt Buchungssatz, Kontenklasse, Belegart, Geschäftsvorfall und die zutreffende IDW-PS-Prüfungshandlung; routet ins passende Pipeline-Segment (Substantive Testing, IKS-Prüfung, Substanzanalyse, Vollständigkeitsprüfung).
Extrahieren - Zieht strukturierte Felder je Buchungssatz: Konto, Gegenkonto, Betrag, Datum, Belegart, Erfasser, Buchungstext - mit Konfidenzbewertung je Feld.
Anreichern - Schlägt Mandanten-Akte, Vorjahres-Arbeitspapier, Wesentlichkeitsschwelle, firmenspezifische Prüfungsmethodik und IDW-PS-Verweis nach - und wendet sie je Prüfungshandlung an.
Vorschlagen - Erzeugt die vollständige Ausgabe: gerankte Ausnahmenliste für Journal Entry Testing nach IDW PS 261, Lead Schedule mit Vorjahres-Vergleich, Belegerfassungs-Vorschlag mit Tickmark, Arbeitspapier-Entwurf mit IDW-PS-460-konformer Dokumentation, Bestandteile des Bestätigungsvermerks.
Entscheiden - Oberhalb der Konfidenzschwelle bucht der Agent direkt in Caseware; unterhalb landet der Fall in der Berufsträger-Prüfschlange mit Ein-Klick-Freigabe oder Korrektur.
Lernen - Jede Korrektur fliesst zurück. Muster, die der Agent auf einem Mandanten dreimal sieht, werden zu Regeln, die er automatisch anwendet.
Protokollieren - Jeder Schritt mit Zeitstempel, Dokument-Hash, Agent-Version und (bei Prüfung) Name des Prüfers - das IDW-PS-460-Arbeitspapier und die APAS-Inspektions-Dokumentation teilen sich denselben Event-Log.

Der Unterschied zu dem, was Sie heute haben

Fähigkeit	Caseware / DATEV Audit	MindBridge / SmartAudit	Eigener KI-Agent
Liest Mandanten-Buchhaltung	Ja (manueller Import)	Ja (auto)	Ja (auto, multi-ERP)
Voll-Populations-Journal-Entry-Testing	Begrenzt (Sample)	Ja	Ja (mit IDW PS 261 Mapping)
Entwirft IDW-PS-460-konforme Arbeitspapiere	Nur Vorlagen	Nein	Ja (Firmenmethodik angewendet)
Belegerfassung mit Tickmark	Manuell	Nur Auto-Klassifikation	Ja (auto + Tickmark + Prüfungshandlung)
Lead-Schedule-Abgleich	Manuell	Begrenzt	Ja (Vorjahres-Vergleich + Erklärung)
ESEF / CSRD Lagebericht-Abgleich	Manuell	Nein	Ja (ESRS + ESEF Mapping)
Lernt Mandanten-Muster	Begrenzt	Generisch über Kunden	Ja (pro Mandant, pro Branche)
Audit-Trail für APAS-Inspektion	Aktivitäts-Log	Plattform-Log	Vollständige IDW PS 460 Beweiskette

Die Kategorie ist entscheidend. Caseware, DATEV Audit, Audicon SmartAudit, MindBridge und Validis haben 2025-2026 KI-Funktionen ergänzt - überwiegend Anomalie-Detektion, Journal-Entry-Scoring und Dokumenten-Klassifikation innerhalb ihrer Plattform²⁰²². Sie machen, was sie versprechen. Aber der Prüfungsassistent muss weiterhin das Arbeitspapier zusammenstellen, die Wesentlichkeitsbeurteilung durchführen, Bestandteile des Bestätigungsvermerks formulieren und gegen das Konzern-Reporting abgleichen - über Audit-Plattform, Mandanten-Buchhaltung, Konzern-Reportingtool und firmen-spezifische Methodik hinweg. Ein eigener Agent geht eine Schicht weiter: Er nimmt die Arbeit komplett aus der Hand, bis etwas ungewöhnlich oder ermessensabhängig wird.

Stärken des eigenen Agenten

✓ End-to-end-Prüfungsarbeit - Prüfungsplanung, Substantive Testing, Working Paper, Bestätigungsvermerks-Bestandteile, Lernen
✓ Systemübergreifend - Caseware plus Mandanten-Buchhaltung plus Konzern-Reporting plus Bank plus Anlagenbuchhaltung
✓ Mandanten- und Branchen-spezifisches Lernen - Kontenrahmen, Buchungsmuster und Risikoprofile jedes Mandanten
✓ IDW-PS-ready out of the box - IDW PS 261, 330, 460, 980, EPS KMU 1 Mappings und Audit-Trail
✓ Voll-Populations-Testing nativ - Sample ist Fallback, nicht Default
✓ Skaliert mit der WP-Praxis - ein Modell für 10 Mandate oder 100

Einschränkungen

✗ Höhere Anfangsinvestition - Prüfungsmethodik-Mapping und Mandanten-Triage nötig
✗ Braucht saubere Mandanten-Stammdaten - Kontenrahmen-Chaos rein, Lead-Schedule-Chaos raus
✗ Verfahrensdokumentation - vor Go-Live schriftlich für APAS-Inspektion
✗ AVV mit Berufsgeheimnis-Klausel - rechtliches Papier vor dem technischen Pilot nach WPO § 43 und § 203 StGB
✗ Menschliche Prüfung auf jeder Prüfungshandlung - der Berufsträger unterzeichnet immer den Bestätigungsvermerk

“AI-powered substantive testing turns hours into minutes by extracting, classifying and reconciling evidence in seconds - so the auditor can spend their judgement where it matters: on the unusual, the material and the disputed.”

- Caseware, zu AI-powered Substantive Testing mit Caseware Extractly²²

6 Use Cases, die heute funktionieren

Nicht jeder Prüfungsschritt ist ein guter erster KI-Kandidat. Die folgenden sind es: hohes Volumen, repetitiv, gut dokumentiert, klare richtige Antwort. Starten Sie mit einem Mandanten in einem Use Case. Fügen Sie den nächsten hinzu, wenn der erste sauber läuft.

1. Risikobeurteilung und Prüfungsplanung (IDW PS 261/330)

Der erste Use Case ist die Planungsphase. Der Agent liest die Vorjahres-Arbeitspapiere, die Mandanten-Branchendaten, die Marktentwicklung und den Geschäftsbericht und entwirft eine Risiko-Heatmap mit den zutreffenden IDW-PS-261-Indikatoren - der Berufsträger geht mit einem strukturierten Startpunkt in das Prüfungsplanungs-Meeting, nicht mit einer leeren Word-Seite.

Vorjahres-Arbeitspapier-Synthese - Der Agent liest alle Vorjahres-Arbeitspapiere und legt unaufgeklärte Prüfungshinweise, Anpassungsbuchungen und Schätzungs-Änderungen offen
Branchen-Risiko - Der Agent mappt die Mandanten-Branche auf bekannte IDW-PS-261-Indikatoren-Kataloge (Bauwirtschaft, Automotive, Handel, Bank, Versicherung, Health)
Wesentlichkeitsschwellen-Vorschlag - Der Agent schlägt Wesentlichkeitsschwelle und Tolerable Error auf Basis der firmen-spezifischen Methodik und Mandanten-Grösse vor
Risiko-Heatmap - Der Agent präsentiert eine farbcodierte Heatmap nach Risikobereich, Konten-Cluster und IDW PS 261/330 Indikator
Prüfungsstrategie-Entwurf - Der Agent entwirft die Prüfungsstrategie (Substantive vs. Controls Reliance) zur Berufsträger-Prüfung
Gesparte Zeit - Planungsphase, die zuvor 8 bis 16 Stunden pro Mandant kostete, fällt auf 2 bis 4 Stunden Prüfung

2. Journal Entry Testing (IDW PS 261)

Der einzelne Use Case mit höchster Hebelwirkung. Nach IDW PS 261 muss jede Prüfung Prüfungshandlungen zu doloser Handlung umfassen - und der Indikatoren-Katalog ist gut dokumentiert. Ein Agent fährt die vollständige Buchungssatz-Population (kein Sample) gegen die Indikatoren, scort jeden Eintrag und legt dem Berufsträger eine gerankte Ausnahmenliste vor.

Voll-Populations-Testing - Jeder Buchungssatz gescort - kein Sample von 25, das gesamte Hauptbuch
IDW PS 261 Indikatoren-Katalog - Wochenend- und Aussenarbeitszeit-Buchungen, ungewöhnliche Kontenkombinationen, runde Beträge, Manual Journal Entries, Late-Period-Adjustments, Buchungen kurz vor Bilanzstichtag⁹
Risiko-Score je Buchungssatz - Ein Composite-Score, der alle Indikatoren mit Konfidenz kombiniert; gerankte Ausnahmenliste für den Berufsträger
Drill-through zum Quell-Beleg - Ein Klick von der Ausnahme zum Original-Beleg, dem Erfasser und dem Buchungstext
Arbeitspapier auto-generiert - Das Journal-Entry-Testing-Arbeitspapier entworfen mit der IDW PS 261 Indikatoren-Kette, bereit zur Berufsträger-Unterzeichnung
Gesparte Zeit - Journal Entry Testing, das zuvor 4 bis 8 Stunden pro Mandant kostete, fällt auf 30 bis 60 Minuten Prüfung

3. Belegerfassung und Substantive Testing

Die grösste Warteschlange in der Audit-Saison. Ein Agent liest Lieferantenbelege, Kundenrechnungen, Kontoauszüge und Lieferantenbestätigungen aus dem Mandanten-DMS, klassifiziert sie gegen die Prüfungshandlung, verknüpft sie mit dem Buchungssatz und fügt den passenden Tickmark hinzu.

Multi-Format-Eingabe - PDF, XRechnung, ZUGFeRD, Foto, Scanner, Mandanten-DMS-Belegtransfer
Prüfungshandlungs-Klassifikation - Vollständigkeit, Bestand, Bewertung, Ausweis, Rechte und Verpflichtungen - der Agent klassifiziert, welche Assertion jeder Beleg adressiert
Tickmark-Auto-Anwendung - Firmen-spezifisches Tickmark-System je Beleg angewendet; der Mensch bestätigt nur mehrdeutige Fälle
Saldenbestätigungs-Generierung - Saldenbestätigungs-Briefe entworfen, adressiert und in die Versandschlange gelegt
Substantive Analytical Procedures - Soll-Ist-Analytik über Jahre, Branchen-Benchmarks und Mandanten-Trends mit statistischen Schwellen
Gesparte Zeit - Belegerfassung, die zuvor 60 bis 120 Sekunden pro Beleg kostete, fällt auf 10 bis 20 Sekunden Prüfung

4. Lead Schedule und Saldenanalyse

Das Skelett jedes Caseware-Engagements. Ein Agent erzeugt das Lead Schedule je Kontenklasse aus der Mandanten-Saldenliste, fügt den Vorjahres-Vergleich hinzu, berechnet die Aufgliederung-by-Account, entwirft die Prüfungsfeststellung je material variance und verknüpft jede Zelle zurück zur Quelle.

Saldenliste-Import - Direkter Import aus DATEV, SAP, Lexware, Sage mit automatischem Konten-Mapping je Firmenmethodik
Vorjahres-Vergleich auto-berechnet - Je Konto und je Kontenklasse, mit prozentualer Veränderung und absoluter Differenz
Material-Variance-Flagging - Veränderungen über der Wesentlichkeitsschwelle automatisch markiert mit Entwurf-Prüfungsfeststellung
Drill-Down zum Buchungssatz - Ein Klick vom Lead Schedule zu den zugrunde liegenden Buchungen, sortiert absteigend nach Betrag
Caseware-Working-Paper-Verlinkung - Jede Lead-Schedule-Zeile verlinkt zum entsprechenden Working-Paper-Abschnitt für Ein-Klick-Navigation
Gesparte Zeit - Lead-Schedule-Vorbereitung, die zuvor 4 bis 8 Stunden pro Mandant kostete, fällt auf 45 bis 90 Minuten Prüfung

5. ESEF, Lagebericht und CSRD-Nachhaltigkeitsprüfung

Die neue Wachstumsfläche für deutsche Mittelstand-WPs. Ab 2026 erweitert sich die CSRD-Prüfungspflicht auf die Nachhaltigkeitsberichterstattung; das IDW EPS für die Nachhaltigkeitsprüfung adaptiert ISAE 3000 auf den deutschen Markt. Ein Agent extrahiert ESRS-relevante Daten aus dem Nachhaltigkeitsbericht, mappt sie auf das ESEF-Tagging und gleicht gegen Lagebericht und Jahresabschluss ab¹⁷¹⁸.

ESRS-Datenextraktion - Der Agent liest den Nachhaltigkeitsbericht und identifiziert ESRS-Datenpunkte (E1 Klima, E5 Ressourcen, S1 Belegschaft, G1 Governance) mit Quellseite
ESEF-Tagging-Prüfung - Der Agent validiert das XBRL/iXBRL-Tagging gegen die ESEF-Taxonomie und die ESRS-Datenpunkte
Lagebericht-Abgleich - Quantitative Angaben im Nachhaltigkeitsbericht abgeglichen gegen Lagebericht und Jahresabschluss
Wesentlichkeitsanalyse-Prüfung - Der Agent prüft die Mandanten-Wesentlichkeitsanalyse gegen ESRS Standard 1 und das Double-Materiality-Framework
Limited-Assurance-Arbeitsprogramm - Bis 1. Oktober 2026 gilt Limited Assurance; der Agent erzeugt das Limited-Assurance-Arbeitsprogramm; ab 1. Oktober 2026 gilt Reasonable Assurance und der Agent erzeugt die entsprechend tieferen Prüfungshandlungen¹⁷

6. IDW PS 460 Arbeitspapier und Bestätigungsvermerks-Bestandteile

Die Dokumentation ist der Nachweis. Nach IDW PS 460 muss jede Prüfungshandlung mit Zeitstempel, Beleg-Referenz, Prüfungsschritt, Prüfungsergebnis und Auditor-Signatur dokumentiert werden. Der Agent erzeugt diese Dokumentation automatisch als Nebenprodukt der Prüfungshandlung - das Arbeitspapier ist fertig, wenn die Prüfung fertig ist, nicht danach.

Auto-generiertes Arbeitspapier je Prüfungshandlung - Header, Prüfungsschritte, Prüfungsergebnis, Schlussfolgerung vorausgefüllt in der Firmenvorlage
Cross-Reference-Matrix - Jedes Arbeitspapier verlinkt mit dem IDW-PS-Verweis, der Risiko-Heatmap und der Bestätigungsvermerks-Argumentation
Bestätigungsvermerks-Bestandteile entworfen - Schlüsselprüfungssachverhalte (Key Audit Matters) entworfen aus den Prüfungsfeststellungen mit höchstem Risiko
APAS-fähiger Audit-Trail - Jedes Arbeitspapier trägt IDW-PS-460-konforme Dokumentation: wer hat wann was mit welchem Nachweis mit welcher Schlussfolgerung getan
Gesparte Zeit - Arbeitspapier-Entwurf, der zuvor 25 bis 35 Prozent der Gesamtstunden kostete, fällt auf 8 bis 12 Prozent Prüfung

Use Case	Hauptkennzahl	Typische ROI-Zeit	Komplexität
Risikobeurteilung & Planung	70-80% Planungszeit gespart	2-3 Monate	Mittel
Journal Entry Testing	4-8h auf 30-60min pro Mandant	1-2 Monate	Niedrig-Mittel
Belegerfassung & Substantive Testing	80% Kostenreduktion pro Beleg	2-4 Monate	Mittel
Lead Schedule & Saldenanalyse	4-8h auf 45-90min pro Mandant	2-3 Monate	Mittel
ESEF, CSRD & Lagebericht	50-70% Vorbereitungszeit gespart	3-6 Monate	Mittel-Hoch
IDW PS 460 Arbeitspapier	25-35% auf 8-12% der Gesamtstunden	3-5 Monate	Mittel

Die Caseware-First-Architektur

In Deutschland dominieren Caseware Working Papers, Caseware IDEA, DATEV Audit, Audicon AuditSolutions / SmartAudit und ETL Audit den Mittelstand-WP-Praxis-Stack. Viele Praxen fahren zusätzlich MindBridge als Parallel-Anomalie-Detektion plus die Mandanten-Buchhaltung in DATEV, SAP, Lexware oder Sage²⁰²². Jeder KI-Agent, der in einer WP-Praxis nützlich sein will, muss auf diesen Systemen leben, ohne sie zu ersetzen.

Die fünf Integrationsschichten

Mandanten-Eingang - Mandanten-Buchhaltung (DATEV, SAP, Lexware, Sage), Saldenliste, Buchungsjournal, Anlagenspiegel, Lohnjournal, Belege (PDF, XRechnung, ZUGFeRD, Scanner), Konzern-Reporting, Mandanten-DMS - alles in eine normalisierte Inbox geroutet.
Klassifikation und Extraktion - Der Agent identifiziert Mandant, Buchungssatz, Prüfungshandlung und extrahiert strukturierte Felder mit Konfidenzbewertungen.
Vorschlag - Der Agent wendet firmen-spezifische Prüfungsmethodik, IDW-PS-Mappings und Wesentlichkeitsschwellen an und schlägt Prüfungshandlung, Tickmark, Working-Paper-Abschnitt oder Bestätigungsvermerks-Bestandteil vor.
Caseware-Schnittstelle - Freigegebene Prüfungshandlungen fliessen via API, IDEA-Schnittstelle oder Standard-Import in Caseware Working Papers; nichts umgeht das System of Record.
Audit und Reporting - Jede Aktion protokolliert mit Zeitstempel, Dokument-Hash, Agent-Version und Prüfername - das IDW-PS-460-Arbeitspapier und die APAS-Inspektions-Dokumentation teilen sich denselben Event-Log.

Was wo liegt

Schicht	Bleibt in Caseware	Lebt im Agenten
System of Record (Working Papers, Bestätigungsvermerk)	Ja	Nur lesen und schreiben
Firmen-Prüfungsmethodik	Ja	Liest, überschreibt nie
Mandanten-Akte (Vorjahr, laufendes Jahr)	Ja (Caseware + DMS)	Nur Hash und Link
IDW-PS-Mappings und Prüfungsvorlagen	Speichert Endfassung	Entwirft und referenziert
Wesentlichkeitsschwellen und Sample Sizes	Ja	Liest, schlägt Anpassungen vor
Journal-Entry-Testing-Logik	Speichert Ergebnis	Erzeugt Vorschlag (mandantenspezifisch gelernt)
Belegerfassung und Tickmarking	Speichert Endfassung	Auto-Klassifikation und Vorschlag
WP-Praxis-Steuerungs-Dashboard	Nur Quelldaten	Ja (mandantenübergreifend)

Das Prinzip ist einfach: Caseware bleibt das System of Record. Der Agent ist der Operator. Jede Architektur, die Caseware in einem Seitensystem nachbaut, zerstört den IDW-PS-460-Audit-Trail am ersten Tag und das Sign-off des Berufsträgers am zweiten.

Wo die Daten liegen

Mandantendaten - In Caseware und im WP-DMS, unangetastet. Der Agent arbeitet auf einer kontrollierten Kopie über zugelassene Schnittstellen.
Agent-State - In einer EU-residenten Umgebung (Frankfurt, Berlin oder vergleichbar), betrieben unter einem WPO-§-43-konformen AVV.
LLM-Inferenz - Entweder über EU-residente Endpunkte (Azure OpenAI EU, AWS Bedrock EU, Anthropic Claude auf AWS EU, Mistral) oder auf einem WP-Praxis-privaten Deployment für hochsensible Mandate.
Prompt-/Output-Retention - Für IDW PS 460 protokolliert. Nicht für Vendor-Modell-Training verwendet - der AVV sagt das explizit.
Backups - In der EU, verschlüsselt, mit dokumentierter Aufbewahrung gemäss handelsrechtlichen Fristen (10 Jahre) und APAS-Inspektions-Pflichten.

Sehen, wie ein Caseware-resident Agent für Ihre WP-Praxis aussieht?

Henri geht mit WP-Sozii in 30 Minuten durch den zeitintensivsten Mandanten im Bestand - keine Folien, keine Buzzwords.

Demo buchen →

Fünf dunkle Metall-Handakten-Rücken nebeneinander mit orangefarbenem Band am linken - der phasenweise Rollout von einem Mandanten ins gesamte Prüfungsportfolio

Der 60-Tage-Pilot

Der grösste Fehler, den WP-Praxen bei KI machen, ist, mit einer Strategie zu starten. Der richtige Weg ist umgekehrt: Ein Mandant, ein Use Case, 60 Tage.

Die Phasen

Tage 1-10: Scope - Mandanten wählen. Der richtige ist mittelgross (Bilanzsumme 20 bis 200 Mio. EUR), mit wiederkehrender Prüfungsmethodik, einem CFO oder Geschäftsführer, der als Pilot-Mandant bereit ist. Den aktuellen Journal-Entry-Testing- und Belegerfassungs-Prozess Schritt für Schritt kartieren.
Tage 11-20: Datenfundament - Mandanten-Buchhaltungs-Schnittstellen (DATEV, SAP, Lexware), Stammdatenqualität, Vorjahres-Arbeitspapiere und wiederkehrende Prüfungshandlungen prüfen. Den offensichtlichen Müll bereinigen. Der Agent ist nur so gut wie diese Eingabe.
Tage 21-35: Build - Agent über die Caseware-API an Caseware, über die DATEV-Schnittstelle oder SAP-OData an die Mandanten-Buchhaltung anbinden. Auf den letzten zwei Saisons Prüfungshandlungen für diesen Mandanten trainieren. Schatten-Modus laufen lassen, in dem jede Prüfungshandlung erzeugt, aber nicht gepostet wird.
Tage 36-50: Parallel-Pilot - Live mit Berufsträger-Freigabe auf jeder Prüfungshandlung. Der Agent entwirft, der Mensch prüft. Genauigkeit, Zeit-pro-Prüfungshandlung und Ausnahmequote verfolgen. Konfidenzschwelle justieren.
Tage 51-60: Konfidenz steigern - Für Prüfungshandlungen, bei denen der Agent 20+ Mal in Folge richtig lag, den Working-Paper-Entwurf automatisch freigeben. Für Wesentlichkeitsbeurteilung und Bestätigungsvermerks-Argumentation immer menschliche Prüfung. Verfahrensdokumentation für APAS-Inspektion dokumentieren.
Tag 60+: Erweitern - Läuft ein Mandant sauber, die nächsten zwei dazunehmen. Laufen fünf Mandanten sauber, den zweiten Use Case ergänzen (in der Regel ESEF / CSRD oder IDW PS 460 Working Paper).

Checkliste vor dem Start

□ Pilot-Mandant ausgewählt, schriftliche Vereinbarung mit dem Mandanten zur Tool-Nutzung
□ AVV abgeschlossen, Berufsgeheimnis nach WPO § 43 und § 203 StGB ausdrücklich genannt, No-Training-Klausel bestätigt
□ Mandanten-Buchhaltungs-Zugang (DATEV, SAP, Lexware) bereinigt und getestet
□ Prüfungsmethodik maschinenlesbar dokumentiert (firmen-spezifische Tickmarks, IDW-PS-Mappings, Wesentlichkeitsschwellen)
□ Caseware-API- oder Import-Zugang bestätigt
□ Outline der Verfahrensdokumentation entworfen (APAS-Inspektion-ready)
□ Prüfungsleiter als Pilot-Lead benannt, mit explizitem Zeitbudget
□ Erfolgsmetriken vereinbart - in der Regel Zeit pro Prüfungshandlung, Genauigkeit, Ausnahmequote
□ Go/No-go-Review für Tag 30 und Tag 60 geplant

Was zu messen ist

Zeit pro Prüfungshandlung - Baseline manuell, Ziel mit Agent (typischerweise 20 bis 30 Prozent der Baseline)
Genauigkeit - Prüfungshandlungen, die der Mensch unverändert akzeptiert - Ziel 80%+ ab Woche 4, 95%+ ab Woche 8
Ausnahmequote - Positionen, die der Agent als geringe Konfidenz zurückgibt - Trend verfolgen, nicht den Absolutwert
Audit-Durchlaufzeit - Mandanten-Daten-Eingang bis Bestätigungsvermerks-Entwurf - Ziel 25 bis 35 Prozent Reduktion
Arbeitspapier-Qualität - APAS-artiger interner Quality-Review-Score auf agent-entworfenen Arbeitspapieren vs. menschlicher Baseline
Prüfungs-Stunden pro Mandant - Saison-über-Saison-Vergleich; Ziel 30 bis 45 Prozent Reduktion innerhalb von zwei Saisons

IDW PS, CSRD und EU AI Act

Compliance ist in der WP-Praxis der Knackpunkt. Alle anderen Überlegungen sitzen darunter. Der Berufsstand hat vier sich überlappende Regelwerke, die KI berühren: IDW PS (200er-Serie), WPO und Berufsrecht, CSRD/ESRS und EU AI Act. Jedes hat eine konkrete Antwort; keines ist ein Showstopper.

IDW PS - das Audit-Betriebshandbuch

IDW PS 200 setzt Bedeutung und Stellenwert der IDW-PS-Serie, die den International Standards on Auditing (ISA) mit deutschen Rechtsanpassungen entspricht⁴. Für einen KI-Agenten sind die relevanten Standards IDW PS 261 (Prüfungshandlungen zu doloser Handlung), IDW PS 330 (Abschlussprüfung bei IT-Einsatz), IDW PS 460 (Dokumentation) und IDW PS 980 (Compliance-Management-Systeme) sowie IDW EPS KMU 1 für KMU-skalierte Prüfungen.

IDW PS 261 - Prüfungshandlungen zu doloser Handlung - Der Agent fährt den Indikatoren-Katalog auf der Voll-Population, nicht auf einem Sample, mit auditor-bestätigbarem Scoring⁹
IDW PS 330 - Prüfung bei IT-Einsatz - Der Agent selbst ist ein IT-Mittel im Audit-Einsatz; die Verfahrensdokumentation muss Datenherkunft, Berechnungslogik, manuelle Eingriffe und Kontrollen dokumentieren¹⁰
IDW PS 460 - Dokumentation - Jede Prüfungshandlung dokumentiert mit Zeitstempel, Beleg-Referenz, Prüfungsschritt, Prüfungsergebnis, Auditor-Signatur¹¹
IDW PS 980 - CMS-Prüfung - Der Agent kann eine CMS-Prüfung gegen die sieben IDW-PS-980-Komponenten strukturieren mit dokumentiertem Nachweis je Komponente¹²
IDW EPS KMU 1 - Für KMU-skalierte Prüfungen wendet der Agent die vereinfachten Verfahren an, während der Berufsträger voll verantwortlich bleibt⁷

IDW PS 861 - der KI-Audit-Massstab

IDW PS 861 (März 2023) liefert den ersten deutschen Prüfungsstandard für KI-Systeme auf Basis ISAE 3000 (Revised)⁵⁶. Die fünf Kriterien - Datenqualität, Modellintegrität, Erklärbarkeit, Robustheit, Sicherheit - gelten sowohl für KI-Systeme, die geprüft werden, als auch für KI-Systeme, die die WP-Praxis selbst in ihrem eigenen Audit-Workflow einsetzt.

Datenqualität - Dokumentierte Data Lineage von Mandanten-Buchhaltung zum KI-Input; reproduzierbar
Modellintegrität - Versionierte Modelle, unveränderbare Modell-Fingerprints, Change Control dokumentiert
Erklärbarkeit - Jede Agent-Ausgabe erklärt das Warum mit Bezug zum IDW-PS-Indikator und zum Quell-Nachweis
Robustheit - Definiertes Verhalten bei Data Drift, fehlenden Daten und adversarialem Input
Sicherheit - EU-Hosting, Zugriffskontrollen, Verschlüsselung, Audit-Trail

WPO und Berufsrecht

Die Wirtschaftsprüferordnung setzt die Berufspflichten des WP. WPO § 43 regelt die Verschwiegenheitspflicht; § 203 StGB macht die unbefugte Offenbarung von Mandantendaten zur Straftat. Der Agent muss beides respektieren¹³¹⁴¹⁵.

Nur EU-Hosting - Mandantendaten, die der Agent verarbeitet, bleiben in EU-Rechenzentren
AVV mit Berufsgeheimnis-Klausel - Berufsgeheimnisträger ausdrücklich abdecken und § 203 StGB und WPO § 43 referenzieren
Kein Training auf Mandantendaten - Vendor-Vereinbarung muss eine ausdrückliche No-Training-Klausel zu Prompts und Outputs enthalten
Berufsträger bleibt verantwortlich - Der WP unterzeichnet jeden Bestätigungsvermerk; der Agent bereitet vor, der Mensch zeichnet ab
APAS-Inspektion-fähige Audit-Logs - Jede Agent-Aktion verfügbar für den wiederkehrenden APAS-Inspektions-Zyklus²⁸

CSRD und Nachhaltigkeitsprüfung

Das CSRD-Umsetzungsgesetz erweitert die Prüfungspflicht auf die Nachhaltigkeitsberichterstattung. Nach der EU-Omnibus-Vereinfachung 2025 sind Unternehmen mit über 1.000 Mitarbeitenden UND über 450 Mio. EUR Umsatz im Anwendungsbereich; bis 1. Oktober 2026 gilt Limited Assurance, danach Reasonable Assurance¹⁷¹⁸¹⁹.

Limited Assurance bis 1. Okt 2026 - Geringere Nachweisanforderungen; der Agent mappt die ESRS-Datenpunkte gegen den Nachhaltigkeitsbericht
Reasonable Assurance ab 1. Okt 2026 - Volle aussagebezogene Prüfungshandlungen auf ESRS-Daten; der Agent erzeugt die Handlungen und die Working Papers
ESEF / iXBRL Tagging - Der Agent validiert das XBRL-Tagging gegen die ESEF-Taxonomie und die ESRS-Datenpunkte
Zusatzqualifikation des WP - Der Berufsträger braucht eine Zusatzqualifikation für die Nachhaltigkeitsprüfung; Grandfather-Regeln gelten für WPs, die vor dem 1. Januar 2026 bestellt wurden¹⁷
Lagebericht-Abgleich - Der Agent gleicht die quantitativen Angaben zwischen Nachhaltigkeitsbericht, Lagebericht und Jahresabschluss ab

EU AI Act - was gilt, was nicht

Der EU AI Act gilt ab 2. August 2026 vollumfänglich. Für eine WP-Praxis, die KI-Agenten einsetzt, sind die relevanten Artikel überwiegend limited-risk: Transparenz, KI-Kompetenz nach Artikel 4 und die GPAI-Pflichten auf Anbieterseite²⁶²⁷. Der Agent selbst ist in der Regel kein Hochrisiko-System, ausser bei Mandanten-Bonität, automatisierten Kreditentscheidungen oder Beschäftigungsentscheidungen.

Artikel 4 (KI-Kompetenz) - Jeder Berufsträger und Prüfungsassistent, der den Agenten nutzt, erhält dokumentierte KI-Kompetenzschulung²⁷
Transparenzpflichten - Mandanten werden informiert, dass KI im Audit eingesetzt wird; der Berufsträger bleibt nach WPO § 43 verantwortlich
Anbieterpflichten - Der LLM-Anbieter (OpenAI, Anthropic, Mistral, etc.) trägt die GPAI-Pflichten; die WP-Praxis ist Deployer, nicht Provider
Keine Hochrisiko-Einstufung (Standard-Audit) - Substantive Testing, Journal Entry Testing, Belegerfassung und Working-Paper-Entwurf sind keine Anhang-III-Use-Cases
IDW PS 861-Konsistenz - Dieselben fünf Kriterien (Datenqualität, Modellintegrität, Erklärbarkeit, Robustheit, Sicherheit) erfüllen sowohl die EU-AI-Act-Deployer-Pflichten als auch den IDW-PS-861-Rahmen

Compliance-Realitätscheck

Die vier Rahmen (IDW PS, WPO, CSRD, EU AI Act) konvergieren auf dieselben Betriebsprinzipien: EU-Hosting, benannter AVV mit Berufsgeheimnis, No-Training-Klausel, vollständiger IDW-PS-460-Audit-Trail, schriftliche Verfahrensdokumentation nach IDW PS 330, menschliche Berufsträger-Prüfung auf jedem Bestätigungsvermerk. Ein korrekt gebauter Agent erfüllt alle vier gleichzeitig. Eine “schnelle ChatGPT-Integration” erfüllt keines davon.

“KI bietet enorme Chancen für Unternehmen, unabhängig von Grösse oder Branche. Die grösste Gefahr ist, KI schlicht zu ignorieren und den Zug zu verpassen.”

- Dr. Ralf Wintergerst, Präsident von Bitkom, zur KI-Studie 2026²⁴

Mehr Mandate ohne mehr WPs

Der WP-Nachwuchsmangel verschwindet nicht. Zwei zusätzliche Prüfungsassistenten einzustellen wird jedes Jahr schwieriger, langsamer und teurer - und der WP-Examens-Funnel ist noch enger. Die Frage, die für WP-Sozii in den nächsten drei Jahren zählt, ist nicht “wie spare ich Zeit” - sondern “wie wachse ich ohne neue Köpfe”.

Was ein Agent mit der Kapazitätsrechnung macht

Szenario	20-Personen-WP-Praxis ohne Agent	20-Personen-WP-Praxis mit Agent
Mandate betreut	~15-20	~25-35
Prüfungs-Stunden pro Mittelstand-Mandant	800-1.400	500-900
Journal-Entry-Testing-Coverage	25-Sample-basiert	Voll-Population
Bestätigungsvermerks-Lieferung	15-25 Wochen nach Stichtag	8-14 Wochen nach Stichtag
CSRD-Mandate aufnehmbar	1-2	4-6
Zeit auf Beratung vs. Prüfung	~15% / 85%	~30% / 70%
Umsatz pro Berufsträger	EUR 350.000-500.000	EUR 550.000-800.000

Die wirtschaftliche Logik

Der Mandant zahlt für Ergebnisse - Ein Mandant zahlt dasselbe Prüfungs-Honorar, ob Belegerfassung manuell oder automatisiert war. Der Agent verschiebt Kosten, ohne den Preis zu verändern.
Voll-Population schlägt Sample - Sample-basierte Prüfung war immer eine Einschränkung; Voll-Populations-KI-Audit ist strikt besser und zunehmend die neue APAS-Erwartung
CSRD ist der Grenz-Mandant - Die CSRD-Prüfungspflicht ist eine einmalige Wachstumsfläche; die WP-Praxis mit dem KI-Agenten absorbiert CSRD ohne proportionales Einstellen und gewinnt die Grenz-Mandanten
Beratung ist die margenstarke Arbeit - Stunde-für-Stunde liefert Mandantenberatung 1,5 bis 2x den Stundensatz der Pflichtprüfung. Senior-Berufsträger-Zeit für Beratung freizustellen verschiebt den Mix.
Retention verdichtet sich - Mandanten mit früheren Bestätigungsvermerken und besser dokumentierten Working Papers wechseln den WP nicht. Die Retention-Kurve flacht ab.
Nachfolgeplanung wird leichter - Eine WP-Praxis mit 30 Mandaten und 20 Personen auf moderner Infrastruktur ist verkäuflich. Eine 15-Mandate-Praxis auf Papier und Excel ist es nicht.

Wo Superkind passt

Superkind baut eigene KI-Agenten, die auf den Systemen sitzen, die WP-Praxen bereits nutzen - Caseware Working Papers, Caseware IDEA, DATEV Audit, Audicon AuditSolutions / SmartAudit, MindBridge, Validis - und die Mandanten-Buchhaltung in DATEV, SAP, Lexware oder Sage - ohne Systemwechsel zu erzwingen. Das Vorgehen ist prozessorientiert: Wir kartieren Ihre Prüfungsmethodik, Ihren Journal-Entry-Testing-Workflow und Ihre Arbeitspapier-Vorlage, bevor wir eine Zeile Code anfassen. Der Agent wird auf Ihre Praxis-Realität zugeschnitten, nicht aus einer Vorlage gegossen.

Was im Superkind-Agenten für eine WP-Praxis steckt

Fähigkeit	Caseware AI / SmartAudit	MindBridge / Validis	Superkind Custom Agent
Caseware-native Integration	Ja	Begrenzt (Export)	Ja (API + Import-Vorlagen)
Mandanten-spezifisches Lernen	Begrenzt	Generische Modelle	Ja (pro Mandant, pro Branche)
IDW PS 261/330/460 Mappings	Teilweise	Nein	Ja (firmen-trainiert)
Voll-Populations-Journal-Entry-Testing	Sample-basiert	Ja	Ja (mit IDW PS 261 Kette)
IDW PS 460 Working-Paper-Entwurf	Nur Vorlagen	Nein	Ja (Firmenvorlage angewendet)
WPO-ready Hosting (Berufsgeheimnis)	Varies	Varies	Ja (EU + AVV mit Berufsgeheimnis)
Verfahrensdokumentation	Teilweise	Nein	Mit dem Agenten geliefert (APAS-ready)
WP-Praxis-Steuerungs-Dashboard	Nein	Nein	Ja (mandantenübergreifend)
60-Tage-Pilot	Self-Service	DIY	Begleitet, fester Scope

Was Superkind in eine WP-Praxis bringt

Prozessorientierte Einführung - Wir kartieren Prüfungsmethodik, Journal-Entry-Testing-Workflow und Arbeitspapier-Vorlagen vor dem Build - damit der Agent zur Praxis-Realität passt
Caseware-native Architektur - Der Agent arbeitet über die Caseware-API und Import-Vorlagen, plus DATEV Audit, Audicon SmartAudit und Mandanten-Buchhaltungs-Schnittstellen (DATEV, SAP, Lexware, Sage)
IDW-PS-ready Compliance - IDW PS 261, 330, 460, 980 und EPS KMU 1 Vorlagen mit vollem Audit-Trail für APAS-Inspektion
Mandanten-spezifisches Lernen - Kontenrahmen, Buchungsmuster, Branchen-Risiken und Vorjahres-Prüfungsfeststellungen jedes Mandanten werden zu Regeln, die der Agent automatisch anwendet
Voll-Populations-Testing - Journal Entry Testing auf dem gesamten Hauptbuch, nicht einem Sample - IDW-PS-261-Indikatoren-Kette nativ
WPO-konforme Compliance - EU-Hosting, AVV mit ausdrücklicher Berufsgeheimnis-Klausel nach WPO § 43 und § 203 StGB, No-Training-Garantien, vollständige Audit-Logs
IDW-PS-861-Konsistenz - Der Agent selbst erfüllt den IDW-PS-861-Rahmen für KI-Systeme - die WP-Praxis kann das Deployment vor APAS und der eigenen Berufsaufsicht verteidigen
Human-in-the-Loop by Design - Konfidenzschwellen konfigurierbar; nichts schliesst eine Prüfungshandlung unter der Linie ab, die Sie setzen
60-Tage-Pilot - Ein Mandant, ein Use Case, schriftliche Erfolgskriterien - Go oder No-go nach 60 Tagen
Langfristige Partnerschaft - Wir bleiben über den Pilot hinaus dabei; der Agent entwickelt sich mit der WP-Praxis weiter

Wo wir passen

✓ WP-Praxen mit 8+ Berufsträgern und 15+ Pflicht-Mandaten, bei denen Belegerfassung und Working-Paper-Entwurf der Engpass sind
✓ Firmen mit Caseware Working Papers, die Caseware als System of Record behalten wollen
✓ Praxen mit CSRD-Mandaten oder geplanter Aufnahme in den nächsten 24 Monaten
✓ WP-Sozii, die eine audit-feste Lösung statt eines ChatGPT-Nebenprojekts auf dem Prüfungsassistenten-Laptop wollen

Wo wir nicht passen

✗ Solo-WPs mit unter 5 Mandaten - Caseware-KI-Funktionen und DATEV Audit reichen
✗ Firmen, die ein kostenloses oder unter 500 EUR/Monat Tool wollen - wir bauen für Wert, nicht für den niedrigsten Preis
✗ WP-Praxen, die nicht bereit sind, Prüfungsmethodik-Dokumentation zu pflegen oder eine Verfahrensdokumentation für APAS zu führen
✗ Praxen, die Bestätigungsvermerks-Verantwortung outsourcen wollen - der Berufsträger bleibt nach WPO § 43 immer verantwortlich

Entscheidungsraster

Nicht jede WP-Praxis ist bereit, und nicht jede Praxis braucht einen eigenen Agenten. Das folgende Raster hilft bei der Einordnung.

Mit Caseware-KI-Funktionen und DATEV Audit starten, wenn

Solo oder Zwei-Personen-WP-Praxis - Durchsatz ist noch nicht der Engpass; horizontale KI-Assistenz reicht
Unter 5 Pflicht-Mandate - Die Rechnung trägt einen Custom-Build noch nicht
Keine CSRD-Mandate geplant - Sie können warten, bis die CSRD-Welle benachbarte Mandanten erreicht
Sie wollen KI breit testen, bevor Sie investieren - Caseware-KI-Funktionen und MindBridge sind der reibungsärmste Startpunkt

Zum eigenen Agenten wechseln, wenn

8+ Berufsträger oder 15+ Pflicht-Mandate - Koordinationsaufwand und Prüfungsstunden rechtfertigen den Build
CSRD-Prüfungspflicht in Sicht - Sie werden CSRD-Mandate innerhalb von 24 Monaten haben; den Agenten vor der Welle bauen
Einstellen ist blockiert - Sie haben versucht, Prüfungsassistenten und Berufsträger einzustellen, die Bewerber kommen nicht
Arbeitspapier-Entwurf ist der Engpass - Prüfungsleiter klagen über Saison-Stunden auf Dokumentation, nicht auf Prüfung
APAS-Inspektion steht an - Dokumentationslücken sind der häufigste Beanstandungspunkt; der Agent schliesst sie standardmässig
Senior-Berufsträger tickmarken Belege - WP-Examinierte verbringen Nächte mit dem, was Prüfungsassistenten tun sollten
Nachfolge oder Verkauf im 3-Jahres-Horizont - Modernisierte WP-Praxen erzielen höhere Multiples

Abwarten, wenn

Prüfungsmethodik nicht dokumentiert - Erst dokumentieren; der Agent rettet Sie nicht
Kein Caseware- oder DATEV-Audit-Zugang - Technischen Zugang vor dem Projekt klären
Widerstand vom Senior-WP - Der Berufsträger muss das Projekt tragen; ohne ihn bleibt es liegen
Kein Budget für AVV-Prüfung - Das rechtliche Fundament ist nicht verhandelbar; budgetieren Sie die Anwaltsstunden

Häufig gestellte Fragen

Ein KI-Agent zieht die Mandanten-Buchhaltung (DATEV, SAP, Lexware, Sage), führt vollumfängliches Journal Entry Testing nach IDW PS 261 auf der gesamten Buchungs-Population aus, entwirft die Risikobeurteilung nach IDW PS 261/330, fährt aussagebezogene Pruefungshandlungen, klassifiziert Belege gegen die Pruefungshandlung, formuliert das Arbeitspapier und Bestandteile des Bestätigungsvermerks und legt nur ungewöhnliche Fälle dem Berufsträger vor. Er verbindet sich mit Caseware, DATEV Audit, Audicon AuditSolutions und SmartAudit, der Mandanten-Buchhaltung, der Anlagenbuchhaltung und dem Konzern-Reporting.

MindBridge und Caseware Extractly (sowie DATEV Audit, SAP Audit Management, Audicon SmartAudit) haben 2025-2026 KI-Funktionen für Voll-Populations-Testing und Dokumenten-Extraktion ergänzt - überwiegend innerhalb ihrer eigenen Plattform. Ein eigener KI-Agent ist ein Workflow-Agent über die Plattformgrenzen hinweg: über die Audit-Plattform, die Mandanten-Buchhaltung, das Konzern-Reporting, IDW-konforme Arbeitspapiere und die firmen-spezifische Prüfungsmethodik hinweg. Beides ergänzt sich.

Der Agent zieht das vollständige Hauptbuch und die Buchungssatz-Population (kein Sample), führt den IDW PS 261 / ISA 240 Indikatoren-Katalog (Wochenend-Buchungen, ungewöhnliche Kontenkombinationen, runde Beträge, Manual Journal Entries, Late-Period-Adjustments) gegen jeden Buchungssatz, scort das Risiko pro Eintrag und legt dem WP eine gerankte Ausnahmenliste mit dem zutreffenden IDW PS 261 Indikator und Ein-Klick-Drill-through zum Quell-Beleg vor. Der WP prüft und unterzeichnet das Arbeitspapier - der Agent unterzeichnet nicht, er legt vor.

Ja, wenn der Agent so gebaut ist. Der Berufsträger bleibt nach WPO § 43 verantwortlich; der Agent bereitet nur Prüfungshandlungen vor und schlägt Schlussfolgerungen vor. Der Agent erfüllt die Dokumentationsstandards nach IDW PS 460 (jede Prüfungshandlung trägt Zeitstempel, Sample Selection Rationale, Auditor Sign-off, Document Hash). IDW PS 861 (März 2023) liefert den Rahmen für die Prüfung von KI-Systemen - dieselben Prinzipien gelten, wenn die WP-Praxis selbst KI im eigenen Workflow einsetzt.

Nein. Der Agent sitzt auf Caseware Working Papers, Caseware IDEA, DATEV Audit, Audicon AuditSolutions / SmartAudit und arbeitet über deren APIs, GAEB/CSV/XBRL-Schnittstellen und Standard-Import-Vorlagen. Ihre Prüfungsmethodik, Arbeitspapier-Vorlagen, Sample-Sizing-Logik und das Bestätigungsvermerks-Format bleiben unverändert.

Ein fokussierter Pilot läuft in 6 bis 8 Wochen. Wochen 1-2: Prüfungsmethodik-Mapping, Datenaudit und Scope-Festlegung. Wochen 3-5: Agent bauen, Caseware und Mandanten-Buchhaltung anbinden. Wochen 6-8: Parallel-Pilot mit Berufsträger-Freigabe auf jedem Arbeitspapier vor Go-Live. Erste messbar gesparte Stunden zeigen sich ab Woche 6.

Für eine typische WP-Praxis mit 25 bis 80 Mandaten und 8 bis 30 Berufsträgern plus Prüfungsassistenten entlasten KI-Agenten 30 bis 45 Prozent der Prüfungs-Stunden pro Mandant innerhalb von zwei Prüfungssaisons. Die grössten Einzelgewinne: Journal Entry Testing auf der Voll-Population (statt Sample), Belegerfassung für aussagebezogenes Testing (80 Prozent Kostenreduktion pro Beleg), Lead-Schedule-Abgleich und Working-Paper-Generierung.

Moderne KI-Extraktion erreicht rund 97 bis 99 Prozent Genauigkeit auf Buchungssatz-Kopffeldern (Konto, Gegenkonto, Betrag, Datum, Belegart) und 95 Prozent auf der IDW PS 261-Indikator-Klassifikation nach 60-tägiger Kalibrierung auf firmen-spezifische Mandanten-Muster. Für wiederkehrende Mandanten ist der Agent praktisch 100 Prozent auf Routine-Buchungen.

Drei Regeln. Erstens muss der KI-Anbieter ein EU-residentes Deployment anbieten - keine US-CLOUD-Act-Exposition unter Schrems II ohne gültiges Data Privacy Framework. Zweitens muss der AVV das Berufsgeheimnis nach WPO § 43 und § 203 StGB ausdrücklich abdecken. Drittens dürfen Prompts und Outputs nicht für Vendor-Modell-Training verwendet werden. Mit diesen drei Punkten ist Cloud-KI nach WPK-Guidance zulässig.

Das CSRD-Umsetzungsgesetz bringt die Prüfungspflicht für die Nachhaltigkeitsberichterstattung; bis 1. Oktober 2026 als Prüfung mit begrenzter Sicherheit, danach mit hinreichender Sicherheit. Nach der EU-Omnibus-Vereinfachung 2025 sind nur noch Unternehmen mit über 1.000 Mitarbeitenden UND über 450 Mio. EUR Umsatz im Anwendungsbereich. KI-Agenten helfen, indem sie ESRS-relevante Daten aus dem Nachhaltigkeitsbericht extrahieren, auf das ESEF-Tagging mappen und gegen Lagebericht und Jahresabschluss abgleichen.

IDW PS 861 (März 2023) regelt die Prüfung von KI-Systemen, nicht den Einsatz von KI in der Prüfung. Aber dieselbe Logik gilt für die WP-Praxis, die KI im eigenen Workflow einsetzt: Kriterien für Datenqualität, Modellintegrität, Erklärbarkeit, Robustheit, Sicherheit müssen erfüllt sein. Ein korrekt gebauter Agent liefert Dokumentation zu allen fünf - das erfüllt sowohl IDW PS 861 (falls die WP-Praxis selbst geprüft wird) als auch unterstützt die Berufsaufsicht im Fall einer APAS-Inspektion.

Nein. Die meisten WP-Praxen arbeiten mit einem externen Partner für Build, Integration und laufende Modellpflege und betreiben den Agenten dann täglich selbst. Die WP-Praxis besitzt die Prüfungsmethodik, die IDW-PS-Mappings, die Arbeitspapier-Vorlagen und die Prüfschlange. Die technische Arbeit liegt beim Partner.

Anfangs gemischt - und das ist normal. Prüfungsassistenten haben ein Jahrzehnt Software erlebt, die das Belegabarbeiten lösen sollte. Das Gespräch funktioniert, wenn Sie den Agenten als Entlastung der 60 Prozent darstellen, die niemand möchte: die 14. Lieferantenrechnung an einem Morgen tickmarken, denselben Arbeitspapier-Header 200 Mal in einer Saison tippen, Zahlen aus der PDF-Saldenliste in Excel kopieren. Die verbleibenden 40 Prozent - Mandantengespräch, Wesentlichkeitsbeurteilung, kritische Schätzungen, Bestätigungsvermerks-Argumentation - werden zum gesamten Job.

Vier Dinge gehen am häufigsten schief. Erstens: unsaubere Mandanten-Buchhaltung erzeugt falsche Journal-Entry-Ergebnisse - die Stammdaten in Phase 1 prüfen, nicht nach Go-Live. Zweitens: Agenten ohne Konfidenzschwellen erzeugen Bestätigungsvermerks-Risiken - immer Berufsträger-Sign-off auf jeder Prüfungshandlung verlangen. Drittens: fehlende Audit-Trails lassen die Prüfung selbst eine APAS-Inspektion scheitern - den Agenten in der Woche dokumentieren, in der er eingeschaltet wird. Viertens: ohne AVV mit Berufsgeheimnis-Klausel entsteht ein § 203 StGB-Risiko auf Mandantendaten.

Quellen

Henri Jung

Co-Gründer von Superkind. Er hilft Mittelstand und Unternehmen, eigene KI-Agenten einzusetzen, die zur Arbeitsweise der Teams passen. Henri schliesst die Lücke zwischen dem, was KI kann, und dem Wert, den sie in echten Unternehmen schafft. Er glaubt: Der Mittelstand hat alles, um bei KI vorne zu liegen - er braucht nur den richtigen Ansatz.

Wollen Sie Ihren Prüfungsassistenten die Saison zurückgeben?

Henri führt eine 30-Minuten-Arbeitssession durch den zeitintensivsten Mandanten in Ihrem Bestand - was ein Agent ändern würde, was er kostet und ob sich ein 60-Tage-Pilot lohnt.

Demo buchen →

KI bei Wirtschaftsprüfern und Audit-Firmen: Wie Mittelstand-WPs Substantive Testing und IDW PS-Dokumentation mit eigenen KI-Agenten automatisieren

Die WP-Engstelle

Was ein KI-Agent in der Prüfung tatsächlich tut

Die Agent-Schleife in einer Prüfung

Der Unterschied zu dem, was Sie heute haben

Caseware / MindBridge-KI vs. eigener KI-Agent für eine WP-Praxis

6 Use Cases, die heute funktionieren

1. Risikobeurteilung und Prüfungsplanung (IDW PS 261/330)

2. Journal Entry Testing (IDW PS 261)

3. Belegerfassung und Substantive Testing

4. Lead Schedule und Saldenanalyse

5. ESEF, Lagebericht und CSRD-Nachhaltigkeitsprüfung

6. IDW PS 460 Arbeitspapier und Bestätigungsvermerks-Bestandteile

Die Caseware-First-Architektur

Die fünf Integrationsschichten

Was wo liegt

Wo die Daten liegen

Sehen, wie ein Caseware-resident Agent für Ihre WP-Praxis aussieht?

Der 60-Tage-Pilot

Die Phasen

Checkliste vor dem Start

Was zu messen ist

IDW PS, CSRD und EU AI Act

IDW PS - das Audit-Betriebshandbuch

IDW PS 861 - der KI-Audit-Massstab

WPO und Berufsrecht

CSRD und Nachhaltigkeitsprüfung

EU AI Act - was gilt, was nicht

Mehr Mandate ohne mehr WPs

Was ein Agent mit der Kapazitätsrechnung macht

Die wirtschaftliche Logik

Wo Superkind passt

Was im Superkind-Agenten für eine WP-Praxis steckt

Was Superkind in eine WP-Praxis bringt

Superkind: Ehrliche Pros und Cons

Entscheidungsraster

Mit Caseware-KI-Funktionen und DATEV Audit starten, wenn

Zum eigenen Agenten wechseln, wenn

Abwarten, wenn

Häufig gestellte Fragen

Verwandte Artikel

Quellen

Wollen Sie Ihren Prüfungsassistenten die Saison zurückgeben?