Zurück zum Blog

KI bei Wirtschaftsprüfern und Audit-Firmen: Wie Mittelstand-WPs Substantive Testing und IDW PS-Dokumentation mit eigenen KI-Agenten automatisieren

Henri Jung, Co-Gründer bei Superkind
Henri Jung

Co-Gründer bei Superkind

Eine dunkle Metall-Lupe mit orangefarbenem Akzentring um die Linse - das tägliche Verb jedes Wirtschaftsprüfers, der prüft, abzeichnet und unterzeichnet

Dienstagmorgen im März, mittlere deutsche WP-Praxis. Ein Prüfungsassistent öffnet um 7:42 Uhr Caseware Working Papers. 142 offene Prüfungshandlungen für den 14. Mittelstand-Mandanten der Saison, eine seit drei Wochen ausstehende Saldenbestätigung der Hausbank, eine Mail vom Buchhalter des Mandanten mit “noch einer kurzen Frage” und eine Whiteboard-Erinnerung, dass der Bestätigungsvermerk für Mandant 12 am Freitag rausgeht. Das Telefon klingelt. Der Wirtschaftsprüfer fragt, ob die Wesentlichkeitsbeurteilung für Mandant 7 schon dokumentiert ist.

Der Berufsstand redet seit zehn Jahren über Digitalisierung. Inzwischen hat die Mathematik das Reden eingeholt. Die Wirtschaftsprüferkammer (WPK) ist im Januar 2026 für rund 21.000 Mitglieder bundesweit zuständig, davon etwa 15.000 Berufsträger und der Rest WP-Gesellschaften und Vereidigte Buchprüfer12. Der WP-Nachwuchsmangel ist das meistgenannte Strukturrisiko der Branche, die Prüfungsdichte steigt mit CSRD, und APAS-Inspektionen verschärfen jährlich die Dokumentationslatte13. Einstellen ist keine Strategie mehr. Prüfungs-Stunden pro Mandant sind die Engstelle.

Dieser Leitfaden richtet sich an den Sozius, den WP-Inhaber oder den Prüfungsleiter, der den KI-Hype zwei Jahre lang beobachtet hat und jetzt eine konkrete Antwort auf eine Frage will: Kann ein eigener KI-Agent tatsächlich Journal Entry Testing, Belegerfassung, Lead-Schedule-Abgleich, IDW-konforme Working-Paper-Entwürfe und ESEF-Tagging-Prüfung in Caseware übernehmen - und wenn ja, wie?

TL;DR

Ein KI-Agent für eine WP-Praxis zieht die Mandanten-Buchhaltung, führt vollumfängliches Journal Entry Testing nach IDW PS 261, entwirft aussagebezogene Prüfungshandlungen, erzeugt IDW-PS-460-konforme Arbeitspapiere, gleicht Lead Schedules ab und legt nur Ausnahmen vor - keine reine ChatGPT-Oberfläche neben Caseware.

Sechs Use Cases liefern schnellen Payback: Risikobeurteilung, Journal Entry Testing, Belegerfassung & Substantive Testing, Lead Schedule & Saldenanalyse, ESEF-/Lagebericht-/CSRD-Prüfung und IDW-PS-460-Arbeitspapier-Generierung.

60 Tage genügen, um einen fokussierten Pilot vom Kick-off bis zu den ersten messbar gesparten Stunden auf einem Prüfungsmandanten zu bringen.

IDW PS, WPO § 43 und IDW PS 861 sind die entscheidenden Rahmen. Der Agent muss Prüfungshandlungen, Arbeitspapiere und Schlussfolgerungen erzeugen, die APAS-Inspektion und Berufsaufsicht standhalten.

Die Wachstumsfrage verschiebt sich: dasselbe WP-Team führt 25 bis 35 Mandate statt 15 bis 20, absorbiert die CSRD-Welle ohne proportionales Einstellen und entlastet erfahrene Berufsträger für Bestätigungsvermerks-Argumentation und Mandantenberatung.

Die WP-Engstelle

Der Grund, warum Prüfungsarbeit so viel Zeit frisst, ist selten die Prüfung selbst. Es ist alles drum herum: die 14. Lieferantenrechnung an einem Morgen tickmarken, denselben Arbeitspapier-Header 200 Mal in einer Saison tippen, Saldenliste-Beträge aus PDF ins Caseware-Lead-Schedule kopieren, den richtigen IDW-PS-Paragraphen für die dritte Risiko-Buchung der Woche nachschlagen, denselben Verfahrensdokumentations-Abschnitt für den vierten Konzernmandanten formulieren. Mal 35 Mandate, und die Rechnung wird schnell hässlich.

  • ~21.000 WPK-Mitglieder bundesweit - Die WPK ist im Januar 2026 für rund 21.000 Mitglieder zuständig: Wirtschaftsprüfer, Vereidigte Buchprüfer, WP-Gesellschaften und BPG’s12.
  • WP-Nachwuchsmangel strukturell - Der Berufsstand meldet seit über einem Jahrzehnt einen Nachwuchsmangel; die WPK-Jahresstatistik zeigt stagnierende Berufsträger-Zahlen gegen steigende Prüfungsdichte (CSRD, ESEF, NIS2)2
  • CSRD-Prüfungspflicht erweitert das Volumen - Das CSRD-Umsetzungsgesetz erweitert die Prüfungspflicht auf die Nachhaltigkeitsberichterstattung für Unternehmen über 1.000 Mitarbeitende UND 450 Mio. EUR Umsatz; zunächst als Prüfung mit begrenzter Sicherheit, ab 1. Oktober 2026 mit hinreichender Sicherheit1718
  • IDW PS 861 setzt den KI-Audit-Massstab - Seit März 2023 liefert IDW PS 861 einen kriterienbasierten Rahmen für die Prüfung von KI-Systemen; dieselben fünf Prinzipien (Datenqualität, Modellintegrität, Erklärbarkeit, Robustheit, Sicherheit) gelten jetzt auch, wenn WP-Praxen KI im eigenen Workflow einsetzen56
  • MindBridge analysiert 100% der Transaktionen - Plattformen wie MindBridge basieren auf einem Jahrzehnt finance-nativer KI, trainiert auf über 260 Mrd. Transaktionen über 3.000+ ERP-Systeme mit 8.000+ eingebetteten GAAP-Regeln - die sample-basierte Prüfung wird durch Voll-Populations-Prüfung schnell ersetzt2021
  • Caseware AI Substantive Testing - Caseware Extractly verwandelt Stunden in Minuten für KI-gestütztes Substantive Testing, nativ in den Caseware-Working-Papers-Workflow, den die meisten deutschen Mittelstand-WPs bereits nutzen22
  • APAS-Inspektionen verschärfen die Dokumentation - Die Abschlussprüferaufsichtsstelle inspiziert WP-Praxen im zyklischen Turnus; Dokumentationslücken nach IDW PS 460 sind der häufigste Beanstandungspunkt28

Kernzahl

Der Prüfungsassistent verbringt 40 bis 60 Prozent der Audit-Stunden mit Belegerfassung, Lead-Schedule-Abgleich und Arbeitspapier-Dokumentation - die hochgradig repetitiven 60 Prozent, die KI-Agenten jetzt aus der Hand nehmen. Die verbleibenden 40 Prozent (Wesentlichkeitsbeurteilung, kritische Schätzungen, Bestätigungsvermerks-Argumentation, Mandantengespräch) sind genau das, wofür der WP Senior-Zeit braucht.

Das Ergebnis ist eine WP-Praxis, in der die erfahrensten Prüfer den grössten Teil ihrer Saison mit den repetitivsten Aufgaben verbringen, während Mandantengespräch, Wesentlichkeitsbeurteilung und Bestätigungsvermerks-Argumentation in die letzte Stunde des Tages gequetscht werden. KI-Agenten lösen das nicht, indem sie schlau sind. Sie lösen es, indem sie die wiederkehrenden 60 Prozent entfernen, die niemand auf beiden Seiten des Schreibtischs gerne macht.

KennzahlStatus quoQuelle
WPK-Mitglieder bundesweit~21.000WPK Jan 20261
IDW PS 861 für KI-Prüfungseit März 2023IDW5
CSRD Limited-Assurance-Phasebis 1. Okt 2026CSRD-UG17
CSRD Reasonable-Assurance-Phaseab 1. Okt 2026CSRD-UG17
CSRD-Schwellen (nach Omnibus)1.000+ MA UND 450 Mio. EUR UmsatzCSRD-UG18
MindBridge trainiert auf Transaktionen260+ Mrd.MindBridge20
Eingebettete GAAP-Regeln8.000+MindBridge20
EU AI Act vollständig anwendbar2. Aug 2026EU AI Act26

Was ein KI-Agent in der Prüfung tatsächlich tut

Der Markt ist voll mit Produkten unter der Aufschrift “KI für die Wirtschaftsprüfung”. Die meisten sind Anomalie-Detektion-Widgets oder Dokumenten-Klassifizierer. Ein echter KI-Agent geht deutlich weiter: Er besitzt den Workflow, nicht nur die Datenextraktion. So sieht der Unterschied in WP-Sprache aus.

Die Agent-Schleife in einer Prüfung

  1. Erfassen - Holt Mandanten-Buchhaltung aus DATEV, SAP, Lexware, Sage, Microsoft Dynamics, Oracle NetSuite oder proSAP; Saldenliste, Buchungsjournal, Anlagenspiegel, Lohnjournal; Belege aus PDF, XRechnung, ZUGFeRD, Foto, Scanner; Konzern-Reporting aus BPS, Lucanet, Tagetik, Oracle HFM.
  2. Klassifizieren - Erkennt Buchungssatz, Kontenklasse, Belegart, Geschäftsvorfall und die zutreffende IDW-PS-Prüfungshandlung; routet ins passende Pipeline-Segment (Substantive Testing, IKS-Prüfung, Substanzanalyse, Vollständigkeitsprüfung).
  3. Extrahieren - Zieht strukturierte Felder je Buchungssatz: Konto, Gegenkonto, Betrag, Datum, Belegart, Erfasser, Buchungstext - mit Konfidenzbewertung je Feld.
  4. Anreichern - Schlägt Mandanten-Akte, Vorjahres-Arbeitspapier, Wesentlichkeitsschwelle, firmenspezifische Prüfungsmethodik und IDW-PS-Verweis nach - und wendet sie je Prüfungshandlung an.
  5. Vorschlagen - Erzeugt die vollständige Ausgabe: gerankte Ausnahmenliste für Journal Entry Testing nach IDW PS 261, Lead Schedule mit Vorjahres-Vergleich, Belegerfassungs-Vorschlag mit Tickmark, Arbeitspapier-Entwurf mit IDW-PS-460-konformer Dokumentation, Bestandteile des Bestätigungsvermerks.
  6. Entscheiden - Oberhalb der Konfidenzschwelle bucht der Agent direkt in Caseware; unterhalb landet der Fall in der Berufsträger-Prüfschlange mit Ein-Klick-Freigabe oder Korrektur.
  7. Lernen - Jede Korrektur fliesst zurück. Muster, die der Agent auf einem Mandanten dreimal sieht, werden zu Regeln, die er automatisch anwendet.
  8. Protokollieren - Jeder Schritt mit Zeitstempel, Dokument-Hash, Agent-Version und (bei Prüfung) Name des Prüfers - das IDW-PS-460-Arbeitspapier und die APAS-Inspektions-Dokumentation teilen sich denselben Event-Log.

Der Unterschied zu dem, was Sie heute haben

FähigkeitCaseware / DATEV AuditMindBridge / SmartAuditEigener KI-Agent
Liest Mandanten-BuchhaltungJa (manueller Import)Ja (auto)Ja (auto, multi-ERP)
Voll-Populations-Journal-Entry-TestingBegrenzt (Sample)JaJa (mit IDW PS 261 Mapping)
Entwirft IDW-PS-460-konforme ArbeitspapiereNur VorlagenNeinJa (Firmenmethodik angewendet)
Belegerfassung mit TickmarkManuellNur Auto-KlassifikationJa (auto + Tickmark + Prüfungshandlung)
Lead-Schedule-AbgleichManuellBegrenztJa (Vorjahres-Vergleich + Erklärung)
ESEF / CSRD Lagebericht-AbgleichManuellNeinJa (ESRS + ESEF Mapping)
Lernt Mandanten-MusterBegrenztGenerisch über KundenJa (pro Mandant, pro Branche)
Audit-Trail für APAS-InspektionAktivitäts-LogPlattform-LogVollständige IDW PS 460 Beweiskette

Die Kategorie ist entscheidend. Caseware, DATEV Audit, Audicon SmartAudit, MindBridge und Validis haben 2025-2026 KI-Funktionen ergänzt - überwiegend Anomalie-Detektion, Journal-Entry-Scoring und Dokumenten-Klassifikation innerhalb ihrer Plattform2022. Sie machen, was sie versprechen. Aber der Prüfungsassistent muss weiterhin das Arbeitspapier zusammenstellen, die Wesentlichkeitsbeurteilung durchführen, Bestandteile des Bestätigungsvermerks formulieren und gegen das Konzern-Reporting abgleichen - über Audit-Plattform, Mandanten-Buchhaltung, Konzern-Reportingtool und firmen-spezifische Methodik hinweg. Ein eigener Agent geht eine Schicht weiter: Er nimmt die Arbeit komplett aus der Hand, bis etwas ungewöhnlich oder ermessensabhängig wird.

Caseware / MindBridge-KI vs. eigener KI-Agent für eine WP-Praxis

Stärken des eigenen Agenten

  • End-to-end-Prüfungsarbeit - Prüfungsplanung, Substantive Testing, Working Paper, Bestätigungsvermerks-Bestandteile, Lernen
  • Systemübergreifend - Caseware plus Mandanten-Buchhaltung plus Konzern-Reporting plus Bank plus Anlagenbuchhaltung
  • Mandanten- und Branchen-spezifisches Lernen - Kontenrahmen, Buchungsmuster und Risikoprofile jedes Mandanten
  • IDW-PS-ready out of the box - IDW PS 261, 330, 460, 980, EPS KMU 1 Mappings und Audit-Trail
  • Voll-Populations-Testing nativ - Sample ist Fallback, nicht Default
  • Skaliert mit der WP-Praxis - ein Modell für 10 Mandate oder 100

Einschränkungen

  • Höhere Anfangsinvestition - Prüfungsmethodik-Mapping und Mandanten-Triage nötig
  • Braucht saubere Mandanten-Stammdaten - Kontenrahmen-Chaos rein, Lead-Schedule-Chaos raus
  • Verfahrensdokumentation - vor Go-Live schriftlich für APAS-Inspektion
  • AVV mit Berufsgeheimnis-Klausel - rechtliches Papier vor dem technischen Pilot nach WPO § 43 und § 203 StGB
  • Menschliche Prüfung auf jeder Prüfungshandlung - der Berufsträger unterzeichnet immer den Bestätigungsvermerk

“AI-powered substantive testing turns hours into minutes by extracting, classifying and reconciling evidence in seconds - so the auditor can spend their judgement where it matters: on the unusual, the material and the disputed.”

- Caseware, zu AI-powered Substantive Testing mit Caseware Extractly22

6 Use Cases, die heute funktionieren

Nicht jeder Prüfungsschritt ist ein guter erster KI-Kandidat. Die folgenden sind es: hohes Volumen, repetitiv, gut dokumentiert, klare richtige Antwort. Starten Sie mit einem Mandanten in einem Use Case. Fügen Sie den nächsten hinzu, wenn der erste sauber läuft.

1. Risikobeurteilung und Prüfungsplanung (IDW PS 261/330)

Der erste Use Case ist die Planungsphase. Der Agent liest die Vorjahres-Arbeitspapiere, die Mandanten-Branchendaten, die Marktentwicklung und den Geschäftsbericht und entwirft eine Risiko-Heatmap mit den zutreffenden IDW-PS-261-Indikatoren - der Berufsträger geht mit einem strukturierten Startpunkt in das Prüfungsplanungs-Meeting, nicht mit einer leeren Word-Seite.

  • Vorjahres-Arbeitspapier-Synthese - Der Agent liest alle Vorjahres-Arbeitspapiere und legt unaufgeklärte Prüfungshinweise, Anpassungsbuchungen und Schätzungs-Änderungen offen
  • Branchen-Risiko - Der Agent mappt die Mandanten-Branche auf bekannte IDW-PS-261-Indikatoren-Kataloge (Bauwirtschaft, Automotive, Handel, Bank, Versicherung, Health)
  • Wesentlichkeitsschwellen-Vorschlag - Der Agent schlägt Wesentlichkeitsschwelle und Tolerable Error auf Basis der firmen-spezifischen Methodik und Mandanten-Grösse vor
  • Risiko-Heatmap - Der Agent präsentiert eine farbcodierte Heatmap nach Risikobereich, Konten-Cluster und IDW PS 261/330 Indikator
  • Prüfungsstrategie-Entwurf - Der Agent entwirft die Prüfungsstrategie (Substantive vs. Controls Reliance) zur Berufsträger-Prüfung
  • Gesparte Zeit - Planungsphase, die zuvor 8 bis 16 Stunden pro Mandant kostete, fällt auf 2 bis 4 Stunden Prüfung

2. Journal Entry Testing (IDW PS 261)

Der einzelne Use Case mit höchster Hebelwirkung. Nach IDW PS 261 muss jede Prüfung Prüfungshandlungen zu doloser Handlung umfassen - und der Indikatoren-Katalog ist gut dokumentiert. Ein Agent fährt die vollständige Buchungssatz-Population (kein Sample) gegen die Indikatoren, scort jeden Eintrag und legt dem Berufsträger eine gerankte Ausnahmenliste vor.

  • Voll-Populations-Testing - Jeder Buchungssatz gescort - kein Sample von 25, das gesamte Hauptbuch
  • IDW PS 261 Indikatoren-Katalog - Wochenend- und Aussenarbeitszeit-Buchungen, ungewöhnliche Kontenkombinationen, runde Beträge, Manual Journal Entries, Late-Period-Adjustments, Buchungen kurz vor Bilanzstichtag9
  • Risiko-Score je Buchungssatz - Ein Composite-Score, der alle Indikatoren mit Konfidenz kombiniert; gerankte Ausnahmenliste für den Berufsträger
  • Drill-through zum Quell-Beleg - Ein Klick von der Ausnahme zum Original-Beleg, dem Erfasser und dem Buchungstext
  • Arbeitspapier auto-generiert - Das Journal-Entry-Testing-Arbeitspapier entworfen mit der IDW PS 261 Indikatoren-Kette, bereit zur Berufsträger-Unterzeichnung
  • Gesparte Zeit - Journal Entry Testing, das zuvor 4 bis 8 Stunden pro Mandant kostete, fällt auf 30 bis 60 Minuten Prüfung

3. Belegerfassung und Substantive Testing

Die grösste Warteschlange in der Audit-Saison. Ein Agent liest Lieferantenbelege, Kundenrechnungen, Kontoauszüge und Lieferantenbestätigungen aus dem Mandanten-DMS, klassifiziert sie gegen die Prüfungshandlung, verknüpft sie mit dem Buchungssatz und fügt den passenden Tickmark hinzu.

  • Multi-Format-Eingabe - PDF, XRechnung, ZUGFeRD, Foto, Scanner, Mandanten-DMS-Belegtransfer
  • Prüfungshandlungs-Klassifikation - Vollständigkeit, Bestand, Bewertung, Ausweis, Rechte und Verpflichtungen - der Agent klassifiziert, welche Assertion jeder Beleg adressiert
  • Tickmark-Auto-Anwendung - Firmen-spezifisches Tickmark-System je Beleg angewendet; der Mensch bestätigt nur mehrdeutige Fälle
  • Saldenbestätigungs-Generierung - Saldenbestätigungs-Briefe entworfen, adressiert und in die Versandschlange gelegt
  • Substantive Analytical Procedures - Soll-Ist-Analytik über Jahre, Branchen-Benchmarks und Mandanten-Trends mit statistischen Schwellen
  • Gesparte Zeit - Belegerfassung, die zuvor 60 bis 120 Sekunden pro Beleg kostete, fällt auf 10 bis 20 Sekunden Prüfung

4. Lead Schedule und Saldenanalyse

Das Skelett jedes Caseware-Engagements. Ein Agent erzeugt das Lead Schedule je Kontenklasse aus der Mandanten-Saldenliste, fügt den Vorjahres-Vergleich hinzu, berechnet die Aufgliederung-by-Account, entwirft die Prüfungsfeststellung je material variance und verknüpft jede Zelle zurück zur Quelle.

  • Saldenliste-Import - Direkter Import aus DATEV, SAP, Lexware, Sage mit automatischem Konten-Mapping je Firmenmethodik
  • Vorjahres-Vergleich auto-berechnet - Je Konto und je Kontenklasse, mit prozentualer Veränderung und absoluter Differenz
  • Material-Variance-Flagging - Veränderungen über der Wesentlichkeitsschwelle automatisch markiert mit Entwurf-Prüfungsfeststellung
  • Drill-Down zum Buchungssatz - Ein Klick vom Lead Schedule zu den zugrunde liegenden Buchungen, sortiert absteigend nach Betrag
  • Caseware-Working-Paper-Verlinkung - Jede Lead-Schedule-Zeile verlinkt zum entsprechenden Working-Paper-Abschnitt für Ein-Klick-Navigation
  • Gesparte Zeit - Lead-Schedule-Vorbereitung, die zuvor 4 bis 8 Stunden pro Mandant kostete, fällt auf 45 bis 90 Minuten Prüfung

5. ESEF, Lagebericht und CSRD-Nachhaltigkeitsprüfung

Die neue Wachstumsfläche für deutsche Mittelstand-WPs. Ab 2026 erweitert sich die CSRD-Prüfungspflicht auf die Nachhaltigkeitsberichterstattung; das IDW EPS für die Nachhaltigkeitsprüfung adaptiert ISAE 3000 auf den deutschen Markt. Ein Agent extrahiert ESRS-relevante Daten aus dem Nachhaltigkeitsbericht, mappt sie auf das ESEF-Tagging und gleicht gegen Lagebericht und Jahresabschluss ab1718.

  • ESRS-Datenextraktion - Der Agent liest den Nachhaltigkeitsbericht und identifiziert ESRS-Datenpunkte (E1 Klima, E5 Ressourcen, S1 Belegschaft, G1 Governance) mit Quellseite
  • ESEF-Tagging-Prüfung - Der Agent validiert das XBRL/iXBRL-Tagging gegen die ESEF-Taxonomie und die ESRS-Datenpunkte
  • Lagebericht-Abgleich - Quantitative Angaben im Nachhaltigkeitsbericht abgeglichen gegen Lagebericht und Jahresabschluss
  • Wesentlichkeitsanalyse-Prüfung - Der Agent prüft die Mandanten-Wesentlichkeitsanalyse gegen ESRS Standard 1 und das Double-Materiality-Framework
  • Limited-Assurance-Arbeitsprogramm - Bis 1. Oktober 2026 gilt Limited Assurance; der Agent erzeugt das Limited-Assurance-Arbeitsprogramm; ab 1. Oktober 2026 gilt Reasonable Assurance und der Agent erzeugt die entsprechend tieferen Prüfungshandlungen17

6. IDW PS 460 Arbeitspapier und Bestätigungsvermerks-Bestandteile

Die Dokumentation ist der Nachweis. Nach IDW PS 460 muss jede Prüfungshandlung mit Zeitstempel, Beleg-Referenz, Prüfungsschritt, Prüfungsergebnis und Auditor-Signatur dokumentiert werden. Der Agent erzeugt diese Dokumentation automatisch als Nebenprodukt der Prüfungshandlung - das Arbeitspapier ist fertig, wenn die Prüfung fertig ist, nicht danach.

  • Auto-generiertes Arbeitspapier je Prüfungshandlung - Header, Prüfungsschritte, Prüfungsergebnis, Schlussfolgerung vorausgefüllt in der Firmenvorlage
  • Cross-Reference-Matrix - Jedes Arbeitspapier verlinkt mit dem IDW-PS-Verweis, der Risiko-Heatmap und der Bestätigungsvermerks-Argumentation
  • Bestätigungsvermerks-Bestandteile entworfen - Schlüsselprüfungssachverhalte (Key Audit Matters) entworfen aus den Prüfungsfeststellungen mit höchstem Risiko
  • APAS-fähiger Audit-Trail - Jedes Arbeitspapier trägt IDW-PS-460-konforme Dokumentation: wer hat wann was mit welchem Nachweis mit welcher Schlussfolgerung getan
  • Gesparte Zeit - Arbeitspapier-Entwurf, der zuvor 25 bis 35 Prozent der Gesamtstunden kostete, fällt auf 8 bis 12 Prozent Prüfung
Use CaseHauptkennzahlTypische ROI-ZeitKomplexität
Risikobeurteilung & Planung70-80% Planungszeit gespart2-3 MonateMittel
Journal Entry Testing4-8h auf 30-60min pro Mandant1-2 MonateNiedrig-Mittel
Belegerfassung & Substantive Testing80% Kostenreduktion pro Beleg2-4 MonateMittel
Lead Schedule & Saldenanalyse4-8h auf 45-90min pro Mandant2-3 MonateMittel
ESEF, CSRD & Lagebericht50-70% Vorbereitungszeit gespart3-6 MonateMittel-Hoch
IDW PS 460 Arbeitspapier25-35% auf 8-12% der Gesamtstunden3-5 MonateMittel

Die Caseware-First-Architektur

In Deutschland dominieren Caseware Working Papers, Caseware IDEA, DATEV Audit, Audicon AuditSolutions / SmartAudit und ETL Audit den Mittelstand-WP-Praxis-Stack. Viele Praxen fahren zusätzlich MindBridge als Parallel-Anomalie-Detektion plus die Mandanten-Buchhaltung in DATEV, SAP, Lexware oder Sage2022. Jeder KI-Agent, der in einer WP-Praxis nützlich sein will, muss auf diesen Systemen leben, ohne sie zu ersetzen.

Die fünf Integrationsschichten

  1. Mandanten-Eingang - Mandanten-Buchhaltung (DATEV, SAP, Lexware, Sage), Saldenliste, Buchungsjournal, Anlagenspiegel, Lohnjournal, Belege (PDF, XRechnung, ZUGFeRD, Scanner), Konzern-Reporting, Mandanten-DMS - alles in eine normalisierte Inbox geroutet.
  2. Klassifikation und Extraktion - Der Agent identifiziert Mandant, Buchungssatz, Prüfungshandlung und extrahiert strukturierte Felder mit Konfidenzbewertungen.
  3. Vorschlag - Der Agent wendet firmen-spezifische Prüfungsmethodik, IDW-PS-Mappings und Wesentlichkeitsschwellen an und schlägt Prüfungshandlung, Tickmark, Working-Paper-Abschnitt oder Bestätigungsvermerks-Bestandteil vor.
  4. Caseware-Schnittstelle - Freigegebene Prüfungshandlungen fliessen via API, IDEA-Schnittstelle oder Standard-Import in Caseware Working Papers; nichts umgeht das System of Record.
  5. Audit und Reporting - Jede Aktion protokolliert mit Zeitstempel, Dokument-Hash, Agent-Version und Prüfername - das IDW-PS-460-Arbeitspapier und die APAS-Inspektions-Dokumentation teilen sich denselben Event-Log.

Was wo liegt

SchichtBleibt in CasewareLebt im Agenten
System of Record (Working Papers, Bestätigungsvermerk)JaNur lesen und schreiben
Firmen-PrüfungsmethodikJaLiest, überschreibt nie
Mandanten-Akte (Vorjahr, laufendes Jahr)Ja (Caseware + DMS)Nur Hash und Link
IDW-PS-Mappings und PrüfungsvorlagenSpeichert EndfassungEntwirft und referenziert
Wesentlichkeitsschwellen und Sample SizesJaLiest, schlägt Anpassungen vor
Journal-Entry-Testing-LogikSpeichert ErgebnisErzeugt Vorschlag (mandantenspezifisch gelernt)
Belegerfassung und TickmarkingSpeichert EndfassungAuto-Klassifikation und Vorschlag
WP-Praxis-Steuerungs-DashboardNur QuelldatenJa (mandantenübergreifend)

Das Prinzip ist einfach: Caseware bleibt das System of Record. Der Agent ist der Operator. Jede Architektur, die Caseware in einem Seitensystem nachbaut, zerstört den IDW-PS-460-Audit-Trail am ersten Tag und das Sign-off des Berufsträgers am zweiten.

Wo die Daten liegen

  • Mandantendaten - In Caseware und im WP-DMS, unangetastet. Der Agent arbeitet auf einer kontrollierten Kopie über zugelassene Schnittstellen.
  • Agent-State - In einer EU-residenten Umgebung (Frankfurt, Berlin oder vergleichbar), betrieben unter einem WPO-§-43-konformen AVV.
  • LLM-Inferenz - Entweder über EU-residente Endpunkte (Azure OpenAI EU, AWS Bedrock EU, Anthropic Claude auf AWS EU, Mistral) oder auf einem WP-Praxis-privaten Deployment für hochsensible Mandate.
  • Prompt-/Output-Retention - Für IDW PS 460 protokolliert. Nicht für Vendor-Modell-Training verwendet - der AVV sagt das explizit.
  • Backups - In der EU, verschlüsselt, mit dokumentierter Aufbewahrung gemäss handelsrechtlichen Fristen (10 Jahre) und APAS-Inspektions-Pflichten.

Sehen, wie ein Caseware-resident Agent für Ihre WP-Praxis aussieht?

Henri geht mit WP-Sozii in 30 Minuten durch den zeitintensivsten Mandanten im Bestand - keine Folien, keine Buzzwords.

Demo buchen →
Fünf dunkle Metall-Handakten-Rücken nebeneinander mit orangefarbenem Band am linken - der phasenweise Rollout von einem Mandanten ins gesamte Prüfungsportfolio

Der 60-Tage-Pilot

Der grösste Fehler, den WP-Praxen bei KI machen, ist, mit einer Strategie zu starten. Der richtige Weg ist umgekehrt: Ein Mandant, ein Use Case, 60 Tage.

Die Phasen

  1. Tage 1-10: Scope - Mandanten wählen. Der richtige ist mittelgross (Bilanzsumme 20 bis 200 Mio. EUR), mit wiederkehrender Prüfungsmethodik, einem CFO oder Geschäftsführer, der als Pilot-Mandant bereit ist. Den aktuellen Journal-Entry-Testing- und Belegerfassungs-Prozess Schritt für Schritt kartieren.
  2. Tage 11-20: Datenfundament - Mandanten-Buchhaltungs-Schnittstellen (DATEV, SAP, Lexware), Stammdatenqualität, Vorjahres-Arbeitspapiere und wiederkehrende Prüfungshandlungen prüfen. Den offensichtlichen Müll bereinigen. Der Agent ist nur so gut wie diese Eingabe.
  3. Tage 21-35: Build - Agent über die Caseware-API an Caseware, über die DATEV-Schnittstelle oder SAP-OData an die Mandanten-Buchhaltung anbinden. Auf den letzten zwei Saisons Prüfungshandlungen für diesen Mandanten trainieren. Schatten-Modus laufen lassen, in dem jede Prüfungshandlung erzeugt, aber nicht gepostet wird.
  4. Tage 36-50: Parallel-Pilot - Live mit Berufsträger-Freigabe auf jeder Prüfungshandlung. Der Agent entwirft, der Mensch prüft. Genauigkeit, Zeit-pro-Prüfungshandlung und Ausnahmequote verfolgen. Konfidenzschwelle justieren.
  5. Tage 51-60: Konfidenz steigern - Für Prüfungshandlungen, bei denen der Agent 20+ Mal in Folge richtig lag, den Working-Paper-Entwurf automatisch freigeben. Für Wesentlichkeitsbeurteilung und Bestätigungsvermerks-Argumentation immer menschliche Prüfung. Verfahrensdokumentation für APAS-Inspektion dokumentieren.
  6. Tag 60+: Erweitern - Läuft ein Mandant sauber, die nächsten zwei dazunehmen. Laufen fünf Mandanten sauber, den zweiten Use Case ergänzen (in der Regel ESEF / CSRD oder IDW PS 460 Working Paper).

Checkliste vor dem Start

  • Pilot-Mandant ausgewählt, schriftliche Vereinbarung mit dem Mandanten zur Tool-Nutzung
  • AVV abgeschlossen, Berufsgeheimnis nach WPO § 43 und § 203 StGB ausdrücklich genannt, No-Training-Klausel bestätigt
  • Mandanten-Buchhaltungs-Zugang (DATEV, SAP, Lexware) bereinigt und getestet
  • Prüfungsmethodik maschinenlesbar dokumentiert (firmen-spezifische Tickmarks, IDW-PS-Mappings, Wesentlichkeitsschwellen)
  • Caseware-API- oder Import-Zugang bestätigt
  • Outline der Verfahrensdokumentation entworfen (APAS-Inspektion-ready)
  • Prüfungsleiter als Pilot-Lead benannt, mit explizitem Zeitbudget
  • Erfolgsmetriken vereinbart - in der Regel Zeit pro Prüfungshandlung, Genauigkeit, Ausnahmequote
  • Go/No-go-Review für Tag 30 und Tag 60 geplant

Was zu messen ist

  • Zeit pro Prüfungshandlung - Baseline manuell, Ziel mit Agent (typischerweise 20 bis 30 Prozent der Baseline)
  • Genauigkeit - Prüfungshandlungen, die der Mensch unverändert akzeptiert - Ziel 80%+ ab Woche 4, 95%+ ab Woche 8
  • Ausnahmequote - Positionen, die der Agent als geringe Konfidenz zurückgibt - Trend verfolgen, nicht den Absolutwert
  • Audit-Durchlaufzeit - Mandanten-Daten-Eingang bis Bestätigungsvermerks-Entwurf - Ziel 25 bis 35 Prozent Reduktion
  • Arbeitspapier-Qualität - APAS-artiger interner Quality-Review-Score auf agent-entworfenen Arbeitspapieren vs. menschlicher Baseline
  • Prüfungs-Stunden pro Mandant - Saison-über-Saison-Vergleich; Ziel 30 bis 45 Prozent Reduktion innerhalb von zwei Saisons

IDW PS, CSRD und EU AI Act

Compliance ist in der WP-Praxis der Knackpunkt. Alle anderen Überlegungen sitzen darunter. Der Berufsstand hat vier sich überlappende Regelwerke, die KI berühren: IDW PS (200er-Serie), WPO und Berufsrecht, CSRD/ESRS und EU AI Act. Jedes hat eine konkrete Antwort; keines ist ein Showstopper.

IDW PS - das Audit-Betriebshandbuch

IDW PS 200 setzt Bedeutung und Stellenwert der IDW-PS-Serie, die den International Standards on Auditing (ISA) mit deutschen Rechtsanpassungen entspricht4. Für einen KI-Agenten sind die relevanten Standards IDW PS 261 (Prüfungshandlungen zu doloser Handlung), IDW PS 330 (Abschlussprüfung bei IT-Einsatz), IDW PS 460 (Dokumentation) und IDW PS 980 (Compliance-Management-Systeme) sowie IDW EPS KMU 1 für KMU-skalierte Prüfungen.

  • IDW PS 261 - Prüfungshandlungen zu doloser Handlung - Der Agent fährt den Indikatoren-Katalog auf der Voll-Population, nicht auf einem Sample, mit auditor-bestätigbarem Scoring9
  • IDW PS 330 - Prüfung bei IT-Einsatz - Der Agent selbst ist ein IT-Mittel im Audit-Einsatz; die Verfahrensdokumentation muss Datenherkunft, Berechnungslogik, manuelle Eingriffe und Kontrollen dokumentieren10
  • IDW PS 460 - Dokumentation - Jede Prüfungshandlung dokumentiert mit Zeitstempel, Beleg-Referenz, Prüfungsschritt, Prüfungsergebnis, Auditor-Signatur11
  • IDW PS 980 - CMS-Prüfung - Der Agent kann eine CMS-Prüfung gegen die sieben IDW-PS-980-Komponenten strukturieren mit dokumentiertem Nachweis je Komponente12
  • IDW EPS KMU 1 - Für KMU-skalierte Prüfungen wendet der Agent die vereinfachten Verfahren an, während der Berufsträger voll verantwortlich bleibt7

IDW PS 861 - der KI-Audit-Massstab

IDW PS 861 (März 2023) liefert den ersten deutschen Prüfungsstandard für KI-Systeme auf Basis ISAE 3000 (Revised)56. Die fünf Kriterien - Datenqualität, Modellintegrität, Erklärbarkeit, Robustheit, Sicherheit - gelten sowohl für KI-Systeme, die geprüft werden, als auch für KI-Systeme, die die WP-Praxis selbst in ihrem eigenen Audit-Workflow einsetzt.

  • Datenqualität - Dokumentierte Data Lineage von Mandanten-Buchhaltung zum KI-Input; reproduzierbar
  • Modellintegrität - Versionierte Modelle, unveränderbare Modell-Fingerprints, Change Control dokumentiert
  • Erklärbarkeit - Jede Agent-Ausgabe erklärt das Warum mit Bezug zum IDW-PS-Indikator und zum Quell-Nachweis
  • Robustheit - Definiertes Verhalten bei Data Drift, fehlenden Daten und adversarialem Input
  • Sicherheit - EU-Hosting, Zugriffskontrollen, Verschlüsselung, Audit-Trail

WPO und Berufsrecht

Die Wirtschaftsprüferordnung setzt die Berufspflichten des WP. WPO § 43 regelt die Verschwiegenheitspflicht; § 203 StGB macht die unbefugte Offenbarung von Mandantendaten zur Straftat. Der Agent muss beides respektieren131415.

  • Nur EU-Hosting - Mandantendaten, die der Agent verarbeitet, bleiben in EU-Rechenzentren
  • AVV mit Berufsgeheimnis-Klausel - Berufsgeheimnisträger ausdrücklich abdecken und § 203 StGB und WPO § 43 referenzieren
  • Kein Training auf Mandantendaten - Vendor-Vereinbarung muss eine ausdrückliche No-Training-Klausel zu Prompts und Outputs enthalten
  • Berufsträger bleibt verantwortlich - Der WP unterzeichnet jeden Bestätigungsvermerk; der Agent bereitet vor, der Mensch zeichnet ab
  • APAS-Inspektion-fähige Audit-Logs - Jede Agent-Aktion verfügbar für den wiederkehrenden APAS-Inspektions-Zyklus28

CSRD und Nachhaltigkeitsprüfung

Das CSRD-Umsetzungsgesetz erweitert die Prüfungspflicht auf die Nachhaltigkeitsberichterstattung. Nach der EU-Omnibus-Vereinfachung 2025 sind Unternehmen mit über 1.000 Mitarbeitenden UND über 450 Mio. EUR Umsatz im Anwendungsbereich; bis 1. Oktober 2026 gilt Limited Assurance, danach Reasonable Assurance171819.

  • Limited Assurance bis 1. Okt 2026 - Geringere Nachweisanforderungen; der Agent mappt die ESRS-Datenpunkte gegen den Nachhaltigkeitsbericht
  • Reasonable Assurance ab 1. Okt 2026 - Volle aussagebezogene Prüfungshandlungen auf ESRS-Daten; der Agent erzeugt die Handlungen und die Working Papers
  • ESEF / iXBRL Tagging - Der Agent validiert das XBRL-Tagging gegen die ESEF-Taxonomie und die ESRS-Datenpunkte
  • Zusatzqualifikation des WP - Der Berufsträger braucht eine Zusatzqualifikation für die Nachhaltigkeitsprüfung; Grandfather-Regeln gelten für WPs, die vor dem 1. Januar 2026 bestellt wurden17
  • Lagebericht-Abgleich - Der Agent gleicht die quantitativen Angaben zwischen Nachhaltigkeitsbericht, Lagebericht und Jahresabschluss ab

EU AI Act - was gilt, was nicht

Der EU AI Act gilt ab 2. August 2026 vollumfänglich. Für eine WP-Praxis, die KI-Agenten einsetzt, sind die relevanten Artikel überwiegend limited-risk: Transparenz, KI-Kompetenz nach Artikel 4 und die GPAI-Pflichten auf Anbieterseite2627. Der Agent selbst ist in der Regel kein Hochrisiko-System, ausser bei Mandanten-Bonität, automatisierten Kreditentscheidungen oder Beschäftigungsentscheidungen.

  • Artikel 4 (KI-Kompetenz) - Jeder Berufsträger und Prüfungsassistent, der den Agenten nutzt, erhält dokumentierte KI-Kompetenzschulung27
  • Transparenzpflichten - Mandanten werden informiert, dass KI im Audit eingesetzt wird; der Berufsträger bleibt nach WPO § 43 verantwortlich
  • Anbieterpflichten - Der LLM-Anbieter (OpenAI, Anthropic, Mistral, etc.) trägt die GPAI-Pflichten; die WP-Praxis ist Deployer, nicht Provider
  • Keine Hochrisiko-Einstufung (Standard-Audit) - Substantive Testing, Journal Entry Testing, Belegerfassung und Working-Paper-Entwurf sind keine Anhang-III-Use-Cases
  • IDW PS 861-Konsistenz - Dieselben fünf Kriterien (Datenqualität, Modellintegrität, Erklärbarkeit, Robustheit, Sicherheit) erfüllen sowohl die EU-AI-Act-Deployer-Pflichten als auch den IDW-PS-861-Rahmen

Compliance-Realitätscheck

Die vier Rahmen (IDW PS, WPO, CSRD, EU AI Act) konvergieren auf dieselben Betriebsprinzipien: EU-Hosting, benannter AVV mit Berufsgeheimnis, No-Training-Klausel, vollständiger IDW-PS-460-Audit-Trail, schriftliche Verfahrensdokumentation nach IDW PS 330, menschliche Berufsträger-Prüfung auf jedem Bestätigungsvermerk. Ein korrekt gebauter Agent erfüllt alle vier gleichzeitig. Eine “schnelle ChatGPT-Integration” erfüllt keines davon.

“KI bietet enorme Chancen für Unternehmen, unabhängig von Grösse oder Branche. Die grösste Gefahr ist, KI schlicht zu ignorieren und den Zug zu verpassen.”

- Dr. Ralf Wintergerst, Präsident von Bitkom, zur KI-Studie 202624

Mehr Mandate ohne mehr WPs

Der WP-Nachwuchsmangel verschwindet nicht. Zwei zusätzliche Prüfungsassistenten einzustellen wird jedes Jahr schwieriger, langsamer und teurer - und der WP-Examens-Funnel ist noch enger. Die Frage, die für WP-Sozii in den nächsten drei Jahren zählt, ist nicht “wie spare ich Zeit” - sondern “wie wachse ich ohne neue Köpfe”.

Was ein Agent mit der Kapazitätsrechnung macht

Szenario20-Personen-WP-Praxis ohne Agent20-Personen-WP-Praxis mit Agent
Mandate betreut~15-20~25-35
Prüfungs-Stunden pro Mittelstand-Mandant800-1.400500-900
Journal-Entry-Testing-Coverage25-Sample-basiertVoll-Population
Bestätigungsvermerks-Lieferung15-25 Wochen nach Stichtag8-14 Wochen nach Stichtag
CSRD-Mandate aufnehmbar1-24-6
Zeit auf Beratung vs. Prüfung~15% / 85%~30% / 70%
Umsatz pro BerufsträgerEUR 350.000-500.000EUR 550.000-800.000

Die wirtschaftliche Logik

  • Der Mandant zahlt für Ergebnisse - Ein Mandant zahlt dasselbe Prüfungs-Honorar, ob Belegerfassung manuell oder automatisiert war. Der Agent verschiebt Kosten, ohne den Preis zu verändern.
  • Voll-Population schlägt Sample - Sample-basierte Prüfung war immer eine Einschränkung; Voll-Populations-KI-Audit ist strikt besser und zunehmend die neue APAS-Erwartung
  • CSRD ist der Grenz-Mandant - Die CSRD-Prüfungspflicht ist eine einmalige Wachstumsfläche; die WP-Praxis mit dem KI-Agenten absorbiert CSRD ohne proportionales Einstellen und gewinnt die Grenz-Mandanten
  • Beratung ist die margenstarke Arbeit - Stunde-für-Stunde liefert Mandantenberatung 1,5 bis 2x den Stundensatz der Pflichtprüfung. Senior-Berufsträger-Zeit für Beratung freizustellen verschiebt den Mix.
  • Retention verdichtet sich - Mandanten mit früheren Bestätigungsvermerken und besser dokumentierten Working Papers wechseln den WP nicht. Die Retention-Kurve flacht ab.
  • Nachfolgeplanung wird leichter - Eine WP-Praxis mit 30 Mandaten und 20 Personen auf moderner Infrastruktur ist verkäuflich. Eine 15-Mandate-Praxis auf Papier und Excel ist es nicht.

Wo Superkind passt

Superkind baut eigene KI-Agenten, die auf den Systemen sitzen, die WP-Praxen bereits nutzen - Caseware Working Papers, Caseware IDEA, DATEV Audit, Audicon AuditSolutions / SmartAudit, MindBridge, Validis - und die Mandanten-Buchhaltung in DATEV, SAP, Lexware oder Sage - ohne Systemwechsel zu erzwingen. Das Vorgehen ist prozessorientiert: Wir kartieren Ihre Prüfungsmethodik, Ihren Journal-Entry-Testing-Workflow und Ihre Arbeitspapier-Vorlage, bevor wir eine Zeile Code anfassen. Der Agent wird auf Ihre Praxis-Realität zugeschnitten, nicht aus einer Vorlage gegossen.

Was im Superkind-Agenten für eine WP-Praxis steckt

FähigkeitCaseware AI / SmartAuditMindBridge / ValidisSuperkind Custom Agent
Caseware-native IntegrationJaBegrenzt (Export)Ja (API + Import-Vorlagen)
Mandanten-spezifisches LernenBegrenztGenerische ModelleJa (pro Mandant, pro Branche)
IDW PS 261/330/460 MappingsTeilweiseNeinJa (firmen-trainiert)
Voll-Populations-Journal-Entry-TestingSample-basiertJaJa (mit IDW PS 261 Kette)
IDW PS 460 Working-Paper-EntwurfNur VorlagenNeinJa (Firmenvorlage angewendet)
WPO-ready Hosting (Berufsgeheimnis)VariesVariesJa (EU + AVV mit Berufsgeheimnis)
VerfahrensdokumentationTeilweiseNeinMit dem Agenten geliefert (APAS-ready)
WP-Praxis-Steuerungs-DashboardNeinNeinJa (mandantenübergreifend)
60-Tage-PilotSelf-ServiceDIYBegleitet, fester Scope

Was Superkind in eine WP-Praxis bringt

  • Prozessorientierte Einführung - Wir kartieren Prüfungsmethodik, Journal-Entry-Testing-Workflow und Arbeitspapier-Vorlagen vor dem Build - damit der Agent zur Praxis-Realität passt
  • Caseware-native Architektur - Der Agent arbeitet über die Caseware-API und Import-Vorlagen, plus DATEV Audit, Audicon SmartAudit und Mandanten-Buchhaltungs-Schnittstellen (DATEV, SAP, Lexware, Sage)
  • IDW-PS-ready Compliance - IDW PS 261, 330, 460, 980 und EPS KMU 1 Vorlagen mit vollem Audit-Trail für APAS-Inspektion
  • Mandanten-spezifisches Lernen - Kontenrahmen, Buchungsmuster, Branchen-Risiken und Vorjahres-Prüfungsfeststellungen jedes Mandanten werden zu Regeln, die der Agent automatisch anwendet
  • Voll-Populations-Testing - Journal Entry Testing auf dem gesamten Hauptbuch, nicht einem Sample - IDW-PS-261-Indikatoren-Kette nativ
  • WPO-konforme Compliance - EU-Hosting, AVV mit ausdrücklicher Berufsgeheimnis-Klausel nach WPO § 43 und § 203 StGB, No-Training-Garantien, vollständige Audit-Logs
  • IDW-PS-861-Konsistenz - Der Agent selbst erfüllt den IDW-PS-861-Rahmen für KI-Systeme - die WP-Praxis kann das Deployment vor APAS und der eigenen Berufsaufsicht verteidigen
  • Human-in-the-Loop by Design - Konfidenzschwellen konfigurierbar; nichts schliesst eine Prüfungshandlung unter der Linie ab, die Sie setzen
  • 60-Tage-Pilot - Ein Mandant, ein Use Case, schriftliche Erfolgskriterien - Go oder No-go nach 60 Tagen
  • Langfristige Partnerschaft - Wir bleiben über den Pilot hinaus dabei; der Agent entwickelt sich mit der WP-Praxis weiter

Superkind: Ehrliche Pros und Cons

Wo wir passen

  • WP-Praxen mit 8+ Berufsträgern und 15+ Pflicht-Mandaten, bei denen Belegerfassung und Working-Paper-Entwurf der Engpass sind
  • Firmen mit Caseware Working Papers, die Caseware als System of Record behalten wollen
  • Praxen mit CSRD-Mandaten oder geplanter Aufnahme in den nächsten 24 Monaten
  • WP-Sozii, die eine audit-feste Lösung statt eines ChatGPT-Nebenprojekts auf dem Prüfungsassistenten-Laptop wollen

Wo wir nicht passen

  • Solo-WPs mit unter 5 Mandaten - Caseware-KI-Funktionen und DATEV Audit reichen
  • Firmen, die ein kostenloses oder unter 500 EUR/Monat Tool wollen - wir bauen für Wert, nicht für den niedrigsten Preis
  • WP-Praxen, die nicht bereit sind, Prüfungsmethodik-Dokumentation zu pflegen oder eine Verfahrensdokumentation für APAS zu führen
  • Praxen, die Bestätigungsvermerks-Verantwortung outsourcen wollen - der Berufsträger bleibt nach WPO § 43 immer verantwortlich

Entscheidungsraster

Nicht jede WP-Praxis ist bereit, und nicht jede Praxis braucht einen eigenen Agenten. Das folgende Raster hilft bei der Einordnung.

Mit Caseware-KI-Funktionen und DATEV Audit starten, wenn

  • Solo oder Zwei-Personen-WP-Praxis - Durchsatz ist noch nicht der Engpass; horizontale KI-Assistenz reicht
  • Unter 5 Pflicht-Mandate - Die Rechnung trägt einen Custom-Build noch nicht
  • Keine CSRD-Mandate geplant - Sie können warten, bis die CSRD-Welle benachbarte Mandanten erreicht
  • Sie wollen KI breit testen, bevor Sie investieren - Caseware-KI-Funktionen und MindBridge sind der reibungsärmste Startpunkt

Zum eigenen Agenten wechseln, wenn

  • 8+ Berufsträger oder 15+ Pflicht-Mandate - Koordinationsaufwand und Prüfungsstunden rechtfertigen den Build
  • CSRD-Prüfungspflicht in Sicht - Sie werden CSRD-Mandate innerhalb von 24 Monaten haben; den Agenten vor der Welle bauen
  • Einstellen ist blockiert - Sie haben versucht, Prüfungsassistenten und Berufsträger einzustellen, die Bewerber kommen nicht
  • Arbeitspapier-Entwurf ist der Engpass - Prüfungsleiter klagen über Saison-Stunden auf Dokumentation, nicht auf Prüfung
  • APAS-Inspektion steht an - Dokumentationslücken sind der häufigste Beanstandungspunkt; der Agent schliesst sie standardmässig
  • Senior-Berufsträger tickmarken Belege - WP-Examinierte verbringen Nächte mit dem, was Prüfungsassistenten tun sollten
  • Nachfolge oder Verkauf im 3-Jahres-Horizont - Modernisierte WP-Praxen erzielen höhere Multiples

Abwarten, wenn

  • Prüfungsmethodik nicht dokumentiert - Erst dokumentieren; der Agent rettet Sie nicht
  • Kein Caseware- oder DATEV-Audit-Zugang - Technischen Zugang vor dem Projekt klären
  • Widerstand vom Senior-WP - Der Berufsträger muss das Projekt tragen; ohne ihn bleibt es liegen
  • Kein Budget für AVV-Prüfung - Das rechtliche Fundament ist nicht verhandelbar; budgetieren Sie die Anwaltsstunden

Häufig gestellte Fragen

Ein KI-Agent zieht die Mandanten-Buchhaltung (DATEV, SAP, Lexware, Sage), führt vollumfängliches Journal Entry Testing nach IDW PS 261 auf der gesamten Buchungs-Population aus, entwirft die Risikobeurteilung nach IDW PS 261/330, fährt aussagebezogene Pruefungshandlungen, klassifiziert Belege gegen die Pruefungshandlung, formuliert das Arbeitspapier und Bestandteile des Bestätigungsvermerks und legt nur ungewöhnliche Fälle dem Berufsträger vor. Er verbindet sich mit Caseware, DATEV Audit, Audicon AuditSolutions und SmartAudit, der Mandanten-Buchhaltung, der Anlagenbuchhaltung und dem Konzern-Reporting.

MindBridge und Caseware Extractly (sowie DATEV Audit, SAP Audit Management, Audicon SmartAudit) haben 2025-2026 KI-Funktionen für Voll-Populations-Testing und Dokumenten-Extraktion ergänzt - überwiegend innerhalb ihrer eigenen Plattform. Ein eigener KI-Agent ist ein Workflow-Agent über die Plattformgrenzen hinweg: über die Audit-Plattform, die Mandanten-Buchhaltung, das Konzern-Reporting, IDW-konforme Arbeitspapiere und die firmen-spezifische Prüfungsmethodik hinweg. Beides ergänzt sich.

Der Agent zieht das vollständige Hauptbuch und die Buchungssatz-Population (kein Sample), führt den IDW PS 261 / ISA 240 Indikatoren-Katalog (Wochenend-Buchungen, ungewöhnliche Kontenkombinationen, runde Beträge, Manual Journal Entries, Late-Period-Adjustments) gegen jeden Buchungssatz, scort das Risiko pro Eintrag und legt dem WP eine gerankte Ausnahmenliste mit dem zutreffenden IDW PS 261 Indikator und Ein-Klick-Drill-through zum Quell-Beleg vor. Der WP prüft und unterzeichnet das Arbeitspapier - der Agent unterzeichnet nicht, er legt vor.

Ja, wenn der Agent so gebaut ist. Der Berufsträger bleibt nach WPO § 43 verantwortlich; der Agent bereitet nur Prüfungshandlungen vor und schlägt Schlussfolgerungen vor. Der Agent erfüllt die Dokumentationsstandards nach IDW PS 460 (jede Prüfungshandlung trägt Zeitstempel, Sample Selection Rationale, Auditor Sign-off, Document Hash). IDW PS 861 (März 2023) liefert den Rahmen für die Prüfung von KI-Systemen - dieselben Prinzipien gelten, wenn die WP-Praxis selbst KI im eigenen Workflow einsetzt.

Nein. Der Agent sitzt auf Caseware Working Papers, Caseware IDEA, DATEV Audit, Audicon AuditSolutions / SmartAudit und arbeitet über deren APIs, GAEB/CSV/XBRL-Schnittstellen und Standard-Import-Vorlagen. Ihre Prüfungsmethodik, Arbeitspapier-Vorlagen, Sample-Sizing-Logik und das Bestätigungsvermerks-Format bleiben unverändert.

Ein fokussierter Pilot läuft in 6 bis 8 Wochen. Wochen 1-2: Prüfungsmethodik-Mapping, Datenaudit und Scope-Festlegung. Wochen 3-5: Agent bauen, Caseware und Mandanten-Buchhaltung anbinden. Wochen 6-8: Parallel-Pilot mit Berufsträger-Freigabe auf jedem Arbeitspapier vor Go-Live. Erste messbar gesparte Stunden zeigen sich ab Woche 6.

Für eine typische WP-Praxis mit 25 bis 80 Mandaten und 8 bis 30 Berufsträgern plus Prüfungsassistenten entlasten KI-Agenten 30 bis 45 Prozent der Prüfungs-Stunden pro Mandant innerhalb von zwei Prüfungssaisons. Die grössten Einzelgewinne: Journal Entry Testing auf der Voll-Population (statt Sample), Belegerfassung für aussagebezogenes Testing (80 Prozent Kostenreduktion pro Beleg), Lead-Schedule-Abgleich und Working-Paper-Generierung.

Moderne KI-Extraktion erreicht rund 97 bis 99 Prozent Genauigkeit auf Buchungssatz-Kopffeldern (Konto, Gegenkonto, Betrag, Datum, Belegart) und 95 Prozent auf der IDW PS 261-Indikator-Klassifikation nach 60-tägiger Kalibrierung auf firmen-spezifische Mandanten-Muster. Für wiederkehrende Mandanten ist der Agent praktisch 100 Prozent auf Routine-Buchungen.

Drei Regeln. Erstens muss der KI-Anbieter ein EU-residentes Deployment anbieten - keine US-CLOUD-Act-Exposition unter Schrems II ohne gültiges Data Privacy Framework. Zweitens muss der AVV das Berufsgeheimnis nach WPO § 43 und § 203 StGB ausdrücklich abdecken. Drittens dürfen Prompts und Outputs nicht für Vendor-Modell-Training verwendet werden. Mit diesen drei Punkten ist Cloud-KI nach WPK-Guidance zulässig.

Das CSRD-Umsetzungsgesetz bringt die Prüfungspflicht für die Nachhaltigkeitsberichterstattung; bis 1. Oktober 2026 als Prüfung mit begrenzter Sicherheit, danach mit hinreichender Sicherheit. Nach der EU-Omnibus-Vereinfachung 2025 sind nur noch Unternehmen mit über 1.000 Mitarbeitenden UND über 450 Mio. EUR Umsatz im Anwendungsbereich. KI-Agenten helfen, indem sie ESRS-relevante Daten aus dem Nachhaltigkeitsbericht extrahieren, auf das ESEF-Tagging mappen und gegen Lagebericht und Jahresabschluss abgleichen.

IDW PS 861 (März 2023) regelt die Prüfung von KI-Systemen, nicht den Einsatz von KI in der Prüfung. Aber dieselbe Logik gilt für die WP-Praxis, die KI im eigenen Workflow einsetzt: Kriterien für Datenqualität, Modellintegrität, Erklärbarkeit, Robustheit, Sicherheit müssen erfüllt sein. Ein korrekt gebauter Agent liefert Dokumentation zu allen fünf - das erfüllt sowohl IDW PS 861 (falls die WP-Praxis selbst geprüft wird) als auch unterstützt die Berufsaufsicht im Fall einer APAS-Inspektion.

Nein. Die meisten WP-Praxen arbeiten mit einem externen Partner für Build, Integration und laufende Modellpflege und betreiben den Agenten dann täglich selbst. Die WP-Praxis besitzt die Prüfungsmethodik, die IDW-PS-Mappings, die Arbeitspapier-Vorlagen und die Prüfschlange. Die technische Arbeit liegt beim Partner.

Anfangs gemischt - und das ist normal. Prüfungsassistenten haben ein Jahrzehnt Software erlebt, die das Belegabarbeiten lösen sollte. Das Gespräch funktioniert, wenn Sie den Agenten als Entlastung der 60 Prozent darstellen, die niemand möchte: die 14. Lieferantenrechnung an einem Morgen tickmarken, denselben Arbeitspapier-Header 200 Mal in einer Saison tippen, Zahlen aus der PDF-Saldenliste in Excel kopieren. Die verbleibenden 40 Prozent - Mandantengespräch, Wesentlichkeitsbeurteilung, kritische Schätzungen, Bestätigungsvermerks-Argumentation - werden zum gesamten Job.

Vier Dinge gehen am häufigsten schief. Erstens: unsaubere Mandanten-Buchhaltung erzeugt falsche Journal-Entry-Ergebnisse - die Stammdaten in Phase 1 prüfen, nicht nach Go-Live. Zweitens: Agenten ohne Konfidenzschwellen erzeugen Bestätigungsvermerks-Risiken - immer Berufsträger-Sign-off auf jeder Prüfungshandlung verlangen. Drittens: fehlende Audit-Trails lassen die Prüfung selbst eine APAS-Inspektion scheitern - den Agenten in der Woche dokumentieren, in der er eingeschaltet wird. Viertens: ohne AVV mit Berufsgeheimnis-Klausel entsteht ein § 203 StGB-Risiko auf Mandantendaten.

Verwandte Artikel

Quellen

  1. Wirtschaftspruefkammer (WPK) - Mitgliederstatistik (Stand 1. Januar 2026)
  2. Wirtschaftspruefkammer (WPK) - Mitgliederstatistik Januar 2025 (PDF)
  3. Wirtschaftspruefkammer (WPK) - English statistics overview
  4. Institut der Wirtschaftspruefer (IDW) - Verlautbarungen und IDW PS Liste
  5. IDW PS 861 - Pruefung von KI-Systemen (Erster Pruefungsstandard fuer KI-Systeme)
  6. IDW EPS 861 (02.2022) - Pruefung von kuenstlicher Intelligenz
  7. IDW EPS KMU 1 - Anwendung der IDW PS auf KMU-Abschlusspruefungen
  8. IDW - Kuenstliche Intelligenz (Themenseite)
  9. IDW PS 261 / ISA 240 - Pruefungshandlungen zu doloser Handlung (Journal Entry Testing)
  10. IDW PS 330 - Abschlusspruefung bei Einsatz von Informationstechnologie
  11. IDW PS 460 - Dokumentation der Abschlusspruefung
  12. IDW PS 980 - Pruefung von Compliance-Management-Systemen
  13. Wirtschaftspruferordnung (WPO) - Gesetze im Internet
  14. WPO § 43 - Allgemeine Berufspflichten (Verschwiegenheit)
  15. Strafgesetzbuch § 203 - Verletzung von Privatgeheimnissen
  16. WPK - Nachhaltigkeitskompass / CSRD-Pruefungspflicht
  17. IDW - Regierungsentwurf CSRD-Umsetzungsgesetz mit Nachhaltigkeitspruefung durch Abschlusspruefer
  18. Haufe Finance - Pruefung des Nachhaltigkeitsberichts nach CSRD-Umsetzungsgesetz
  19. Ebner Stolz - CSRD-Umsetzung in Deutschland und Folgen
  20. MindBridge - AI platform for financial oversight (analyses 100% of transactions)
  21. MindBridge - Audit and Assurance (AI-driven substantive procedures)
  22. Caseware - AI-powered Substantive Testing with Extractly
  23. TrustRadius - Caseware IDEA vs MindBridge Platform Comparison 2026
  24. Bitkom - Durchbruch bei Kuenstlicher Intelligenz (Pressemitteilung 2026)
  25. Bitkom - Kuenstliche Intelligenz in Deutschland (Studienbericht 2026)
  26. EU AI Act - Implementation Timeline
  27. EU AI Act - Article 4 (KI-Kompetenz-Pflicht)
  28. Abschlusspruferaufsichtsstelle (APAS) - Berichte und Inspektionen
Henri Jung, Co-Gründer bei Superkind
Henri Jung

Co-Gründer von Superkind. Er hilft Mittelstand und Unternehmen, eigene KI-Agenten einzusetzen, die zur Arbeitsweise der Teams passen. Henri schliesst die Lücke zwischen dem, was KI kann, und dem Wert, den sie in echten Unternehmen schafft. Er glaubt: Der Mittelstand hat alles, um bei KI vorne zu liegen - er braucht nur den richtigen Ansatz.

Wollen Sie Ihren Prüfungsassistenten die Saison zurückgeben?

Henri führt eine 30-Minuten-Arbeitssession durch den zeitintensivsten Mandanten in Ihrem Bestand - was ein Agent ändern würde, was er kostet und ob sich ein 60-Tage-Pilot lohnt.

Demo buchen →