— Vertraulich —
← Zur Übersicht
PromptSteuer
PROMPTSTEUER

Architecture Review

KI-gestützte Steuer-Plattform · Multi-Modul · EU-hosted
Präsentiert
Roland Fiege · Founder
01 / 18

Nicht Produkt-Demo. Architektur-Check.

  1. Ist die Architektur tragfähig für das Wachstumsziel?
  2. Wo ist Tech-Debt — bewusst oder unbewusst?
  3. Wofür wird das mögliche Invest technisch verwendet?
  4. Welche Engineering-Organisation steht dahinter (Solo + KI vs. klassisches Team)?

Ziel heute: Ihr könnt nach dem Gespräch in drei Sätzen zusammenfassen, wie die PromptSteuer-Architektur aufgebaut ist.

02 / 18

Der Stack auf einer Folie.

Infrastruktur

ComputeCloudflare Workers / Pages Functions
DBCloudflare D1 (SQLite)
StorageCloudflare R2 (S3-API)
LLMSonnet 4.6 (Vision · Domain) · Haiku 4.5 (Router · Light)
Vector-DBCloudflare Vectorize (Voyage 3.5, 1024-dim)
AuthEigener Stack · Invite-Code (SHA-256) + Session-DB
HostingEU-only · DSGVO-konform

Delivery

EngineeringSolo + KI-Agents
FrameworkGSD Phase-Framework
Test-Coverage>95 % bei neuen Phasen
DeployGitHub-Push → Cloudflare Pages (Audit-Trail über Git)

Drei Zahlen die zählen

  • 4 Tage — GastroAudit vom Pre-Mortem zu Production
  • 165/165 — Tests grün bei Phase 4
  • 2.180 Tokens — gecachter SKR03-Prompt → 360 €/Mo Ersparnis je Kanzlei
03 / 18

Die fünf Kern-Entscheidungen.

EntscheidungBegründungKonsequenz
Serverless Edge statt K8s Keine Ops-Team-Kosten, globale Latenz, pay-per-request Cloudflare Lock-in akzeptiert
EU-only Hosting GoBD/DSGVO-Compliance als Produktmerkmal Kein US-Fallback
Eigener Auth-Stack DSGVO-Konformität, keine PII bei Drittanbietern DSGVO-Endpoints kontrolliert
LLM-Router als Abstraktion Provider-Unabhängigkeit strategisch vorbereitet Switch in Tagen, nicht Monaten
Standalone-First bei Modulen Velocity + Risk-Isolation, ADR-geführt Monorepo-Konsolidierung geplant
04 / 18

Hub-and-Spoke. Sechs Spezial-Agenten.

Statt Mono-Prompt: Haiku-Router klassifiziert Intent, Sonnet-Agenten lösen die Domäne. Shared Services nur on-demand.

Agent-Roster

vv-agentVermietung & Verpachtunglive
est-agentEinkommensteuer (AN)in Build
ust-agentUmsatzsteuer / VATQ2
eur-agentEinnahmen-ÜberschussQ2
airbnb-agentKurzzeitvermietungQ3
bilanz-agentBilanzierung / KMUfuture

Drei UX-Modi

  • Einfach — Tap-Wizard, Routing implizit
  • Fortgeschritten — Forms + sichtbarer Agent
  • Experte — Freitext + manuelle Agent-Wahl

Token-Budget pro Request

steuer-router      ~200    (Haiku 4.5)
+ 1 Spezial-Agent  ~1.000  (Sonnet 4.6)
+ Always-On        ~350    (rechts-guard,
                            sprach-adapter)
+ Optional         0–800   (glossar, fristen,
                            beleg-helper, ...)
─────────────────────────
= 1.550 – 2.350 Tokens/Request

Trennung Router/Agent erlaubt: (1) Modell-Tiering pro Aufgabe, (2) Domain-spezifisches Eval pro Agent, (3) Provider-Switch in Tagen, nicht Monaten.

05 / 18

Prompt-Caching + Anti-Halluzination.

Cost-Moat und Trust-Moat. Beides produktiv, nicht auf der Roadmap.

Pfeiler 1 · Prompt-Caching (produktiv)

// functions/api/kanzlei/scan.js, Zeile 343
system: [{
  type: 'text',
  text: SKR03_SYSTEM_PROMPT,          // 2.180 Tokens
  cache_control: { type: 'ephemeral', ttl: '1h' }
}]

Bei 40.000 Belegen/Mo: 360 €/Mo strukturelle Ersparnis. Ohne Caching: 360 $/Mo nur für gecachte Tokens. Mit: 36 $/Mo. Faktor 10.

Pfeiler 2 · Anti-Halluzinations-Framework (verpflichtend)

Drei-Stufen-Logik in jedem Agenten + Quellenbox mit §-Zitat in jeder Antwort. Hartcodierte Gesetzesreferenz-Bibliothek (~30 §§ EStG/UStG/StBerG) als verifizierte Fakten.

📚 QUELLEN & RECHTSGRUNDLAGEN:
• Pendlerpauschale: §9 Abs. 1 S. 3 Nr. 4 EStG (0,30 €/km)
• Erhöhte Pauschale ab km 21: §9 Abs. 1 S. 3 Nr. 4 S. 8 EStG
• Homeoffice-Pauschale: §4 Abs. 5 S. 1 Nr. 6c EStG (6 €/Tag, max. 1.260 €)

Stufe 1 weiß ich sicher → Aussage + Quelle. Stufe 2 unsicher → Einschränkung + STB-Empfehlung. Stufe 3 unbekannt → niemals raten. Defensible Trust statt Marketing-Claim.

06 / 18

Modul-Landschaft.

ModulCodeAPIUIKunden
V+V (Vermieter)Pilot-Gruppe
Scanner (Kanzlei)Kunde 1 · zahlend
GastroAudit1 Pilot
ESt / USt / EÜRpartiell
Airbnb / Bilanz

Ehrlich: Kunde 1 Beratung zahlt bereits — erste Revenue live. GastroAudit-Pilot läuft kostenlos. Scanner geht nach Phase 086 Security-Hardening in den vollen Rollout. First-Revenue-Zustand.

07 / 18

DSGVO / GoBD als Architektur.

AnforderungUnsere Lösung
Datenhaltung EUCloudflare EU Region lock
DSGVO Art. 28 AVVBilaterale AVV je Kanzlei-Kunde
Right-to-DeletePOST /api/auth/gdpr/delete
Right-to-ExportGET /api/auth/gdpr/export
LLM-Training-Opt-outAnthropic No-Training-Klausel
GoBD UnveränderbarkeitR2 + D1-Audit-Trail (Hash-Chain Q3)
Prompt-Cache TTL1h transient, kein Persist

Nicht da: BSI C5, ISO 27001. Beides Roadmap H2 2026 — nicht vor 5+ Enterprise-Kunden (CAC-Economics).

08 / 18

Rechts-Architektur — StBerG-konform by Default.

Die Grenze zwischen „Hilfe zur Selbsthilfe" und „unbefugte Steuerberatung" ist schmal. Wir lösen das architektonisch, nicht per Disclaimer.

01 · MENSCH-IN-DER-LOOP

Jede KI-Entscheidung erfordert User- oder StB-Bestätigung. KI schlägt vor, Mensch entscheidet — das ist rechtssicher „Hilfe zur Selbsthilfe".

02 · KONFIDENZ-AMPEL

Grün (>90 %) · Gelb (70–90 %) · Rot (<70 %) = Pflichtkorrektur. KI verweigert Auto-Durchlauf bei unsicheren Fällen.

03 · B2B ÜBER KANZLEI

Scanner-Einsatz in Kanzlei läuft über zugelassene Steuerberater als rechtliche Instanz. StBerG § 3 greift gar nicht — die Kanzlei ist die beratende Entität.

04 · § 4e StBerG NEU (1.9.2026)

Marktöffnung schafft neue rechtliche Kategorie: beschränkte Hilfeleistung als Nebenleistung. Unsere Agents werden damit rechtlich ermöglicht, wo sie heute grenzwertig wären.

05 · AUDIT-TRAIL + GUTACHTEN

Jede KI-Entscheidung protokolliert in D1 (Wer · Wann · Konfidenz · Freigabe). Geplant: Gutachten Professor für Steuerrecht als Trust-Asset.

09 / 18

GSD + Claude Code.

GSD-Phase-Lifecycle:

  /gsd-plan-phase    → PLAN.md mit Requirements + Success Criteria
       ↓
  /gsd-execute-phase → Code + Tests, atomare Commits
       ↓
  /gsd-verify        → VERIFICATION.md, Goal-backward-Check
       ↓
  /gsd-code-review   → REVIEW.md + REVIEW-FIX.md
       ↓
  /gsd-secure-phase  → Threat-Model-Check

Delivery-Nachweise Q2 2026

Phase 085Kanzlei Scanner MVP · 2 Wochen · VERIFICATION PASS
Phase 086Security Hardening · läuft, 6 Sub-Plans
GastroAudit Phase 0Pre-Mortem + 38 KNOWLEDGE-Files · 1 Tag
GastroAudit 1–4Bootstrap → Deployment · 3 Tage · 165/165 Tests
10 / 18

Kosten pro Beleg.

Status heute (Sonnet + Caching)

System-Prompt gecacht0,09 ct
Beleg-Bild + User-Msg0,80 ct
Output JSON (350 Tokens)0,50 ct
Total pro Beleg~1,0 ct

Bei 40.000 Belegen/Mo (Kunde 1)

AI-Tokens400 €
Cloudflare Infra80 €
Support100 €
Vollkosten~580 €

Marge-Szenarien

81 %
Heute · 2.990 € Professional Tier · Sonnet + Caching
90 %
Nach Vision-Classifier (Q3) · AI-Kosten 1,0 → 0,28 ct

Wichtig: Kostenbasis >70 % variabel. Volumen allein bringt nur 15-20 % Marge. Der echte Hebel ist Smart Routing.

11 / 18

Tech-Debt.

Fünf Punkte. Keiner davon ist Blocker für die nächsten 6 Monate.

#SchuldWarum heute okWann gelöst
1 Vision-Routing = Dateigröße Marge heute 81 % Q3 2026 · Classifier
2 GastroAudit Standalone-Fork ADR-001 Velocity-Gewinn Q3 2026 · Konsolidierung
3 D1 statt Postgres RLS 1 Pilot · D1 hält bis ~500k Belege Juni 2026 · Hyperdrive
4 Keine Regression-Tests auf Beleg-Erkennung Manuelle UAT + Phase-Verifikation Vor Kanzlei #3 · Gold-Set 200
5 B2C-Scanner ohne Prompt-Caching B2C-Volumen noch klein Q2 2026 · 10-Min-Fix

Nicht als Tech-Debt eingestuft: Cloudflare-Lock-in (strategisch), Solo-Engineering (Organisation), kein eigenes LLM-Training (zu teuer, zu früh).

12 / 18

Die nächsten 9 Monate.

Q2 2026 (Apr–Jun)
  · Phase 086 Security-Hardening abgeschlossen → Scanner GoLive
  · Postgres + Hyperdrive Migration (RLS für Multi-Tenant)
  · Regression-Test-Suite auf 200-Beleg-Gold-Set
  · Prompt-Caching auch in B2C-Scanner
  · Foundation-Slots #2–3

Q3 2026 (Jul–Sep)
  · Vision-Classifier produktiv → AI-Kosten real −65 %
  · Modul-Konsolidierung: GastroAudit auf Plattform-Core
  · Load-Test 500 k Belege / 24h
  · Foundation-Slots #4–5 + Listenpreis geht live
  · 9. StBÄndG-Marktstart

Q4 2026 (Okt–Dez)
  · Bescheid-Agent
  · Partnerkanal: Steuerberater-Verbände
  · ETL-Pilot mit Verbands-Partner
  · Self-Service-Checkout

Q2 2027
  · ERiC-API v3 · Direkt-Abgabe Finanzamt
13 / 18

Wie wir gegen DATEV, Finmatics & Co. bestehen.

Nicht durch Feature-Matching — durch strukturelle Asymmetrie.

KonkurrentStärkeStrukturelle SchwächeUnser Hebel
DATEV Genossenschaft, 400k+ Unternehmen Konsens-Entscheidungen, KI-Modul braucht 3+ Jahre 5 Vertikalen vor dem ersten DATEV-KI-Release
Finmatics Trainiertes Classifier-Modell, Kanzlei-Standard AT/DE Starre Logik — neue Belegarten brauchen Retraining LLM-basiert, neue Muster sofort adaptierbar
Lexoffice / Lexware Haufe-Konzern-Power, Finanzstärke B2B Self-Service-Fokus, keine Kanzlei-Integration Wir sind native für Kanzlei-Workflows
Taxfix B2C-Brand, 500k+ User, Standard-ESt Kein V&V-Spezialist, keine Belegautomatisierung Wir decken V&V-Tiefe, Airbnb, Bilanz — komplementär
WISO / Smart Steuer Etabliert, Low-Cost Manuelles Formular-Ausfüllen, keine Agenten-Logik Wir automatisieren, statt User-Input zu fordern

Kern-Asymmetrie: Keiner der Konkurrenten vereint Plattform + Vertikale-Velocity + EU-Stack + Ontologie-Tiefe. GSD-Framework ermöglicht 4-Tage-Vertikalen — das kann ein Konzern strukturell nicht replizieren.

14 / 18

Nicht Architektur-Beratung.

Die Decisions sind gefallen, die Roadmap ist konkret.

Was wir suchen

  1. Markt-Zugang über euer Netzwerk
  2. Dritte Meinung bei Postgres-Migration + Regression-Test-Strategie
  3. Referenz-Partner für ISO 27001 / BSI C5 wenn Enterprise
  4. HUB-Integration als Agent-Vertikale — MCP-Spike als Einstieg

Was wir explizit nicht suchen

  • Technology-Rewrite
  • Eigene LLM-Modelle bauen
  • Multi-Cloud-Migration
  • Outsourcing / Offshoring
15 / 18

Zusammenfassung.

Die Architektur ist produktiv tragfähig. Prompt-Caching, LLM-Router, DSGVO-Stack laufen, Delivery-Velocity ist durch GastroAudit nachgewiesen.
Die Tech-Debt ist bewusst und zeitlich eingepreist. Fünf offene Punkte, alle mit Lösungs-Timing, keine Blocker für die 12-Monats-Roadmap.
Euer Input fließt nicht in Architektur-Neubau, sondern in Product-UI-Reife und Go-to-Market. Engineering-Organisation steht.
16 / 18

FAQ · für das Gespräch vorbereitet.

1 · Wie multi-tenant-safe ist euer D1?

Foreign-Keys auf kanzlei_id + Middleware + R2-Namespacing. Kein RLS — kommt mit Postgres Juni 2026.

2 · Was wenn Anthropic Preise verdoppelt?

LLM-Router als Abstraktion. OpenAI/Google-Adapter skizziert. Switch realistisch 3–5 Tage.

3 · Warum zwei Repos GastroAudit/PromptSteuer?

ADR-001 Standalone-First. Velocity + Risk-Isolation. Konsolidierung Q3 bei PMF-Signal.

4 · Wie testet ihr Regressionen bei Beleg-Erkennung?

Ehrlich: Manuelle UAT + Phase-Verifikation. Gold-Set-Automatisierung ist Tech-Debt #4.

17 / 18

FAQ

5 · Foundation-Modell vs. Eigenes?

Heute Anthropic. OSS-Switch Q3-Spike geplant — nicht aus Prinzip, sondern weil Claude Vision aktuell besser auf dt. Amtsdokumenten ist. Wenn OSS gleichzieht, wechseln wir.

6 · Habt ihr einen Knowledge-Graph oder nur RAG?

Keine Graph-DB, aber drei Ontologie-Ebenen: SKR03-Prompt (2.180 Tokens), D1-Entity-Modell, 70+ Red-Flags bei GastroAudit mit BMF-Rechtsprechung.

7 · Wie orchestriert ihr eure Agents?

Heute prozedural in Cloudflare Workers. Kein Control Plane. Euer HUB wäre die logische Orchestrations-Ebene.

8 · Passt PromptSteuer in den HUB?

Technisch ja. Unsere Agents sind REST/MCP-ready. Spike-Vorschlag: 3 Wochen, 3 MCP-Tools, definierter Scope.

9 · Bus-Factor bei Solo-Engineering?

Bus-Factor 1 heute — bewusst, mitigiert durch drei Mechanismen: (1) vollständig dokumentierte GSD-Framework-Artefakte pro Phase — Onboarding-Zeit für Ersatz-Engineer: 2 Tage, nicht 2 Monate. (2) Key-Person-Versicherung 500k Deckung ab GoLive. (3) Engineering-Hire vorziehbar auf Q3 2026, wenn das für euch Voraussetzung ist.

Gibt es aus eurer Sicht einen Punkt, der euch persönlich davon abhalten würde? Den würden wir zuerst besprechen.

18 / 18
PromptSteuer
PROMPTSTEUER

Danke.

Roland Fiege
Founder · PromptSteuer

rf@rolandfiege.com  ·  0151 40 53 42 32
promptsteuer.ai  ·  Schöfferstraße 15 · 67547 Worms