PROMPTSTEUER

Architecture Review

KI-gestützte Steuer-Plattform · Multi-Modul · EU-hosted

Präsentiert
Roland Fiege · Founder

01 / 18

Worum es in 45 Minuten geht

Nicht Produkt-Demo. Architektur-Check.

Ist die Architektur tragfähig für das Wachstumsziel?
Wo ist Tech-Debt — bewusst oder unbewusst?
Wofür wird das mögliche Invest technisch verwendet?
Welche Engineering-Organisation steht dahinter (Solo + KI vs. klassisches Team)?

Ziel heute: Ihr könnt nach dem Gespräch in drei Sätzen zusammenfassen, wie die PromptSteuer-Architektur aufgebaut ist.

02 / 18

System-Snapshot

Der Stack auf einer Folie.

Infrastruktur

Compute	Cloudflare Workers / Pages Functions
DB	Cloudflare D1 (SQLite)
Storage	Cloudflare R2 (S3-API)
LLM	Sonnet 4.6 (Vision · Domain) · Haiku 4.5 (Router · Light)
Vector-DB	Cloudflare Vectorize (Voyage 3.5, 1024-dim)
Auth	Eigener Stack · Invite-Code (SHA-256) + Session-DB
Hosting	EU-only · DSGVO-konform

Delivery

Engineering	Solo + KI-Agents
Framework	GSD Phase-Framework
Test-Coverage	>95 % bei neuen Phasen
Deploy	GitHub-Push → Cloudflare Pages (Audit-Trail über Git)

Drei Zahlen die zählen

4 Tage — GastroAudit vom Pre-Mortem zu Production
165/165 — Tests grün bei Phase 4
2.180 Tokens — gecachter SKR03-Prompt → 360 €/Mo Ersparnis je Kanzlei

03 / 18

Architektur-Prinzipien

Die fünf Kern-Entscheidungen.

Entscheidung	Begründung	Konsequenz
Serverless Edge statt K8s	Keine Ops-Team-Kosten, globale Latenz, pay-per-request	Cloudflare Lock-in akzeptiert
EU-only Hosting	GoBD/DSGVO-Compliance als Produktmerkmal	Kein US-Fallback
Eigener Auth-Stack	DSGVO-Konformität, keine PII bei Drittanbietern	DSGVO-Endpoints kontrolliert
LLM-Router als Abstraktion	Provider-Unabhängigkeit strategisch vorbereitet	Switch in Tagen, nicht Monaten
Standalone-First bei Modulen	Velocity + Risk-Isolation, ADR-geführt	Monorepo-Konsolidierung geplant

04 / 18

Domain-Routing als Architektur

Hub-and-Spoke. Sechs Spezial-Agenten.

Statt Mono-Prompt: Haiku-Router klassifiziert Intent, Sonnet-Agenten lösen die Domäne. Shared Services nur on-demand.

Agent-Roster

vv-agent	Vermietung & Verpachtung	live
est-agent	Einkommensteuer (AN)	in Build
ust-agent	Umsatzsteuer / VAT	Q2
eur-agent	Einnahmen-Überschuss	Q2
airbnb-agent	Kurzzeitvermietung	Q3
bilanz-agent	Bilanzierung / KMU	future

Drei UX-Modi

Einfach — Tap-Wizard, Routing implizit
Fortgeschritten — Forms + sichtbarer Agent
Experte — Freitext + manuelle Agent-Wahl

Token-Budget pro Request

steuer-router      ~200    (Haiku 4.5)
+ 1 Spezial-Agent  ~1.000  (Sonnet 4.6)
+ Always-On        ~350    (rechts-guard,
                            sprach-adapter)
+ Optional         0–800   (glossar, fristen,
                            beleg-helper, ...)
─────────────────────────
= 1.550 – 2.350 Tokens/Request

Trennung Router/Agent erlaubt: (1) Modell-Tiering pro Aufgabe, (2) Domain-spezifisches Eval pro Agent, (3) Provider-Switch in Tagen, nicht Monaten.

05 / 18

Der eigentliche Moat

Prompt-Caching + Anti-Halluzination.

Cost-Moat und Trust-Moat. Beides produktiv, nicht auf der Roadmap.

Pfeiler 1 · Prompt-Caching (produktiv)

// functions/api/kanzlei/scan.js, Zeile 343
system: [{
  type: 'text',
  text: SKR03_SYSTEM_PROMPT,          // 2.180 Tokens
  cache_control: { type: 'ephemeral', ttl: '1h' }
}]

Bei 40.000 Belegen/Mo: 360 €/Mo strukturelle Ersparnis. Ohne Caching: 360 $/Mo nur für gecachte Tokens. Mit: 36 $/Mo. Faktor 10.

Pfeiler 2 · Anti-Halluzinations-Framework (verpflichtend)

Drei-Stufen-Logik in jedem Agenten + Quellenbox mit §-Zitat in jeder Antwort. Hartcodierte Gesetzesreferenz-Bibliothek (~30 §§ EStG/UStG/StBerG) als verifizierte Fakten.

📚 QUELLEN & RECHTSGRUNDLAGEN:
• Pendlerpauschale: §9 Abs. 1 S. 3 Nr. 4 EStG (0,30 €/km)
• Erhöhte Pauschale ab km 21: §9 Abs. 1 S. 3 Nr. 4 S. 8 EStG
• Homeoffice-Pauschale: §4 Abs. 5 S. 1 Nr. 6c EStG (6 €/Tag, max. 1.260 €)

Stufe 1 weiß ich sicher → Aussage + Quelle. Stufe 2 unsicher → Einschränkung + STB-Empfehlung. Stufe 3 unbekannt → niemals raten. Defensible Trust statt Marketing-Claim.

06 / 18

Reifegrade · ehrlich

Modul-Landschaft.

Modul	Code	API	UI	Kunden
V+V (Vermieter)	✓	✓	✓	Pilot-Gruppe
Scanner (Kanzlei)	✓	✓	✓	Kunde 1 · zahlend
GastroAudit	✓	✓	✓	1 Pilot
ESt / USt / EÜR	✓	✓	partiell	—
Airbnb / Bilanz	✓	✓	—	—

Ehrlich: Kunde 1 Beratung zahlt bereits — erste Revenue live. GastroAudit-Pilot läuft kostenlos. Scanner geht nach Phase 086 Security-Hardening in den vollen Rollout. First-Revenue-Zustand.

07 / 18

Trust by architecture

DSGVO / GoBD als Architektur.

Anforderung	Unsere Lösung
Datenhaltung EU	Cloudflare EU Region lock
DSGVO Art. 28 AVV	Bilaterale AVV je Kanzlei-Kunde
Right-to-Delete	`POST /api/auth/gdpr/delete`
Right-to-Export	`GET /api/auth/gdpr/export`
LLM-Training-Opt-out	Anthropic No-Training-Klausel
GoBD Unveränderbarkeit	R2 + D1-Audit-Trail (Hash-Chain Q3)
Prompt-Cache TTL	1h transient, kein Persist

Nicht da: BSI C5, ISO 27001. Beides Roadmap H2 2026 — nicht vor 5+ Enterprise-Kunden (CAC-Economics).

08 / 18

Compliance by Design

Rechts-Architektur — StBerG-konform by Default.

Die Grenze zwischen „Hilfe zur Selbsthilfe" und „unbefugte Steuerberatung" ist schmal. Wir lösen das architektonisch, nicht per Disclaimer.

01 · MENSCH-IN-DER-LOOP

Jede KI-Entscheidung erfordert User- oder StB-Bestätigung. KI schlägt vor, Mensch entscheidet — das ist rechtssicher „Hilfe zur Selbsthilfe".

02 · KONFIDENZ-AMPEL

Grün (>90 %) · Gelb (70–90 %) · Rot (<70 %) = Pflichtkorrektur. KI verweigert Auto-Durchlauf bei unsicheren Fällen.

03 · B2B ÜBER KANZLEI

Scanner-Einsatz in Kanzlei läuft über zugelassene Steuerberater als rechtliche Instanz. StBerG § 3 greift gar nicht — die Kanzlei ist die beratende Entität.

04 · § 4e StBerG NEU (1.9.2026)

Marktöffnung schafft neue rechtliche Kategorie: beschränkte Hilfeleistung als Nebenleistung. Unsere Agents werden damit rechtlich ermöglicht, wo sie heute grenzwertig wären.

05 · AUDIT-TRAIL + GUTACHTEN

Jede KI-Entscheidung protokolliert in D1 (Wer · Wann · Konfidenz · Freigabe). Geplant: Gutachten Professor für Steuerrecht als Trust-Asset.

09 / 18

Warum 4-Tage-MVPs real sind

GSD + Claude Code.

GSD-Phase-Lifecycle:

  /gsd-plan-phase    → PLAN.md mit Requirements + Success Criteria
       ↓
  /gsd-execute-phase → Code + Tests, atomare Commits
       ↓
  /gsd-verify        → VERIFICATION.md, Goal-backward-Check
       ↓
  /gsd-code-review   → REVIEW.md + REVIEW-FIX.md
       ↓
  /gsd-secure-phase  → Threat-Model-Check

Delivery-Nachweise Q2 2026

Phase 085	Kanzlei Scanner MVP · 2 Wochen · VERIFICATION PASS
Phase 086	Security Hardening · läuft, 6 Sub-Plans
GastroAudit Phase 0	Pre-Mortem + 38 KNOWLEDGE-Files · 1 Tag
GastroAudit 1–4	Bootstrap → Deployment · 3 Tage · 165/165 Tests

10 / 18

Harte Zahlen

Kosten pro Beleg.

Status heute (Sonnet + Caching)

System-Prompt gecacht	0,09 ct
Beleg-Bild + User-Msg	0,80 ct
Output JSON (350 Tokens)	0,50 ct
Total pro Beleg	~1,0 ct

Bei 40.000 Belegen/Mo (Kunde 1)

AI-Tokens	400 €
Cloudflare Infra	80 €
Support	100 €
Vollkosten	~580 €

Marge-Szenarien

81 %

Heute · 2.990 € Professional Tier · Sonnet + Caching

90 %

Nach Vision-Classifier (Q3) · AI-Kosten 1,0 → 0,28 ct

Wichtig: Kostenbasis >70 % variabel. Volumen allein bringt nur 15-20 % Marge. Der echte Hebel ist Smart Routing.

11 / 18

Bewusst, dokumentiert, geplant

Tech-Debt.

Fünf Punkte. Keiner davon ist Blocker für die nächsten 6 Monate.

#	Schuld	Warum heute ok	Wann gelöst
1	Vision-Routing = Dateigröße	Marge heute 81 %	Q3 2026 · Classifier
2	GastroAudit Standalone-Fork	ADR-001 Velocity-Gewinn	Q3 2026 · Konsolidierung
3	D1 statt Postgres RLS	1 Pilot · D1 hält bis ~500k Belege	Juni 2026 · Hyperdrive
4	Keine Regression-Tests auf Beleg-Erkennung	Manuelle UAT + Phase-Verifikation	Vor Kanzlei #3 · Gold-Set 200
5	B2C-Scanner ohne Prompt-Caching	B2C-Volumen noch klein	Q2 2026 · 10-Min-Fix

Nicht als Tech-Debt eingestuft: Cloudflare-Lock-in (strategisch), Solo-Engineering (Organisation), kein eigenes LLM-Training (zu teuer, zu früh).

12 / 18

Architektur-Roadmap Q2–Q4

Die nächsten 9 Monate.

Q2 2026 (Apr–Jun)
  · Phase 086 Security-Hardening abgeschlossen → Scanner GoLive
  · Postgres + Hyperdrive Migration (RLS für Multi-Tenant)
  · Regression-Test-Suite auf 200-Beleg-Gold-Set
  · Prompt-Caching auch in B2C-Scanner
  · Foundation-Slots #2–3

Q3 2026 (Jul–Sep)
  · Vision-Classifier produktiv → AI-Kosten real −65 %
  · Modul-Konsolidierung: GastroAudit auf Plattform-Core
  · Load-Test 500 k Belege / 24h
  · Foundation-Slots #4–5 + Listenpreis geht live
  · 9. StBÄndG-Marktstart

Q4 2026 (Okt–Dez)
  · Bescheid-Agent
  · Partnerkanal: Steuerberater-Verbände
  · ETL-Pilot mit Verbands-Partner
  · Self-Service-Checkout

Q2 2027
  · ERiC-API v3 · Direkt-Abgabe Finanzamt

13 / 18

Warum Architektur uns schützt

Wie wir gegen DATEV, Finmatics & Co. bestehen.

Nicht durch Feature-Matching — durch strukturelle Asymmetrie.

Konkurrent	Stärke	Strukturelle Schwäche	Unser Hebel
DATEV	Genossenschaft, 400k+ Unternehmen	Konsens-Entscheidungen, KI-Modul braucht 3+ Jahre	5 Vertikalen vor dem ersten DATEV-KI-Release
Finmatics	Trainiertes Classifier-Modell, Kanzlei-Standard AT/DE	Starre Logik — neue Belegarten brauchen Retraining	LLM-basiert, neue Muster sofort adaptierbar
Lexoffice / Lexware	Haufe-Konzern-Power, Finanzstärke	B2B Self-Service-Fokus, keine Kanzlei-Integration	Wir sind native für Kanzlei-Workflows
Taxfix	B2C-Brand, 500k+ User, Standard-ESt	Kein V&V-Spezialist, keine Belegautomatisierung	Wir decken V&V-Tiefe, Airbnb, Bilanz — komplementär
WISO / Smart Steuer	Etabliert, Low-Cost	Manuelles Formular-Ausfüllen, keine Agenten-Logik	Wir automatisieren, statt User-Input zu fordern

Kern-Asymmetrie: Keiner der Konkurrenten vereint Plattform + Vertikale-Velocity + EU-Stack + Ontologie-Tiefe. GSD-Framework ermöglicht 4-Tage-Vertikalen — das kann ein Konzern strukturell nicht replizieren.

14 / 18

Was wir technisch von euch suchen

Nicht Architektur-Beratung.

Die Decisions sind gefallen, die Roadmap ist konkret.

Was wir suchen

Markt-Zugang über euer Netzwerk
Dritte Meinung bei Postgres-Migration + Regression-Test-Strategie
Referenz-Partner für ISO 27001 / BSI C5 wenn Enterprise
HUB-Integration als Agent-Vertikale — MCP-Spike als Einstieg

Was wir explizit nicht suchen

Technology-Rewrite
Eigene LLM-Modelle bauen
Multi-Cloud-Migration
Outsourcing / Offshoring

15 / 18

Drei Sätze für euer Debrief

Zusammenfassung.

Die Architektur ist produktiv tragfähig. Prompt-Caching, LLM-Router, DSGVO-Stack laufen, Delivery-Velocity ist durch GastroAudit nachgewiesen.

Die Tech-Debt ist bewusst und zeitlich eingepreist. Fünf offene Punkte, alle mit Lösungs-Timing, keine Blocker für die 12-Monats-Roadmap.

Euer Input fließt nicht in Architektur-Neubau, sondern in Product-UI-Reife und Go-to-Market. Engineering-Organisation steht.

16 / 18

Die erwartbaren Fragen

FAQ · für das Gespräch vorbereitet.

1 · Wie multi-tenant-safe ist euer D1?

Foreign-Keys auf kanzlei_id + Middleware + R2-Namespacing. Kein RLS — kommt mit Postgres Juni 2026.

2 · Was wenn Anthropic Preise verdoppelt?

LLM-Router als Abstraktion. OpenAI/Google-Adapter skizziert. Switch realistisch 3–5 Tage.

3 · Warum zwei Repos GastroAudit/PromptSteuer?

ADR-001 Standalone-First. Velocity + Risk-Isolation. Konsolidierung Q3 bei PMF-Signal.

4 · Wie testet ihr Regressionen bei Beleg-Erkennung?

Ehrlich: Manuelle UAT + Phase-Verifikation. Gold-Set-Automatisierung ist Tech-Debt #4.

17 / 18

FAQ (Fortsetzung)

FAQ

5 · Foundation-Modell vs. Eigenes?

Heute Anthropic. OSS-Switch Q3-Spike geplant — nicht aus Prinzip, sondern weil Claude Vision aktuell besser auf dt. Amtsdokumenten ist. Wenn OSS gleichzieht, wechseln wir.

6 · Habt ihr einen Knowledge-Graph oder nur RAG?

Keine Graph-DB, aber drei Ontologie-Ebenen: SKR03-Prompt (2.180 Tokens), D1-Entity-Modell, 70+ Red-Flags bei GastroAudit mit BMF-Rechtsprechung.

7 · Wie orchestriert ihr eure Agents?

Heute prozedural in Cloudflare Workers. Kein Control Plane. Euer HUB wäre die logische Orchestrations-Ebene.

8 · Passt PromptSteuer in den HUB?

Technisch ja. Unsere Agents sind REST/MCP-ready. Spike-Vorschlag: 3 Wochen, 3 MCP-Tools, definierter Scope.

9 · Bus-Factor bei Solo-Engineering?

Bus-Factor 1 heute — bewusst, mitigiert durch drei Mechanismen: (1) vollständig dokumentierte GSD-Framework-Artefakte pro Phase — Onboarding-Zeit für Ersatz-Engineer: 2 Tage, nicht 2 Monate. (2) Key-Person-Versicherung 500k Deckung ab GoLive. (3) Engineering-Hire vorziehbar auf Q3 2026, wenn das für euch Voraussetzung ist.

Gibt es aus eurer Sicht einen Punkt, der euch persönlich davon abhalten würde? Den würden wir zuerst besprechen.

18 / 18

PROMPTSTEUER

Danke.

        Roland Fiege

        Founder · PromptSteuer
        
        rf@rolandfiege.com  ·  0151 40 53 42 32

        promptsteuer.ai  ·  Schöfferstraße 15 · 67547 Worms