Ziel heute: Ihr könnt nach dem Gespräch in drei Sätzen zusammenfassen, wie die PromptSteuer-Architektur aufgebaut ist.
| Compute | Cloudflare Workers / Pages Functions |
| DB | Cloudflare D1 (SQLite) |
| Storage | Cloudflare R2 (S3-API) |
| LLM | Sonnet 4.6 (Vision · Domain) · Haiku 4.5 (Router · Light) |
| Vector-DB | Cloudflare Vectorize (Voyage 3.5, 1024-dim) |
| Auth | Eigener Stack · Invite-Code (SHA-256) + Session-DB |
| Hosting | EU-only · DSGVO-konform |
| Engineering | Solo + KI-Agents |
| Framework | GSD Phase-Framework |
| Test-Coverage | >95 % bei neuen Phasen |
| Deploy | GitHub-Push → Cloudflare Pages (Audit-Trail über Git) |
| Entscheidung | Begründung | Konsequenz |
|---|---|---|
| Serverless Edge statt K8s | Keine Ops-Team-Kosten, globale Latenz, pay-per-request | Cloudflare Lock-in akzeptiert |
| EU-only Hosting | GoBD/DSGVO-Compliance als Produktmerkmal | Kein US-Fallback |
| Eigener Auth-Stack | DSGVO-Konformität, keine PII bei Drittanbietern | DSGVO-Endpoints kontrolliert |
| LLM-Router als Abstraktion | Provider-Unabhängigkeit strategisch vorbereitet | Switch in Tagen, nicht Monaten |
| Standalone-First bei Modulen | Velocity + Risk-Isolation, ADR-geführt | Monorepo-Konsolidierung geplant |
Statt Mono-Prompt: Haiku-Router klassifiziert Intent, Sonnet-Agenten lösen die Domäne. Shared Services nur on-demand.
| vv-agent | Vermietung & Verpachtung | live |
| est-agent | Einkommensteuer (AN) | in Build |
| ust-agent | Umsatzsteuer / VAT | Q2 |
| eur-agent | Einnahmen-Überschuss | Q2 |
| airbnb-agent | Kurzzeitvermietung | Q3 |
| bilanz-agent | Bilanzierung / KMU | future |
steuer-router ~200 (Haiku 4.5)
+ 1 Spezial-Agent ~1.000 (Sonnet 4.6)
+ Always-On ~350 (rechts-guard,
sprach-adapter)
+ Optional 0–800 (glossar, fristen,
beleg-helper, ...)
─────────────────────────
= 1.550 – 2.350 Tokens/Request
Trennung Router/Agent erlaubt: (1) Modell-Tiering pro Aufgabe, (2) Domain-spezifisches Eval pro Agent, (3) Provider-Switch in Tagen, nicht Monaten.
Cost-Moat und Trust-Moat. Beides produktiv, nicht auf der Roadmap.
// functions/api/kanzlei/scan.js, Zeile 343
system: [{
type: 'text',
text: SKR03_SYSTEM_PROMPT, // 2.180 Tokens
cache_control: { type: 'ephemeral', ttl: '1h' }
}]
Bei 40.000 Belegen/Mo: 360 €/Mo strukturelle Ersparnis. Ohne Caching: 360 $/Mo nur für gecachte Tokens. Mit: 36 $/Mo. Faktor 10.
Drei-Stufen-Logik in jedem Agenten + Quellenbox mit §-Zitat in jeder Antwort. Hartcodierte Gesetzesreferenz-Bibliothek (~30 §§ EStG/UStG/StBerG) als verifizierte Fakten.
📚 QUELLEN & RECHTSGRUNDLAGEN:
• Pendlerpauschale: §9 Abs. 1 S. 3 Nr. 4 EStG (0,30 €/km)
• Erhöhte Pauschale ab km 21: §9 Abs. 1 S. 3 Nr. 4 S. 8 EStG
• Homeoffice-Pauschale: §4 Abs. 5 S. 1 Nr. 6c EStG (6 €/Tag, max. 1.260 €)
Stufe 1 weiß ich sicher → Aussage + Quelle. Stufe 2 unsicher → Einschränkung + STB-Empfehlung. Stufe 3 unbekannt → niemals raten. Defensible Trust statt Marketing-Claim.
| Modul | Code | API | UI | Kunden |
|---|---|---|---|---|
| V+V (Vermieter) | ✓ | ✓ | ✓ | Pilot-Gruppe |
| Scanner (Kanzlei) | ✓ | ✓ | ✓ | Kunde 1 · zahlend |
| GastroAudit | ✓ | ✓ | ✓ | 1 Pilot |
| ESt / USt / EÜR | ✓ | ✓ | partiell | — |
| Airbnb / Bilanz | ✓ | ✓ | — | — |
Ehrlich: Kunde 1 Beratung zahlt bereits — erste Revenue live. GastroAudit-Pilot läuft kostenlos. Scanner geht nach Phase 086 Security-Hardening in den vollen Rollout. First-Revenue-Zustand.
| Anforderung | Unsere Lösung |
|---|---|
| Datenhaltung EU | Cloudflare EU Region lock |
| DSGVO Art. 28 AVV | Bilaterale AVV je Kanzlei-Kunde |
| Right-to-Delete | POST /api/auth/gdpr/delete |
| Right-to-Export | GET /api/auth/gdpr/export |
| LLM-Training-Opt-out | Anthropic No-Training-Klausel |
| GoBD Unveränderbarkeit | R2 + D1-Audit-Trail (Hash-Chain Q3) |
| Prompt-Cache TTL | 1h transient, kein Persist |
Nicht da: BSI C5, ISO 27001. Beides Roadmap H2 2026 — nicht vor 5+ Enterprise-Kunden (CAC-Economics).
Die Grenze zwischen „Hilfe zur Selbsthilfe" und „unbefugte Steuerberatung" ist schmal. Wir lösen das architektonisch, nicht per Disclaimer.
Jede KI-Entscheidung erfordert User- oder StB-Bestätigung. KI schlägt vor, Mensch entscheidet — das ist rechtssicher „Hilfe zur Selbsthilfe".
Grün (>90 %) · Gelb (70–90 %) · Rot (<70 %) = Pflichtkorrektur. KI verweigert Auto-Durchlauf bei unsicheren Fällen.
Scanner-Einsatz in Kanzlei läuft über zugelassene Steuerberater als rechtliche Instanz. StBerG § 3 greift gar nicht — die Kanzlei ist die beratende Entität.
Marktöffnung schafft neue rechtliche Kategorie: beschränkte Hilfeleistung als Nebenleistung. Unsere Agents werden damit rechtlich ermöglicht, wo sie heute grenzwertig wären.
Jede KI-Entscheidung protokolliert in D1 (Wer · Wann · Konfidenz · Freigabe). Geplant: Gutachten Professor für Steuerrecht als Trust-Asset.
GSD-Phase-Lifecycle:
/gsd-plan-phase → PLAN.md mit Requirements + Success Criteria
↓
/gsd-execute-phase → Code + Tests, atomare Commits
↓
/gsd-verify → VERIFICATION.md, Goal-backward-Check
↓
/gsd-code-review → REVIEW.md + REVIEW-FIX.md
↓
/gsd-secure-phase → Threat-Model-Check
| Phase 085 | Kanzlei Scanner MVP · 2 Wochen · VERIFICATION PASS |
| Phase 086 | Security Hardening · läuft, 6 Sub-Plans |
| GastroAudit Phase 0 | Pre-Mortem + 38 KNOWLEDGE-Files · 1 Tag |
| GastroAudit 1–4 | Bootstrap → Deployment · 3 Tage · 165/165 Tests |
| System-Prompt gecacht | 0,09 ct |
| Beleg-Bild + User-Msg | 0,80 ct |
| Output JSON (350 Tokens) | 0,50 ct |
| Total pro Beleg | ~1,0 ct |
| AI-Tokens | 400 € |
| Cloudflare Infra | 80 € |
| Support | 100 € |
| Vollkosten | ~580 € |
Wichtig: Kostenbasis >70 % variabel. Volumen allein bringt nur 15-20 % Marge. Der echte Hebel ist Smart Routing.
Fünf Punkte. Keiner davon ist Blocker für die nächsten 6 Monate.
| # | Schuld | Warum heute ok | Wann gelöst |
|---|---|---|---|
| 1 | Vision-Routing = Dateigröße | Marge heute 81 % | Q3 2026 · Classifier |
| 2 | GastroAudit Standalone-Fork | ADR-001 Velocity-Gewinn | Q3 2026 · Konsolidierung |
| 3 | D1 statt Postgres RLS | 1 Pilot · D1 hält bis ~500k Belege | Juni 2026 · Hyperdrive |
| 4 | Keine Regression-Tests auf Beleg-Erkennung | Manuelle UAT + Phase-Verifikation | Vor Kanzlei #3 · Gold-Set 200 |
| 5 | B2C-Scanner ohne Prompt-Caching | B2C-Volumen noch klein | Q2 2026 · 10-Min-Fix |
Nicht als Tech-Debt eingestuft: Cloudflare-Lock-in (strategisch), Solo-Engineering (Organisation), kein eigenes LLM-Training (zu teuer, zu früh).
Q2 2026 (Apr–Jun)
· Phase 086 Security-Hardening abgeschlossen → Scanner GoLive
· Postgres + Hyperdrive Migration (RLS für Multi-Tenant)
· Regression-Test-Suite auf 200-Beleg-Gold-Set
· Prompt-Caching auch in B2C-Scanner
· Foundation-Slots #2–3
Q3 2026 (Jul–Sep)
· Vision-Classifier produktiv → AI-Kosten real −65 %
· Modul-Konsolidierung: GastroAudit auf Plattform-Core
· Load-Test 500 k Belege / 24h
· Foundation-Slots #4–5 + Listenpreis geht live
· 9. StBÄndG-Marktstart
Q4 2026 (Okt–Dez)
· Bescheid-Agent
· Partnerkanal: Steuerberater-Verbände
· ETL-Pilot mit Verbands-Partner
· Self-Service-Checkout
Q2 2027
· ERiC-API v3 · Direkt-Abgabe Finanzamt
Nicht durch Feature-Matching — durch strukturelle Asymmetrie.
| Konkurrent | Stärke | Strukturelle Schwäche | Unser Hebel |
|---|---|---|---|
| DATEV | Genossenschaft, 400k+ Unternehmen | Konsens-Entscheidungen, KI-Modul braucht 3+ Jahre | 5 Vertikalen vor dem ersten DATEV-KI-Release |
| Finmatics | Trainiertes Classifier-Modell, Kanzlei-Standard AT/DE | Starre Logik — neue Belegarten brauchen Retraining | LLM-basiert, neue Muster sofort adaptierbar |
| Lexoffice / Lexware | Haufe-Konzern-Power, Finanzstärke | B2B Self-Service-Fokus, keine Kanzlei-Integration | Wir sind native für Kanzlei-Workflows |
| Taxfix | B2C-Brand, 500k+ User, Standard-ESt | Kein V&V-Spezialist, keine Belegautomatisierung | Wir decken V&V-Tiefe, Airbnb, Bilanz — komplementär |
| WISO / Smart Steuer | Etabliert, Low-Cost | Manuelles Formular-Ausfüllen, keine Agenten-Logik | Wir automatisieren, statt User-Input zu fordern |
Kern-Asymmetrie: Keiner der Konkurrenten vereint Plattform + Vertikale-Velocity + EU-Stack + Ontologie-Tiefe. GSD-Framework ermöglicht 4-Tage-Vertikalen — das kann ein Konzern strukturell nicht replizieren.
Die Decisions sind gefallen, die Roadmap ist konkret.
Die Architektur ist produktiv tragfähig. Prompt-Caching, LLM-Router, DSGVO-Stack laufen, Delivery-Velocity ist durch GastroAudit nachgewiesen.
Die Tech-Debt ist bewusst und zeitlich eingepreist. Fünf offene Punkte, alle mit Lösungs-Timing, keine Blocker für die 12-Monats-Roadmap.
Euer Input fließt nicht in Architektur-Neubau, sondern in Product-UI-Reife und Go-to-Market. Engineering-Organisation steht.
Foreign-Keys auf kanzlei_id + Middleware + R2-Namespacing. Kein RLS — kommt mit Postgres Juni 2026.
LLM-Router als Abstraktion. OpenAI/Google-Adapter skizziert. Switch realistisch 3–5 Tage.
ADR-001 Standalone-First. Velocity + Risk-Isolation. Konsolidierung Q3 bei PMF-Signal.
Ehrlich: Manuelle UAT + Phase-Verifikation. Gold-Set-Automatisierung ist Tech-Debt #4.
Heute Anthropic. OSS-Switch Q3-Spike geplant — nicht aus Prinzip, sondern weil Claude Vision aktuell besser auf dt. Amtsdokumenten ist. Wenn OSS gleichzieht, wechseln wir.
Keine Graph-DB, aber drei Ontologie-Ebenen: SKR03-Prompt (2.180 Tokens), D1-Entity-Modell, 70+ Red-Flags bei GastroAudit mit BMF-Rechtsprechung.
Heute prozedural in Cloudflare Workers. Kein Control Plane. Euer HUB wäre die logische Orchestrations-Ebene.
Technisch ja. Unsere Agents sind REST/MCP-ready. Spike-Vorschlag: 3 Wochen, 3 MCP-Tools, definierter Scope.
Bus-Factor 1 heute — bewusst, mitigiert durch drei Mechanismen: (1) vollständig dokumentierte GSD-Framework-Artefakte pro Phase — Onboarding-Zeit für Ersatz-Engineer: 2 Tage, nicht 2 Monate. (2) Key-Person-Versicherung 500k Deckung ab GoLive. (3) Engineering-Hire vorziehbar auf Q3 2026, wenn das für euch Voraussetzung ist.
Gibt es aus eurer Sicht einen Punkt, der euch persönlich davon abhalten würde? Den würden wir zuerst besprechen.