← Zur Übersicht
PromptSteuer
PROMPTSTEUER

Architecture Review
für Neuland.ai

KI-gestützte Steuer-Plattform · Multi-Modul · EU-hosted
Präsentiert
Roland Fiege · Founder
Für
Yunus Uyargil · Dr. Anoj Gladius
Termin
29. April 2026 · Köln
01 / 14

Nicht Produkt-Demo. Architektur-Check.

  1. Ist die Architektur tragfähig für das Wachstumsziel?
  2. Wo ist Tech-Debt — bewusst oder unbewusst?
  3. Wofür wird das mögliche Invest technisch verwendet?
  4. Welche Engineering-Organisation steht dahinter (Solo + KI vs. klassisches Team)?

Ziel heute: Ihr könnt nach dem Gespräch mit Karl-Heinz in drei Sätzen zusammenfassen, ob die Architektur das Vertrauen rechtfertigt.

02 / 14

Der Stack auf einer Folie.

Infrastruktur

ComputeCloudflare Workers / Pages Functions
DBCloudflare D1 (SQLite)
StorageCloudflare R2 (S3-API)
LLMClaude Sonnet 4 + Haiku 4.5
AuthEigener Stack, JWT, PBKDF2
HostingEU-only

Delivery

EngineeringSolo + KI-Agents
FrameworkGSD Phase-Framework
Test-Coverage>95 % bei neuen Phasen
DeployWrangler CLI, atomare Commits

Drei Zahlen die zählen

  • 4 Tage — GastroAudit vom Pre-Mortem zu Production
  • 165/165 — Tests grün bei Phase 4
  • 2.180 Tokens — gecachter SKR03-Prompt → 360 €/Mo Ersparnis je Kanzlei
03 / 14

Die fünf Kern-Entscheidungen.

EntscheidungBegründungKonsequenz
Serverless Edge statt K8s Keine Ops-Team-Kosten, globale Latenz, pay-per-request Cloudflare Lock-in akzeptiert
EU-only Hosting GoBD/DSGVO-Compliance als Produktmerkmal Kein US-Fallback
Eigener Auth-Stack DSGVO-Konformität, keine PII bei Drittanbietern DSGVO-Endpoints kontrolliert
LLM-Router als Abstraktion Provider-Unabhängigkeit strategisch vorbereitet Switch in Tagen, nicht Monaten
Standalone-First bei Modulen Velocity + Risk-Isolation, ADR-geführt Monorepo-Konsolidierung geplant
04 / 14

Prompt-Caching + LLM-Router.

Wo die meisten KI-Startups scheitern — wir haben's produktiv.

Prompt-Caching (produktiv)

// functions/api/kanzlei/scan.js, Zeile 343
system: [{
  type: 'text',
  text: SKR03_SYSTEM_PROMPT,          // 2.180 Tokens
  cache_control: { type: 'ephemeral', ttl: '1h' }
}]

Bei 40.000 Belegen/Monat: 360 €/Mo strukturelle Ersparnis. Ohne Caching: 360 $/Mo nur für gecachte Tokens. Mit Caching: 36 $/Mo. Faktor 10.

LLM-Router (produktiv)

TASK_CONFIG = {
  'beleg-simple':   Haiku 4.5   (3× günstiger)
  'beleg-standard': Sonnet 4
  'beleg-complex':  Sonnet 4
  'chat':           Haiku 4.5
  'chat-complex':   Sonnet 4
  'enrich':         Haiku 4.5
}

Heutige Heuristik: Dateigrößen-basiert. Q3-Upgrade: Classifier-Pre-Call für Konfidenz-basiertes Routing. Ziel: AI-Kosten -65 %.

05 / 14

Modul-Landschaft.

ModulCodeAPIUIKunden
V+V (Vermieter)Pilot-Gruppe
Scanner (Kanzlei)Schmitt · zahlend
GastroAudit1 Pilot
ESt / USt / EÜRpartiell
Airbnb / Bilanz

Ehrlich: Schmitt Beratung zahlt bereits — erste Revenue live. GastroAudit-Pilot läuft kostenlos. Scanner geht nach Phase 086 Security-Hardening in den vollen Rollout. First-Revenue-Zustand.

06 / 14

DSGVO / GoBD als Architektur.

AnforderungUnsere Lösung
Datenhaltung EUCloudflare EU Region lock
DSGVO Art. 28 AVVBilaterale AVV je Kanzlei-Kunde
Right-to-DeletePOST /api/auth/gdpr/delete
Right-to-ExportGET /api/auth/gdpr/export
LLM-Training-Opt-outAnthropic No-Training-Klausel
GoBD UnveränderbarkeitR2 + D1-Audit-Trail (Hash-Chain Q3)
Prompt-Cache TTL1h transient, kein Persist

Nicht da: BSI C5, ISO 27001. Beides Roadmap H2 2026 — nicht vor 5+ Enterprise-Kunden (CAC-Economics).

07 / 14

GSD + Claude Code.

GSD-Phase-Lifecycle:

  /gsd-plan-phase    → PLAN.md mit Requirements + Success Criteria
       ↓
  /gsd-execute-phase → Code + Tests, atomare Commits
       ↓
  /gsd-verify        → VERIFICATION.md, Goal-backward-Check
       ↓
  /gsd-code-review   → REVIEW.md + REVIEW-FIX.md
       ↓
  /gsd-secure-phase  → Threat-Model-Check

Delivery-Nachweise Q2 2026

Phase 085Kanzlei Scanner MVP · 2 Wochen · VERIFICATION PASS
Phase 086Security Hardening · läuft, 6 Sub-Plans
GastroAudit Phase 0Pre-Mortem + 38 KNOWLEDGE-Files · 1 Tag
GastroAudit 1–4Bootstrap → Deployment · 3 Tage · 165/165 Tests
08 / 14

Kosten pro Beleg.

Status heute (Sonnet + Caching)

System-Prompt gecacht0,09 ct
Beleg-Bild + User-Msg0,80 ct
Output JSON (350 Tokens)0,50 ct
Total pro Beleg~1,0 ct

Bei 40.000 Belegen/Mo (Schmitt)

AI-Tokens400 €
Cloudflare Infra80 €
Support100 €
Vollkosten~580 €

Marge-Szenarien

81 %
Heute · 2.990 € Professional Tier · Sonnet + Caching
90 %
Nach Vision-Classifier (Q3) · AI-Kosten 1,0 → 0,28 ct

Wichtig: Kostenbasis >70 % variabel. Volumen allein bringt nur 15-20 % Marge. Der echte Hebel ist Smart Routing.

09 / 14

Tech-Debt.

Fünf Punkte. Keiner davon ist Blocker für die nächsten 6 Monate.

#SchuldWarum heute okWann gelöst
1 Vision-Routing = Dateigröße Marge heute 81 % Q3 2026 · Classifier
2 GastroAudit Standalone-Fork ADR-001 Velocity-Gewinn Q3 2026 · Konsolidierung
3 D1 statt Postgres RLS 1 Pilot · D1 hält bis ~500k Belege Juni 2026 · Hyperdrive
4 Keine Regression-Tests auf Beleg-Erkennung Manuelle UAT + Phase-Verifikation Vor Kanzlei #3 · Gold-Set 200
5 B2C-Scanner ohne Prompt-Caching B2C-Volumen noch klein Q2 2026 · 10-Min-Fix

Nicht als Tech-Debt eingestuft: Cloudflare-Lock-in (strategisch), Solo-Engineering (Organisation), kein eigenes LLM-Training (zu teuer, zu früh).

10 / 14

Die nächsten 9 Monate.

Q2 2026 (Apr–Jun)
  · Phase 086 Security-Hardening abgeschlossen → Scanner GoLive
  · Postgres + Hyperdrive Migration (RLS für Multi-Tenant)
  · Regression-Test-Suite auf 200-Beleg-Gold-Set
  · Prompt-Caching auch in B2C-Scanner
  · Foundation-Slots #2–3

Q3 2026 (Jul–Sep)
  · Vision-Classifier produktiv → AI-Kosten real −65 %
  · Modul-Konsolidierung: GastroAudit auf Plattform-Core
  · Load-Test 500 k Belege / 24h
  · Foundation-Slots #4–5 + Listenpreis geht live
  · 9. StBÄndG-Marktstart

Q4 2026 (Okt–Dez)
  · Bescheid-Agent
  · Partnerkanal: Steuerberater-Verbände
  · ETL-Pilot mit Verbands-Partner
  · Self-Service-Checkout

Q2 2027
  · ERiC-API v3 · Direkt-Abgabe Finanzamt
11 / 14

Nicht Architektur-Beratung.

Die Decisions sind gefallen, die Roadmap ist konkret.

Was wir suchen

  1. Markt-Zugang über euer Netzwerk (RÖDL, Kanzlei-Ecosystem)
  2. Dritte Meinung bei Postgres-Migration + Regression-Test-Strategie
  3. Referenz-Partner für ISO 27001 / BSI C5 wenn Enterprise
  4. HUB-Integration als Agent-Vertikale — MCP-Spike als Einstieg

Was wir explizit nicht suchen

  • Technology-Rewrite
  • Eigene LLM-Modelle bauen
  • Multi-Cloud-Migration
  • Outsourcing / Offshoring
12 / 14

Zusammenfassung.

Die Architektur ist produktiv tragfähig. Prompt-Caching, LLM-Router, DSGVO-Stack laufen, Delivery-Velocity ist durch GastroAudit nachgewiesen.
Die Tech-Debt ist bewusst und zeitlich eingepreist. Fünf offene Punkte, alle mit Lösungs-Timing, keine Blocker für die 12-Monats-Roadmap.
Kapital fließt nicht in Architektur-Neubau, sondern in Product-UI-Reife und Go-to-Market. Engineering-Organisation steht.
13 / 14

FAQ · für das Gespräch vorbereitet.

1 · Zeig mir die Anthropic-Rechnung der letzten 30 Tage

Live-Dashboard auf Anfrage. Aktuell 80–120 €/Mo Beta-Spend. Cost-per-Beleg reproduzierbar 1,0 ct.

2 · Wie multi-tenant-safe ist euer D1?

Foreign-Keys auf kanzlei_id + Middleware + R2-Namespacing. Kein RLS — kommt mit Postgres Juni 2026.

3 · Was wenn Anthropic Preise verdoppelt?

LLM-Router als Abstraktion. OpenAI/Google-Adapter skizziert. Switch realistisch 3–5 Tage.

4 · Warum zwei Repos GastroAudit/PromptSteuer?

ADR-001 Standalone-First. Velocity + Risk-Isolation. Konsolidierung Q3 bei PMF-Signal.

5 · Wie testet ihr Regressionen bei Beleg-Erkennung?

Ehrlich: Manuelle UAT + Phase-Verifikation. Gold-Set-Automatisierung ist Tech-Debt #4.

14 / 14

FAQ

6 · Foundation-Modell vs. Eigenes?

Heute Anthropic. OSS-Switch Q3-Spike geplant — nicht aus Prinzip, sondern weil Claude Vision aktuell besser auf dt. Amtsdokumenten ist. Wenn OSS gleichzieht, wechseln wir.

7 · Habt ihr einen Knowledge-Graph oder nur RAG?

Keine Graph-DB, aber drei Ontologie-Ebenen: SKR03-Prompt (2.180 Tokens), D1-Entity-Modell, 70+ Red-Flags bei GastroAudit mit BMF-Rechtsprechung.

8 · Wie orchestriert ihr eure Agents?

Heute prozedural in Cloudflare Workers. Kein Control Plane. Euer HUB wäre die logische Orchestrations-Ebene.

9 · Passt PromptSteuer in den HUB?

Technisch ja. Unsere Agents sind REST/MCP-ready. Spike-Vorschlag: 3 Wochen, 3 MCP-Tools, definierter Scope.

10 · Bus-Factor bei Solo-Engineering?

Alles im Git + GSD-Framework dokumentiert. Onboarding eines Engineers in 2 Tagen möglich. Deploy-Rechte nur bei Roland → Bus-Factor 1. Engineering-Hire Q4 2026.

Gibt es aus eurer Sicht einen Punkt, der euch persönlich davon abhalten würde? Den würden wir zuerst besprechen.

15 / 15
PromptSteuer
PROMPTSTEUER

Danke.

Roland Fiege
Founder · PromptSteuer

rf@rolandfiege.com
0151 40 53 42 32

promptsteuer.ai

Schöfferstraße 15 · 67547 Worms