Architektur und Entscheidungen
Dokumentierte Trade-offs statt KI-Geschwurbel.
Jede groessere Entscheidung ist als Architecture Decision Record festgehalten. Hosting, Netz, Sandbox, Modelle, Backup — alles begruendet.
Modellstrategie
Primary, Fallback, Notfallpfad.
Im Normalbetrieb laufen Anfragen ueber OpenAI Codex (GPT-5.4). Das ist ein bewusster Trade-off fuer Qualitaet und Zuverlaessigkeit — transparenter Hinweis: Anfragen verlassen dabei das eigene Netz.
Fuer sensible Daten kann manuell auf das lokale Modell umgestellt werden. Bei OpenAI-Ausfall springt Nemotron-Cascade-2 automatisch ein.
ADR-Auswahl
Zentrale Architekturentscheidungen.
| ADR | Entscheidung | Begruendung |
|---|---|---|
| E-001 | IONOS als Hosting | DSGVO-konform, deutsches Rechenzentrum, konsistente Infrastruktur. |
| E-002 | WireGuard statt Tailscale | Keine externe Abhaengigkeit, volle Kontrolle, Hub-and-Spoke. |
| E-003 | Natives Node.js fuer Gateway | 5-6x schnellere Antwortzeiten, direkter WireGuard-Zugriff. |
| E-004 | Docker-Sandbox | Isolation gegen Prompt-Injection, kein Host-Zugriff moeglich. |
| E-005 | LiteLLM als Verteiler | Einheitliche API, API-Key bleibt auf GX10, Budget-Kontrolle. |
| E-007 | Secrets als Dateien | Nicht sichtbar in Prozesslisten oder Docker-Inspect. |
| E-008 | nftables Isolation | Kernel-Level-Firewall, Container erreichbar nur definierte Ziele. |
| E-013 | Cloud-Primary, lokal-Fallback | Qualitaet im Normalbetrieb, Resilienz bei Ausfall. |
| E-014 | Eigener VPS fuer WEB/Git | Trennung, Gitea nur intern ueber WireGuard. |
| E-016 | Team-weite Gitea-Nutzung | Standardisierte Projektstruktur, Git-Proxy multi-agent-faehig. |
| E-017 | Lossless Context Management | DAG-Summaries statt Sliding-Window-Verlust. |
| E-018 | restic-Backup auf WEB1 | Taeglich verschluesselt via SFTP/WireGuard, SQLite-safe. |
| E-019 | Syncthing statt Nextcloud | P2P, kein zentraler Server, Discovery deaktiviert. |
| E-020 | Nemotron-Cascade-2 | AWQ-INT4 (17 GB statt 62 GB), ~4x schneller, CUDA Graphs. |