KI-005 — Simulationsframework¶

Kurzfassung¶

Das Simulationsframework ist ein autonomes Multi-Agent-Testsystem, das Xolib mit synthetischen Personas belastet, bevor echte Kunden onboarden. Zielgroesse: 50.000+ Simulationsdurchlaeufe vor Go-Live mit einer Autonomierate ueber 80 %. Es dient gleichzeitig als technisches Herzstueck des FuE-Ankerprojekts fuer den IBB ProFIT-Antrag.

Funktionsweise¶

KI-gesteuerte Personas agieren in den Rollen Mieter, Eigentuemer, Handwerker und Behoerden gegen die Xolib-Plattform. Statt vordefinierter Personas kombiniert ein Zufallsgenerator elf Verhaltensparameter (Sprachkompetenz, Sprache, Tonalitaet, Emotionalitaet, Geduld, Kooperation, Hartnaeckigkeit, Eskalation, Dringlichkeit, Komplexitaet, Rechtskenntnisse) auf einer Skala von 0-10. Jeder Durchlauf ist dadurch einzigartig.

Autonomiestufen¶

Das System misst Erfolg anhand einer 5-stufigen Skala: Stufen 1-2 (vollautonome Loesung, kein Mensch noetig) gelten als Erfolg. Stufe 3 ist Ueberbrueckung ohne Verwalter-Aerger. Stufen 4-5 sind Eskalation und Fehlschlag. Eine 4-stufige Selbsthilfe-Schleife versucht jede Anfrage autonom zu loesen, bevor an einen Menschen eskaliert wird.

Simulationsdimensionen (v2)¶

Version 2 erweitert den Rahmen auf vier Dimensionen: Kommunikation, Operative Vorgaenge, Datenzustaende und Natuerlichsprachliche Datenpflege. Dazu kommen 14 modulspezifische Szenarienbloecke (Finanzen, WEG, Objekte, Mieter u.a.) mit definierten Triggern, Variablen und Erfolgskriterien.

Sicherheitstests¶

Ein eigener Testblock prueft vier Angriffsstufen: Spam und Nonsense, Social Engineering, Datenmissbrauch sowie Prompt Injection. Grundregel: Jede Instanz sieht ausschliesslich ihre eigenen Mandantendaten.

Technische Architektur¶

Simulator Runner: CLI-Tool (/scripts/simulate.ts)
Persona Engine: GPT-4o generiert die synthetischen Akteure
Scenario Generator: Prompt Chain waehlt Thema und Fallkonstellation
API Client: Authentifiziert sich wie ein echter Nutzer
Evaluator: GPT-4o als Judge bewertet die Agenten-Antworten
Result Store: Prisma SimulationRun-Modell, Dashboard in der Admin UI

IBB-Relevanz¶

Das Framework demonstriert autonomes KI-Training auf domaenenspezifischen Daten und messbaren wirtschaftlichen Nutzen (Autonomierate in Prozent, Delta in EUR). Es ist der staerkste Beleg fuer Innovationshoehe im ProFIT-Antrag.

Aktueller Stand¶

Konzept liegt in zwei Versionen vor (v1: 15 Seiten, v2: 43 Seiten). Die Implementierung hat noch nicht begonnen — das Framework ist fuer Phase 2 der Roadmap geplant.

Naechste Schritte¶

Prisma-Modell SimulationRun implementieren
CLI Runner und Persona Engine bauen
Erste 1.000 Simulationen durchfuehren und Autonomierate messen
Ergebnisse in IBB-Antrag als FuE-Nachweis integrieren

Quelldateien¶

docs/specs/xolib_simulation_konzept.pdf (v1, 15 Seiten)
docs/specs/xolib_simulation_v2.pdf (v2, 43 Seiten)

Abhaengigkeiten¶

Keine.

Referenziert in¶

Keine Referenzen gefunden.