KI-005 — Simulationsframework¶
Kurzfassung¶
Das Simulationsframework ist ein autonomes Multi-Agent-Testsystem, das Xolib mit synthetischen Personas belastet, bevor echte Kunden onboarden. Zielgroesse: 50.000+ Simulationsdurchlaeufe vor Go-Live mit einer Autonomierate ueber 80 %. Es dient gleichzeitig als technisches Herzstueck des FuE-Ankerprojekts fuer den IBB ProFIT-Antrag.
Funktionsweise¶
KI-gesteuerte Personas agieren in den Rollen Mieter, Eigentuemer, Handwerker und Behoerden gegen die Xolib-Plattform. Statt vordefinierter Personas kombiniert ein Zufallsgenerator elf Verhaltensparameter (Sprachkompetenz, Sprache, Tonalitaet, Emotionalitaet, Geduld, Kooperation, Hartnaeckigkeit, Eskalation, Dringlichkeit, Komplexitaet, Rechtskenntnisse) auf einer Skala von 0-10. Jeder Durchlauf ist dadurch einzigartig.
Autonomiestufen¶
Das System misst Erfolg anhand einer 5-stufigen Skala: Stufen 1-2 (vollautonome Loesung, kein Mensch noetig) gelten als Erfolg. Stufe 3 ist Ueberbrueckung ohne Verwalter-Aerger. Stufen 4-5 sind Eskalation und Fehlschlag. Eine 4-stufige Selbsthilfe-Schleife versucht jede Anfrage autonom zu loesen, bevor an einen Menschen eskaliert wird.
Simulationsdimensionen (v2)¶
Version 2 erweitert den Rahmen auf vier Dimensionen: Kommunikation, Operative Vorgaenge, Datenzustaende und Natuerlichsprachliche Datenpflege. Dazu kommen 14 modulspezifische Szenarienbloecke (Finanzen, WEG, Objekte, Mieter u.a.) mit definierten Triggern, Variablen und Erfolgskriterien.
Sicherheitstests¶
Ein eigener Testblock prueft vier Angriffsstufen: Spam und Nonsense, Social Engineering, Datenmissbrauch sowie Prompt Injection. Grundregel: Jede Instanz sieht ausschliesslich ihre eigenen Mandantendaten.
Technische Architektur¶
- Simulator Runner: CLI-Tool (
/scripts/simulate.ts) - Persona Engine: GPT-4o generiert die synthetischen Akteure
- Scenario Generator: Prompt Chain waehlt Thema und Fallkonstellation
- API Client: Authentifiziert sich wie ein echter Nutzer
- Evaluator: GPT-4o als Judge bewertet die Agenten-Antworten
- Result Store: Prisma SimulationRun-Modell, Dashboard in der Admin UI
IBB-Relevanz¶
Das Framework demonstriert autonomes KI-Training auf domaenenspezifischen Daten und messbaren wirtschaftlichen Nutzen (Autonomierate in Prozent, Delta in EUR). Es ist der staerkste Beleg fuer Innovationshoehe im ProFIT-Antrag.
Aktueller Stand¶
Konzept liegt in zwei Versionen vor (v1: 15 Seiten, v2: 43 Seiten). Die Implementierung hat noch nicht begonnen — das Framework ist fuer Phase 2 der Roadmap geplant.
Naechste Schritte¶
- Prisma-Modell SimulationRun implementieren
- CLI Runner und Persona Engine bauen
- Erste 1.000 Simulationen durchfuehren und Autonomierate messen
- Ergebnisse in IBB-Antrag als FuE-Nachweis integrieren
Quelldateien¶
docs/specs/xolib_simulation_konzept.pdf(v1, 15 Seiten)docs/specs/xolib_simulation_v2.pdf(v2, 43 Seiten)
Abhaengigkeiten¶
Keine.
Referenziert in¶
Keine Referenzen gefunden.