Zum Inhalt

KI-005 — Simulationsframework

Kurzfassung

Das Simulationsframework ist ein autonomes Multi-Agent-Testsystem, das Xolib mit synthetischen Personas belastet, bevor echte Kunden onboarden. Zielgroesse: 50.000+ Simulationsdurchlaeufe vor Go-Live mit einer Autonomierate ueber 80 %. Es dient gleichzeitig als technisches Herzstueck des FuE-Ankerprojekts fuer den IBB ProFIT-Antrag.

Funktionsweise

KI-gesteuerte Personas agieren in den Rollen Mieter, Eigentuemer, Handwerker und Behoerden gegen die Xolib-Plattform. Statt vordefinierter Personas kombiniert ein Zufallsgenerator elf Verhaltensparameter (Sprachkompetenz, Sprache, Tonalitaet, Emotionalitaet, Geduld, Kooperation, Hartnaeckigkeit, Eskalation, Dringlichkeit, Komplexitaet, Rechtskenntnisse) auf einer Skala von 0-10. Jeder Durchlauf ist dadurch einzigartig.

Autonomiestufen

Das System misst Erfolg anhand einer 5-stufigen Skala: Stufen 1-2 (vollautonome Loesung, kein Mensch noetig) gelten als Erfolg. Stufe 3 ist Ueberbrueckung ohne Verwalter-Aerger. Stufen 4-5 sind Eskalation und Fehlschlag. Eine 4-stufige Selbsthilfe-Schleife versucht jede Anfrage autonom zu loesen, bevor an einen Menschen eskaliert wird.

Simulationsdimensionen (v2)

Version 2 erweitert den Rahmen auf vier Dimensionen: Kommunikation, Operative Vorgaenge, Datenzustaende und Natuerlichsprachliche Datenpflege. Dazu kommen 14 modulspezifische Szenarienbloecke (Finanzen, WEG, Objekte, Mieter u.a.) mit definierten Triggern, Variablen und Erfolgskriterien.

Sicherheitstests

Ein eigener Testblock prueft vier Angriffsstufen: Spam und Nonsense, Social Engineering, Datenmissbrauch sowie Prompt Injection. Grundregel: Jede Instanz sieht ausschliesslich ihre eigenen Mandantendaten.

Technische Architektur

  • Simulator Runner: CLI-Tool (/scripts/simulate.ts)
  • Persona Engine: GPT-4o generiert die synthetischen Akteure
  • Scenario Generator: Prompt Chain waehlt Thema und Fallkonstellation
  • API Client: Authentifiziert sich wie ein echter Nutzer
  • Evaluator: GPT-4o als Judge bewertet die Agenten-Antworten
  • Result Store: Prisma SimulationRun-Modell, Dashboard in der Admin UI

IBB-Relevanz

Das Framework demonstriert autonomes KI-Training auf domaenenspezifischen Daten und messbaren wirtschaftlichen Nutzen (Autonomierate in Prozent, Delta in EUR). Es ist der staerkste Beleg fuer Innovationshoehe im ProFIT-Antrag.

Aktueller Stand

Konzept liegt in zwei Versionen vor (v1: 15 Seiten, v2: 43 Seiten). Die Implementierung hat noch nicht begonnen — das Framework ist fuer Phase 2 der Roadmap geplant.

Naechste Schritte

  • Prisma-Modell SimulationRun implementieren
  • CLI Runner und Persona Engine bauen
  • Erste 1.000 Simulationen durchfuehren und Autonomierate messen
  • Ergebnisse in IBB-Antrag als FuE-Nachweis integrieren

Quelldateien

  • docs/specs/xolib_simulation_konzept.pdf (v1, 15 Seiten)
  • docs/specs/xolib_simulation_v2.pdf (v2, 43 Seiten)

Abhaengigkeiten

Keine.

Referenziert in

Keine Referenzen gefunden.