Masterarbeit/Exposee/Exposee_Masterarbeit_final.typ

= #strong[Exposé zur Masterarbeit]

#strong[KI-gestütztes Reverse Requirements Engineering bei Legacy-Software: Eine Fallstudie bei der c-entron GmbH]
#emph[Extraktion funktionaler und nicht-funktionaler Anforderungen mithilfe von LLMs]

== #strong[1. Ausgangssituation und Unternehmenskontext]

Die c-entron GmbH ist ein mittelständisches Softwareunternehmen, das eine über viele Jahre gewachsene Windows-basierte ERP-Software für IT-Systemhäuser entwickelt und vertreibt. Die bestehende Lösung bietet zahlreiche komplexe Funktionen, basiert jedoch auf einer historisch gewachsenen Codebasis, deren funktionale und nicht-funktionale Anforderungen nie systematisch dokumentiert wurden.

Vor dem Hintergrund einer expansiven Vertriebspolitik ist eine Überarbeitung der Software notwendig, um Skalierbarkeit in Entwicklung, Betrieb und Roll-out zu gewährleisten. Hierzu ist der Übergang von einer nativen Windows-Applikation zu einer modernen, webbasierten Plattform geplant. Diese Migration erfordert eine weitgehend vollständige Neuentwicklung, die idealerweise auf einem strukturierten und nachvollziehbaren Anforderungskatalog basiert.

== #strong[2. Problemstellung]

Da für die bestehende Softwarelösung keine strukturierte und vollständige Dokumentation der Anforderungen existiert, fehlt eine belastbare Grundlage für die Neuentwicklung. Die fehlende Dokumentation erschwert die gezielte Migration erheblich, da sowohl funktionale Redundanzen als auch implizit verankerte Prozesse nur durch aufwendige manuelle Analysen identifiziert werden können.

Die Konsequenzen sind Re-Implementationsfehler, hohe technische Schuld, Ineffizienzen in der Entwicklung sowie ein erhöhtes Risiko, geschäftskritische Prozesse nicht passgenau zu übertragen. Die über Jahre gewachsene Codebasis verstärkt diese Komplexität, weil implizite Annahmen und domain-spezifisches Wissen häufig nur im Quellcode oder bei einzelnen Expert:innen verankert sind.

== #strong[3. Zielsetzung]

Ziel dieser Arbeit ist es, ein KI-gestütztes Verfahren zu entwickeln, zu evaluieren und pilotartig zu implementieren, das mit Hilfe eines LLM-Agenten aus bestehendem Softwarecode vollständige und strukturierte Requirements für die geplante Webanwendung extrahiert. Dies schließt funktionale sowie nicht-funktionale Anforderungen ein.

Darüber hinaus soll ein konzeptionelles Prozessmodell aufgezeigt werden, wie Unternehmen den Übergang von Altsoftware zu modernen Softwarearchitekturen systematisch gestalten können. Die Arbeit liefert Entscheidungsgrundlagen zur Einbettung KI-gestützter Analysen in bestehende Toolchains und adressiert Governance-, Datenschutz- und IP-rechtliche Fragestellungen.

== #strong[4. Forschungsleitfragen]

- Wie können Large Language Models systematisch für Reverse Requirements Engineering in Legacy-Software eingesetzt werden?
- Welche funktionalen und nicht-funktionalen Anforderungen lassen sich durch eine Kombination aus KI-gestützter Codeanalyse und Stakeholder-Interviews extrahieren?
- Wie bewerten Fachexpert:innen die Qualität und Vollständigkeit der durch KI gewonnenen Requirements?
- Welche Chancen und Grenzen ergeben sich beim KI-gestützten Requirements Engineering in Legacy-Umgebungen?

== #strong[5. Methodisches Vorgehen]

- #strong[Literatur- und Marktanalyse:] Systematische Auswertung wissenschaftlicher und praxisnaher Quellen zu LLMs, Reverse Requirements Engineering und Legacy-Modernisierung; Ableitung eines theoretischen Bezugsrahmens.
- #strong[Technologieauswahl und -evaluation:] Vergleich führender LLMs (z. B. GPT-4o, Claude 3.5, Code-Llama 70B) hinsichtlich Codeverständnis, Kontrollierbarkeit und Integration; Auswahl eines Hauptmodells und Ergänzungsmodelle für spezielle Aufgaben.
- #strong[Stakeholder-Interviews:] Qualitative Interviews mit Entwickler:innen, Product Ownern und Kundenseite zur Erhebung nicht-funktionaler Anforderungen, Risiken und regulatorischer Rahmenbedingungen.
- #strong[Prototypische Agentenentwicklung:] Aufbau eines LLM-basierten Reverse-Engineering-Agenten, der Code-Repositorys analysiert, Requirements strukturiert beschreibt und mit Traceability-Metadaten anreichert.
- #strong[Validierung und Qualitätsmessung:] Strukturierte Evaluation der extrahierten Anforderungen anhand definierter Kriterien (siehe Abschnitt 7) inklusive Vergleich mit manuell erhobenen Anforderungen sowie Expert:innen-Review bei der c-entron GmbH.
- #strong[Governance und Compliance-Analyse:] Bewertung von Datenschutz, IP-Schutz und Sicherheit beim Einsatz externer KI-Dienste; Ableitung von Handlungsempfehlungen für den produktiven Einsatz.
- #strong[Dokumentation und Transfer:] Erstellung eines Prozessmodells, Guidelines für den operativen Einsatz und Handlungsempfehlungen zur Integration in bestehende Tools (z. B. Jira, Confluence).

== #strong[6. Rahmenbedingungen und Annahmen]

- Zugriff auf repräsentative Codebasen und bestehende Artefakte der Legacy-Anwendung (z. B. Tickets, Nutzer:innen-Dokumentation).
- Möglichkeit zum kontrollierten Einsatz kommerzieller und Open-Source-LLMs innerhalb der Sicherheitsrichtlinien der c-entron GmbH.
- Bereitschaft der Stakeholder, an Interviews, Workshops und Validierungssessions teilzunehmen.
- Integrationserprobung erfolgt in einer isolierten Toolchain, bevor eine produktive Anbindung an Jira oder Confluence bewertet wird.
- Implizite Anforderungen, die nicht im Code abgebildet sind, werden über ergänzende Shadowing-Sessions und Prozessanalysen identifiziert.

== #strong[7. Evaluationskriterien und Messgrößen]

- #strong[Vollständigkeit:] Anteil der durch KI identifizierten Requirements im Vergleich zu einem goldenen Referenzset.
- #strong[Verständlichkeit:] Expertenrating zu Klarheit, Präzision und Umsetzbarkeit der dokumentierten Anforderungen.
- #strong[Redundanzfreiheit:] Analyse doppelter oder widersprüchlicher Requirements vor und nach KI-Einsatz.
- #strong[Stakeholder-Alignment:] Abgleich der KI-Ergebnisse mit Erwartungen und Prioritäten aus Interviews.
- #strong[Aufwandsreduktion:] Vergleich der benötigten Zeit für Requirementserhebung mit und ohne KI-Unterstützung.

== #strong[8. Geplanter Zeitplan]

- #strong[Monat 1–2:] Vertiefte Literatur- und Marktanalyse, Festlegung des theoretischen Rahmens, Definition des Evaluationsdesigns.
- #strong[Monat 2–3:] Technologieauswahl, technische Einrichtung der Agenten-Infrastruktur, Sicherheits- und Compliance-Check.
- #strong[Monat 3–4:] Durchführung der Stakeholder-Interviews, Aufbereitung und Synthese der Ergebnisse.
- #strong[Monat 4–5:] Entwicklung und iterative Verfeinerung des LLM-Agenten, erste Extraktionen und interne Tests.
- #strong[Monat 5–6:] Validierungsphase mit Expert:innen-Workshops, Messung der Evaluationskriterien, Ableitung von Handlungsempfehlungen.
- #strong[Monat 6:] Finalisierung der Dokumentation, Erstellung des Prozessmodells und Vorbereitung der schriftlichen Abschlussarbeit.

== #strong[9. Erwartete Beiträge]

- Ein reproduzierbares Prozessmodell für KI-gestütztes Reverse Requirements Engineering in Legacy-Kontexten.
- Ein prototypischer LLM-Agent inklusive Bewertungsmatrix für unterschiedliche Modelle und Konfigurationen.
- Handlungsempfehlungen zur Integration der gewonnenen Anforderungen in bestehende Toolchains und Governance-Strukturen der c-entron GmbH.
- Empirische Erkenntnisse zu Chancen, Grenzen und organisatorischen Voraussetzungen des KI-Einsatzes in der Anforderungserhebung.