Zwischenstand 04 und 01

2026-05-29 09:39:40 +02:00
parent d4c2a0d269
commit 43a32779d8
6 changed files with 62 additions and 12 deletions
--- a/Kapitel/04_konzeption_methodisches_vorgehen.typ
+++ b/Kapitel/04_konzeption_methodisches_vorgehen.typ
@@ -17,6 +17,56 @@

 Dieses Kapitel beschreibt die Methodik, mit der die in Kapitel 1 beschriebenen Ziele und Forschungsleitfragen beantwortet werden sollen. Ausgangspunkt ist das methodische Design. Aus diesem Design leiten sich alle weiteren methodischen Entscheidungen ab. Vorausgegangene Proof-of-Concept-Läufe haben einzelne Aspekte des Vorgehens informell erprobt und das hier dargestellte Vorgehen geprägt, sie sind aber nicht Gegenstand der Auswertung. Die eigentliche Untersuchung wird in den folgenden Abschnitten geplant und in den folgenden Kapiteln durchgeführt und bewertet.

+#heading(level: 2)[Werkzeug-Grundlagen: Agentische CLIs, Agenten, MCP und lokale Inferenz]
+
+Bevor das eigentliche Untersuchungsdesign beschrieben wird, werden die zentralen Werkzeug-Begriffe geklärt, an denen die spätere Versuchsreihe variiert. Sie sind nicht nur Hilfsmittel der Durchführung, sondern definieren genau die Stellschrauben, die in den Versuchen V1 bis V3 systematisch hinzugenommen werden. Die folgende Darstellung beschränkt sich auf das für diese Arbeit relevante Maß und ersetzt keine vollständige Werkzeugdokumentation. Das Zusammenspiel der vier Bausteine ist in @abb_werkzeug_grundlagen skizziert.
+
+*Agentische CLIs.* Eine agentische CLI ist ein Kommandozeilen-Werkzeug, in dem ein LLM nicht nur Text generiert, sondern selbständig Dateien liest, Befehle ausführt und Tools aufruft. Im Gegensatz zum klassischen Chat-Prompting bleibt der Anwender nicht der einzige Akteur; die CLI orchestriert mehrere Modellaufrufe und Werkzeuginteraktionen in einer Schleife, bis ein vorgegebenes Ziel erreicht ist. Etablierte Vertreter sind Claude Code von Anthropic @claudecode_quickstart_2026, die Codex-CLI von OpenAI sowie die Qwen Code CLI von Alibaba. Für diese Arbeit ist die agentische CLI die operative Basis. Sie macht LLM-Läufe scriptbar, reproduzierbar und unabhängig von einer interaktiven Chat-Oberfläche.
+
+*Agenten und Agentendateien.* Agenten im hier verwendeten Sinne sind rollenspezialisierte Konfigurationen, die innerhalb einer agentischen CLI als Sub-Prozesse aufgerufen werden. Sie werden typischerweise als Markdown-Dateien mit YAML-Frontmatter abgelegt und enthalten drei Bestandteile: einen Auftrag (was tut der Agent), eine eigene Systemanweisung (wie tut er es) und ein begrenztes Toolset (womit darf er es tun). Die aufrufende CLI startet einen solchen Agenten mit eigenem Kontextfenster, sodass dessen Zwischenergebnisse den Hauptkontext nicht überfluten. In dieser Arbeit tragen Agenten Versuch V2, indem sie die Extraktion auf vier Rollen aufteilen: Stakeholder-Analyse, System-Requirements, Software-Requirements und einen ISO-29148-Orchestrator.
+
+*Model Context Protocol (MCP).* Das Model Context Protocol ist ein 2024 von Anthropic veröffentlichter offener Standard zur Anbindung externer Werkzeuge und Datenquellen an LLM-Clients @mcp_intro_2026 @claudecode_mcp_2026. Ein MCP-Server kapselt eine konkrete Fähigkeit, etwa Symbol-Navigation im Quellcode, lesenden Datenbankzugriff oder GUI-Beobachtung, hinter einer einheitlichen JSON-RPC-Schnittstelle. Ein MCP-Client wie Claude Code entdeckt die angebotenen Werkzeuge zur Laufzeit und ruft sie kontrolliert auf, anstatt dass das LLM Inhalte aus Code oder Datenbank frei rekonstruiert. Für diese Arbeit trägt MCP Versuch V3 und ist gleichzeitig die technische Grundlage der Belegpflicht: Eine extrahierte Anforderung lässt sich nur dann nachvollziehbar auf einen Codebeleg oder einen Datenbankbefund zurückführen, wenn der Zugriff darauf reproduzierbar erfolgt @mcp_servers_repo_2026.
+
+*Lokale Inferenz-Runtimes.* Eine lokale Inferenz-Runtime ist eine Software, die LLMs auf eigener Hardware ausführt und ihre Funktion über einen OpenAI-kompatiblen HTTP-Endpunkt bereitstellt. Stellvertretend wird in dieser Arbeit LM Studio eingesetzt, das Modelle wie Qwen 3.5 Coder in verschiedenen Quantisierungsstufen ausführen kann. Für den hier untersuchten Kontext sind zwei Eigenschaften entscheidend. Erstens entfällt der Cloud-Versand, was bei der kundenbezogenen c-entron-Codebasis aus Datenschutzgründen relevant ist. Zweitens werden Quantisierungsstufe und Sampling-Parameter wie Temperatur, top\_p oder repeat penalty zu reproduzierbarkeitsrelevanten Stellgrößen, die in Versuch V4 zusätzlich zur Modellwahl dokumentiert werden.
+
+#figure(
+  cetz.canvas({
+    import cetz.draw: *
+
+    let draw-box(x, y, w, h, label) = {
+      rect(
+        (x - w/2, y - h/2),
+        (x + w/2, y + h/2),
+        stroke: black + 0.6pt, fill: luma(240),
+      )
+      content((x, y), text(size: 9pt, weight: "bold")[#label])
+    }
+
+    let draw-arrow(from, to) = {
+      line(from, to, mark: (end: ">"), stroke: black + 0.6pt)
+    }
+
+    let h-half = 0.4
+    let gap = 0.15
+
+    draw-box(0,    5, 2.6, 0.8, "Benutzer")
+    draw-box(0,    3, 7.4, 0.8, "Agentische CLI (Claude Code / Codex / Qwen)")
+    draw-box(-4.6, 1, 3.6, 0.8, "LLM (Cloud / LM Studio)")
+    draw-box(0,    1, 2.8, 0.8, "Agentendateien")
+    draw-box(4.6,  1, 3.6, 0.8, "MCP-Server")
+    draw-box(4.6, -1, 3.6, 0.8, "Codebasis / Datenbank")
+
+    draw-arrow((0,    5 - h-half - gap), (0,    3 + h-half + gap))
+    draw-arrow((0,    3 - h-half - gap), (-4.6, 1 + h-half + gap))
+    draw-arrow((0,    3 - h-half - gap), (0,    1 + h-half + gap))
+    draw-arrow((0,    3 - h-half - gap), (4.6,  1 + h-half + gap))
+    draw-arrow((4.6,  1 - h-half - gap), (4.6, -1 + h-half + gap))
+  }),
+  caption: [Zusammenspiel der vier Werkzeug-Bausteine. Die agentische CLI orchestriert das LLM, ruft rollenspezialisierte Agentendateien als Sub-Prozesse auf und steuert MCP-Server, die kontrolliert auf Codebasis und Datenbank zugreifen.],
+) <abb_werkzeug_grundlagen>
+
+Damit sind die Bausteine benannt, an denen die spätere Versuchsreihe variiert. Versuch V1 nutzt ausschließlich die agentische CLI ohne weitere Bausteine, V2 ergänzt Agentendateien, V3 ergänzt MCP-Server, und V4 prüft die Übertragbarkeit auf alternative Modelle einschließlich lokaler Inferenz. Die Begriffe werden in den folgenden Abschnitten nicht erneut definiert.
+
 #heading(level: 2)[Methodisches Design im Überblick]

 Das Vorgehen ist entlang der vier Forschungsleitfragen aus Kapitel 1 strukturiert. Diese werden im Folgenden mit Frage 1 (Steuerung und Reproduzierbarkeit), Frage 2 (KI-Extraktion und Stakeholder-Input), Frage 3 (Qualitätsbewertung) und Frage 4 (Chancen, Grenzen und Risiken) bezeichnet. Aus jeder Leitfrage folgt unmittelbar eine Datenquelle und ein Auswertungsweg. Damit ist sichergestellt, dass die methodischen Bausteine nicht nachträglich auf die Fragen abgebildet werden, sondern aus ihnen hervorgehen.