WP25b #21

Lars · 2026-01-03T15:12:43+01:00

Lars commented

2026-01-03 15:12:43 +01:00

feat: Lazy-Prompt-Orchestration & Full Resilience (v3.1.1)

Hierarchisches Prompt-Resolution-System

Dreistufige Auflösungs-Logik: Level 1 (Modell-ID) → Level 2 (Provider) → Level 3 (Default)
Modell-spezifische Optimierungen für Gemini 2.0, Llama 3.3, Qwen 2.5
PROMPT-TRACE Logging für vollständige Transparenz
Implementierung in app/services/llm_service.py (v3.5.5)

Lazy-Prompt-Orchestration

Prompts werden erst zur Laufzeit geladen, basierend auf aktivem Modell
Parameter: prompt_key und variables statt vorformatierter Strings
Maximale Resilienz bei Modell-Fallbacks (Cloud → Local)
Vollständige Integration in Chat, Ingestion und DecisionEngine

Ultra-robustes Intent-Parsing

Regex-basierter Parser bereinigt Modell-Artefakte (z.B. CODING[/S] → CODING)
Implementierung in app/core/retrieval/decision_engine.py (v1.3.2)
Fehlerresistenz gegen Stop-Marker, Newlines oder Modell-Plaudereien

Differenzierte Ingestion-Validierung

Unterscheidung zwischen transienten (Netzwerk) und permanenten (Config) Fehlern
Transiente Fehler erlauben Kante (Datenverlust vermeiden)
Permanente Fehler lehnen Kante ab (Graph-Qualität schützen)
Implementierung in app/core/ingestion/ingestion_validation.py (v2.14.0)

Code-Komponenten

app/services/llm_service.py: v3.5.5 (Hierarchische Prompt-Resolution, Lazy-Loading)
app/core/retrieval/decision_engine.py: v1.3.2 (Ultra-robustes Intent-Parsing)
app/core/ingestion/ingestion_validation.py: v2.14.0 (Lazy-Prompt-Integration)
app/routers/chat.py: v3.0.3 (Lazy-Prompt-Loading für Chat-Synthese)

Konfiguration

config/prompts.yaml: v3.2.2 (Hierarchische Struktur mit Modell-spezifischen Overrides)
- 100% Erhalt der Original-Prompts aus v3.1.2 für Provider-Ebene
- Integration von Modell-spezifischen Overrides
- Hinzufügen von compression_template

Dokumentation

03_tech_chat_backend.md: Hierarchisches Prompt-Resolution-System
03_tech_configuration.md: prompts.yaml hierarchische Struktur
02_concept_ai_personality.md: Lazy-Prompt-Orchestration Konzept
03_tech_ingestion_pipeline.md: Differenzierte Validierung
00_glossary.md: Neue Begriffe (Lazy-Prompt, PROMPT-TRACE)
05_developer_guide.md: Lazy-Prompt-Orchestration für Entwickler
06_active_roadmap.md: WP25b als abgeschlossen markiert

Breaking Changes

Keine Breaking Changes für Endbenutzer
Vorformatierte Prompts werden weiterhin unterstützt (Abwärtskompatibilität)
Neue API-Parameter prompt_key und variables optional

Migration

Keine Migration erforderlich
System funktioniert ohne Änderungen
Optional: Modell-spezifische Prompts können in prompts.yaml definiert werden

Status: ✅ WP-25b ist zu 100% implementiert und audit-geprüft.
Nächster Schritt: WP-25c (Kontext-Budgeting & Erweiterte Prompt-Optimierung).

feat: Lazy-Prompt-Orchestration & Full Resilience (v3.1.1) ### Hierarchisches Prompt-Resolution-System - Dreistufige Auflösungs-Logik: Level 1 (Modell-ID) → Level 2 (Provider) → Level 3 (Default) - Modell-spezifische Optimierungen für Gemini 2.0, Llama 3.3, Qwen 2.5 - PROMPT-TRACE Logging für vollständige Transparenz - Implementierung in `app/services/llm_service.py` (v3.5.5) ### Lazy-Prompt-Orchestration - Prompts werden erst zur Laufzeit geladen, basierend auf aktivem Modell - Parameter: `prompt_key` und `variables` statt vorformatierter Strings - Maximale Resilienz bei Modell-Fallbacks (Cloud → Local) - Vollständige Integration in Chat, Ingestion und DecisionEngine ### Ultra-robustes Intent-Parsing - Regex-basierter Parser bereinigt Modell-Artefakte (z.B. `CODING[/S]` → `CODING`) - Implementierung in `app/core/retrieval/decision_engine.py` (v1.3.2) - Fehlerresistenz gegen Stop-Marker, Newlines oder Modell-Plaudereien ### Differenzierte Ingestion-Validierung - Unterscheidung zwischen transienten (Netzwerk) und permanenten (Config) Fehlern - Transiente Fehler erlauben Kante (Datenverlust vermeiden) - Permanente Fehler lehnen Kante ab (Graph-Qualität schützen) - Implementierung in `app/core/ingestion/ingestion_validation.py` (v2.14.0) ### Code-Komponenten - `app/services/llm_service.py`: v3.5.5 (Hierarchische Prompt-Resolution, Lazy-Loading) - `app/core/retrieval/decision_engine.py`: v1.3.2 (Ultra-robustes Intent-Parsing) - `app/core/ingestion/ingestion_validation.py`: v2.14.0 (Lazy-Prompt-Integration) - `app/routers/chat.py`: v3.0.3 (Lazy-Prompt-Loading für Chat-Synthese) ### Konfiguration - `config/prompts.yaml`: v3.2.2 (Hierarchische Struktur mit Modell-spezifischen Overrides) - 100% Erhalt der Original-Prompts aus v3.1.2 für Provider-Ebene - Integration von Modell-spezifischen Overrides - Hinzufügen von `compression_template` ### Dokumentation - `03_tech_chat_backend.md`: Hierarchisches Prompt-Resolution-System - `03_tech_configuration.md`: prompts.yaml hierarchische Struktur - `02_concept_ai_personality.md`: Lazy-Prompt-Orchestration Konzept - `03_tech_ingestion_pipeline.md`: Differenzierte Validierung - `00_glossary.md`: Neue Begriffe (Lazy-Prompt, PROMPT-TRACE) - `05_developer_guide.md`: Lazy-Prompt-Orchestration für Entwickler - `06_active_roadmap.md`: WP25b als abgeschlossen markiert ### Breaking Changes - Keine Breaking Changes für Endbenutzer - Vorformatierte Prompts werden weiterhin unterstützt (Abwärtskompatibilität) - Neue API-Parameter `prompt_key` und `variables` optional ### Migration - Keine Migration erforderlich - System funktioniert ohne Änderungen - Optional: Modell-spezifische Prompts können in `prompts.yaml` definiert werden --- **Status:** ✅ WP-25b ist zu 100% implementiert und audit-geprüft. **Nächster Schritt:** WP-25c (Kontext-Budgeting & Erweiterte Prompt-Optimierung).

Lars added 6 commits 2026-01-03 15:12:44 +01:00

Update components for WP-25b: Implement Lazy-Prompt-Orchestration across ingestion, decision engine, chat interface, and LLM service. Enhance prompt management with hierarchical model support and streamline response generation by removing manual formatting. Bump versions to reflect new features and optimizations. 7026fc4fed

Update Decision Engine for WP-25b: Enhance intent processing with robust intent cleaning and lazy loading. Improve strategy determination by validating against known strategies and streamline response generation. Bump version to 1.3.1 to reflect these optimizations. 38fac89f73

Update Decision Engine to version 1.3.2: Implement ultra-robust intent parsing using regex, restore prepend_instruction logic, and enhance logging for configuration loading. Improve fallback mechanisms for response generation to ensure reliability. 1563ebbdf9

Enhance prompt retrieval in LLMService: Implement detailed trace-logging for prompt lookup hierarchy, improving traceability of model-specific, provider, and global fallback matches. This update refines the logging mechanism to provide clearer insights during prompt resolution. a9d0874fe9

Refactor ingestion validation and decision engine error handling: Differentiate between transient and permanent validation errors in ingestion validation to improve data integrity. Enhance decision engine configuration loading with schema validation and error handling for missing keys and YAML syntax errors. Update fallback synthesis prompt handling in LLMService for improved error recovery. Add new fallback synthesis prompts to prompts.yaml for better context-based responses. 8505538b34

Update documentation and technical references for Mindnet v3.1.1: Revise versioning across all documents to reflect the latest updates, including the integration of Lazy-Prompt-Orchestration and enhancements in AI model capabilities. Update context descriptions to clarify new features and improvements in prompt management, ingestion validation, and decision engine processes. 62a00d1ac3

Lars merged commit 548c503e7c into main

2026-01-03 15:12:58 +01:00

Lars referenced this issue from a commit

2026-01-03 15:12:59 +01:00

Merge pull request 'WP25b' (#21) from WP25b into main