# Branch Merge Commit: WP-25a **Branch:** `WP25a` **Target:** `main` **Version:** v3.1.0 **Date:** 2026-01-02 --- ## Commit Message ``` feat: Mixture of Experts (MoE) & Fallback-Kaskade (v3.0.0) ### Mixture of Experts (MoE) Architektur - Übergang von provider-basierter zu profilbasierter Experten-Steuerung - Zentrale Experten-Registry (`llm_profiles.yaml` v1.3.0) - Aufgabenspezifische Profile: synthesis_pro, tech_expert, compression_fast, ingest_validator, identity_safe, embedding_expert - Hardware-Optimierung: Lokaler Anker (Ollama/Phi-3) für maximale Privacy ### Rekursive Fallback-Kaskade - Implementierung in `app/services/llm_service.py` (v3.5.2) - Automatische Fallback-Logik bei Provider-Fehlern - Schutz gegen Zirkel-Referenzen via `visited_profiles`-Tracking - Background-Semaphore für parallele Tasks ### Pre-Synthesis Kompression (Module A) - Asynchrone Verdichtung überlanger Wissens-Streams - Konfigurierbare Schwellenwerte pro Stream (`compression_threshold`) - Profil-gesteuerte Kompression via `compression_profile` - Parallelisierung über `asyncio.gather()` ### Profilgesteuerte Ingestion - Semantische Kanten-Validierung via `ingest_validator` (Temperature 0.0) - Embedding-Konsolidierung über `embedding_expert` Profil - Entfernung der Embedding-Konfiguration aus `.env` ### Startup-Schutz & Audit-Fixes - Validierung von `llm_profiles.yaml` und `decision_engine.yaml` beim Booten - Behebung der Sicherheitslücke in `DecisionEngine` (Fallback-Aufrufe nutzen nun `profile_name`) - Circular Import Fix: Ingestion-Module nutzen neutrale `app.core.registry` ### Code-Komponenten - `app/services/llm_service.py`: v3.5.2 (Rekursive Fallback-Kaskade) - `app/core/retrieval/decision_engine.py`: v1.2.1 (Profile-Driven Orchestration) - `app/core/ingestion/ingestion_processor.py`: v2.14.0 (Profilgesteuerte Validierung) - `app/core/ingestion/ingestion_validation.py`: v2.13.0 (MoE-Profil Integration) - `app/services/embeddings_client.py`: v2.6.0 (Profil-basierte Modell-Auflösung) - `app/main.py`: v1.1.0 (Startup-Validierung) ### Konfiguration - `config/llm_profiles.yaml`: v1.3.0 (Zentrale Experten-Registry) - `config/decision_engine.yaml`: v3.2.2 (Decoupled MoE Logic, compression_thresholds) ### Dokumentation - `03_tech_configuration.md`: llm_profiles.yaml Dokumentation - `03_tech_chat_backend.md`: MoE Architektur und Fallback-Kaskade - `02_concept_ai_personality.md`: Mixture of Experts Konzept - `03_tech_ingestion_pipeline.md`: Profilgesteuerte Validierung - `00_glossary.md`: Neue Begriffe (MoE, Profile, Fallback-Kaskade) - `05_developer_guide.md`: Teach-the-AI mit Profilen - `04_admin_operations.md`: Konfigurations-Updates - `06_active_roadmap.md`: WP25a als abgeschlossen markiert ### Breaking Changes - Keine Breaking Changes für Endbenutzer - ENV-Variablen `MINDNET_LLM_PROVIDER`, `MINDNET_LLM_MODEL` etc. dienen nur noch als Fallback - Neue Konfigurationsdatei `llm_profiles.yaml` ist erforderlich (Startup-Validierung) ### Migration - Administratoren müssen `config/llm_profiles.yaml` erstellen - System startet nicht, wenn `llm_profiles.yaml` fehlt oder ungültig ist - ENV-Variablen bleiben als Fallback erhalten --- **Status:** ✅ WP-25a ist zu 100% implementiert und audit-geprüft. **Nächster Schritt:** WP-25b (Prompt-Orchestration & Model-Specific Tuning). ``` --- ## Zusammenfassung Dieser Merge führt die **Mixture of Experts (MoE) Architektur** in MindNet ein. Das System nutzt nun eine profilbasierte Experten-Steuerung statt einer globalen Provider-Konfiguration. Jede Systemaufgabe wird einem dedizierten Profil zugewiesen, das Modell, Provider und Parameter unabhängig definiert. **Kern-Features:** - Zentrale Experten-Registry (`llm_profiles.yaml`) - Rekursive Fallback-Kaskade mit Schutz gegen Zirkel-Referenzen - Pre-Synthesis Kompression für überlange Wissens-Streams - Profilgesteuerte Ingestion mit deterministischer Validierung - Startup-Schutz und Audit-Fixes **Technische Integrität:** - Alle LLM-Aufrufe nutzen nun die Profilsteuerung - Startup-Validierung verhindert fehlerhafte Konfigurationen - Circular Import Fix verbessert Wartbarkeit **Dokumentation:** - Vollständige Aktualisierung aller relevanten Dokumente - Neue Begriffe im Glossar - Konfigurations-Referenz erweitert - Developer Guide aktualisiert