WP20 #14

Closed
Lars wants to merge 0 commits from WP20 into main
Owner

WP-20: Implementierung Hybrid-Cloud Modus & Quoten-Resilienz (v2.8.0)

Dieses Release transformiert Mindnet in ein Cloud-resilientes Hybrid-System.
Kernkomponenten:

  1. LLMService (v3.3.6): Zentraler Provider-Dispatcher für OpenRouter, Gemini & Ollama.

    • Implementierung einer intelligenten Rate-Limit-Erkennung (HTTP 429).
    • Automatisierte Wartezyklen (MINDNET_LLM_RATE_LIMIT_WAIT) zur Cloud-Stabilisierung.
    • Kontrollierter Fallback auf lokales Ollama erst nach Erschöpfung der Retries.
  2. Parser-Härtung (Ingestion & SemanticAnalyzer):

    • Einführung eines "Mistral-safe" JSON-Extraktors zur Bereinigung von BOS-Tokens () und Framework-Tags ([OUT]).
    • Zweistufige JSON-Recovery zur Rettung von KI-Antworten bei instabilen Cloud-Modellen.
  3. Konfiguration:

    • Vollständige Steuerung der Resilienz-Parameter via .env.
    • Update auf Gemini 2.5 flash-lite und Mistral 7B (OpenRouter) für optimierten Durchsatz.
  4. System-Stabilität:

    • Behebung von 500er-Fehlern im Chat-Backend durch provider-spezifische Prompt-Auflösung.
    • Strikte Cloud-Timeouts (45s) zur Vermeidung von System-Blockaden.

Dokumentation wurde für alle betroffenen Module (Glossary, Concepts, Tech References, Roadmap) aktualisiert.

WP-20: Implementierung Hybrid-Cloud Modus & Quoten-Resilienz (v2.8.0) Dieses Release transformiert Mindnet in ein Cloud-resilientes Hybrid-System. Kernkomponenten: 1. LLMService (v3.3.6): Zentraler Provider-Dispatcher für OpenRouter, Gemini & Ollama. - Implementierung einer intelligenten Rate-Limit-Erkennung (HTTP 429). - Automatisierte Wartezyklen (MINDNET_LLM_RATE_LIMIT_WAIT) zur Cloud-Stabilisierung. - Kontrollierter Fallback auf lokales Ollama erst nach Erschöpfung der Retries. 2. Parser-Härtung (Ingestion & SemanticAnalyzer): - Einführung eines "Mistral-safe" JSON-Extraktors zur Bereinigung von BOS-Tokens (<s>) und Framework-Tags ([OUT]). - Zweistufige JSON-Recovery zur Rettung von KI-Antworten bei instabilen Cloud-Modellen. 3. Konfiguration: - Vollständige Steuerung der Resilienz-Parameter via .env. - Update auf Gemini 2.5 flash-lite und Mistral 7B (OpenRouter) für optimierten Durchsatz. 4. System-Stabilität: - Behebung von 500er-Fehlern im Chat-Backend durch provider-spezifische Prompt-Auflösung. - Strikte Cloud-Timeouts (45s) zur Vermeidung von System-Blockaden. Dokumentation wurde für alle betroffenen Module (Glossary, Concepts, Tech References, Roadmap) aktualisiert.
Lars added 28 commits 2025-12-25 19:40:15 +01:00
Lars closed this pull request 2025-12-25 19:54:24 +01:00

Pull request closed

Sign in to join this conversation.
No reviewers
No Label
No Milestone
No project
No Assignees
1 Participants
Notifications
Due Date
The due date is invalid or out of range. Please use the format 'yyyy-mm-dd'.

No due date set.

Dependencies

No dependencies set.

Reference: Lars/mindnet#14
No description provided.