diff --git a/app/config.py b/app/config.py
index aa0d9dd..f344387 100644
--- a/app/config.py
+++ b/app/config.py
@@ -34,6 +34,8 @@ class Settings:
     # --- WP-20 Hybrid LLM Provider ---
     # Erlaubt: "ollama" | "gemini" | "openrouter"
     MINDNET_LLM_PROVIDER: str = os.getenv("MINDNET_LLM_PROVIDER", "openrouter").lower()
+    # Standardwert 10000, falls nichts in der .env steht
+    MAX_OLLAMA_CHARS: int = int(os.getenv("MAX_OLLAMA_CHARS", 10000))
     
     # Google AI Studio (2025er Lite-Modell für höhere Kapazität)
     GOOGLE_API_KEY: str | None = os.getenv("GOOGLE_API_KEY")
diff --git a/app/routers/chat.py b/app/routers/chat.py
index 984e810..f632769 100644
--- a/app/routers/chat.py
+++ b/app/routers/chat.py
@@ -310,10 +310,13 @@ async def chat_endpoint(
             
             # --- STABILITY FIX: OLLAMA CONTEXT THROTTLE ---
             # Begrenzt den Text, um den "decode: cannot decode batches" Fehler zu vermeiden.
-            MAX_OLLAMA_CHARS = 10000 
-            if preferred_provider == "ollama" and len(context_str) > MAX_OLLAMA_CHARS:
-                logger.warning(f"⚠️ [{query_id}] Context zu groß für Ollama ({len(context_str)} chars). Kürze auf {MAX_OLLAMA_CHARS}.")
-                context_str = context_str[:MAX_OLLAMA_CHARS] + "\n[...gekürzt zur Stabilität...]"
+            # MAX_OLLAMA_CHARS = 10000 
+
+            settings = get_settings() # Falls noch nicht im Scope vorhanden
+            max_chars = getattr(settings, "MAX_OLLAMA_CHARS", 10000)
+            if preferred_provider == "ollama" and len(context_str) > max_chars:
+                logger.warning(f"⚠️ [{query_id}] Context zu groß für Ollama ({len(context_str)} chars). Kürze auf {max_chars}.")
+                context_str = context_str[:max_chars] + "\n[...gekürzt zur Stabilität...]"
 
             template = llm.get_prompt(prompt_key) or "{context_str}\n\n{query}"