types angepasst

2025-12-12 13:19:28 +01:00 · 2025-12-12 13:19:28 +01:00 · 1e3fcc1633
commit 1e3fcc1633
parent 0d28a6c1a7
1 changed files with 97 additions and 135 deletions
--- a/config/types.yaml
+++ b/config/types.yaml
@ -1,198 +1,160 @@
-version: 1.4 # Merge WP-15 (Smart Edges) & WP-07 (Schemas)
+version: 1.6 # Balance zwischen Speed, Kontext und Smartness
 # ==============================================================================
-# 1. CHUNKING PROFILES (WP-15 Smart Edge Allocation)
+# 1. CHUNKING PROFILES
 # ==============================================================================
 # Diese Profile steuern, wie Texte zerlegt und ob sie semantisch angereichert werden.
 chunking_profiles:
-  # A. Standard / Schnell (für einfache Quellen, Logs)
+  # A. SHORT & FAST (Für atomare Schnipsel)
-  # - Strategie: Sliding Window
+  # Einsatz: Glossar, Tasks, Risiken
-  # - LLM-Filter: AUS (spart Kosten/Zeit)
+  # Vorteil: Präzise Treffer für kurze Infos.
  sliding_short:
    strategy: sliding_window
-    enable_smart_edge_allocation: false 
+    enable_smart_edge_allocation: false # AUS (Speed)
    target: 200
    max: 350
    overlap: [30, 50]
-  # B. Smart Flow (für Konzepte, Journal, Projekte)
+  # B. STANDARD & FAST (Der neue "Mittelweg")
-  # - Strategie: Sliding Window (für flüssigen Text)
+  # Einsatz: Quellen, Journal, Daily Logs
-  # - LLM-Filter: AN (verteilt Kanten intelligent auf Absätze)
+  # Vorteil: Viel Kontext für RAG, aber rasendschneller Import ohne LLM.
  sliding_standard:
    strategy: sliding_window
    enable_smart_edge_allocation: false # AUS (Speed)
    target: 450  # Größerer Kontext!
    max: 650
    overlap: [50, 100]
  # C. SMART FLOW (Premium Chunking)
  # Einsatz: Konzepte, Projekte, Erfahrungen
  # Vorteil: LLM prüft Inhalt und verlinkt präzise. Kostet Zeit.
  sliding_smart_edges:
    strategy: sliding_window
-    enable_smart_edge_allocation: true
+    enable_smart_edge_allocation: true # AN (Intelligenz)
    target: 400
    max: 600
    overlap: [50, 80]
-  # C. Smart Structure (für Profile, Werte, Entscheidungen)
+  # D. SMART STRUCTURE
-  # - Strategie: By Heading (Harte Trennung an Überschriften)
+  # Einsatz: Profile, Werte, Prinzipien
-  # - LLM-Filter: AN (verteilt Kanten auf Sektionen)
+  # Vorteil: Respektiert die Markdown-Struktur (H2).
  structured_smart_edges:
    strategy: by_heading
-    enable_smart_edge_allocation: true
+    enable_smart_edge_allocation: true # AN (Intelligenz)
-    split_level: 2 # Trennt an H2 (##)
+    split_level: 2
    max: 600
    target: 400
-    overlap: [50, 80] # Fallback
+    overlap: [50, 80]
 # ==============================================================================
 # 2. DEFAULTS
 # ==============================================================================
 defaults:
  retriever_weight: 1.0
-  chunking_profile: sliding_smart_edges # Fallback: Immer smart versuchen
+  chunking_profile: sliding_standard # Fallback auf Standard (sicher & performant)
  edge_defaults: [] 
 # ==============================================================================
 # 3. TYPE DEFINITIONS
 # ==============================================================================
 # Hier werden Chunking, Retrieval-Gewichtung und GENERIERUNGS-SCHEMATA definiert.
 types:
-  # --- WISSENSBAUSTEINE ---
+  # --- MASSENDATEN (Speed + Kontext) ---
  concept:
    chunking_profile: sliding_smart_edges
    retriever_weight: 0.60
    edge_defaults: ["references", "related_to"]
    schema: # WP-07: Anleitung für LLM zur Erstellung
      - "Definition & Kernidee"
      - "Kontext & Hintergrund"
      - "Anwendungsbeispiele"
      - "Verwandte Konzepte"
  source:
-    chunking_profile: sliding_short # Keine Smart Edges nötig (spart Ressourcen)
+    chunking_profile: sliding_standard # JETZT: Mehr Kontext (450 Token), trotzdem schnell
    retriever_weight: 0.50
    edge_defaults: [] 
    schema:
      - "Metadaten (Autor, URL, Datum)"
-      - "Zusammenfassung (Key Takeaways)"
+      - "Zusammenfassung"
      - "Wichtige Zitate"
      - "Originaltext / Ausschnitte"
-  glossary:
+  journal:
-    chunking_profile: sliding_short
+    chunking_profile: sliding_standard # JETZT: Mehr Kontext für Tagebucheinträge
-    retriever_weight: 0.40
+    retriever_weight: 0.80
    edge_defaults: ["related_to"]
    schema:
      - "Begriffserklärung"
      - "Synonyme & Abgrenzung"
  # --- IDENTITÄT & PERSÖNLICHKEIT ---
  profile:
    chunking_profile: structured_smart_edges # Struktur ist hier wichtig
    retriever_weight: 0.70
    edge_defaults: ["references", "related_to"]
    schema:
-      - "Rolle & Beziehung"
+      - "Tages-Log"
-      - "Wichtige Fakten & Daten"
+      - "Erkenntnisse"
-      - "Gemeinsame Historie / Erfahrungen"
+      - "Entscheidungen"
      - "Präferenzen & Werte"
-  value:
+  # --- ATOMARE DATEN (Speed + Präzision) ---
-    chunking_profile: structured_smart_edges
+
-    retriever_weight: 1.00 # Höchste Priorität für die Decision Engine
+  task:
    chunking_profile: sliding_short # Kurz halten
    retriever_weight: 0.80
    edge_defaults: ["depends_on", "part_of"]
    schema: ["Aufgabe", "Kontext", "DoD"]
  glossary:
    chunking_profile: sliding_short # Kurz halten
    retriever_weight: 0.40
    edge_defaults: ["related_to"]
-    schema:
+    schema: ["Begriff", "Definition"]
      - "Definition des Wertes"
      - "Warum ist das wichtig? (Motivation)"
      - "Leitsätze für Entscheidungen"
      - "Anti-Beispiele (Was wir vermeiden)"
  principle:
    chunking_profile: structured_smart_edges
    retriever_weight: 0.95
    edge_defaults: ["derived_from", "references"]
    schema:
      - "Das Prinzip (Kernsatz)"
      - "Herleitung / Begründung"
      - "Anwendung in der Praxis"
  belief:
    chunking_profile: sliding_short
    retriever_weight: 0.90
    edge_defaults: ["related_to"]
    schema:
      - "Glaubenssatz"
      - "Ursprung (Woher kommt das?)"
      - "Ist das noch hilfreich? (Reflexion)"
  experience:
    chunking_profile: sliding_smart_edges
    retriever_weight: 0.90
    edge_defaults: ["derived_from", "references"]
    schema:
      - "Situation (Was ist passiert?)"
      - "Aktion (Was habe ich getan?)"
      - "Ergebnis (Was war die Folge?)"
      - "Learning (Was nehme ich mit?)"
  # --- STRATEGIE & ENTSCHEIDUNG ---
  goal:
    chunking_profile: sliding_smart_edges
    retriever_weight: 0.95
    edge_defaults: ["depends_on", "related_to"]
    schema:
      - "Zielsetzung (SMART)"
      - "Motivation (Warum?)"
      - "Erfolgskriterien (KPIs)"
      - "Meilensteine"
  decision:
    chunking_profile: structured_smart_edges 
    retriever_weight: 1.00
    edge_defaults: ["caused_by", "references"]
    schema:
      - "Kontext & Problemstellung"
      - "Betrachtete Optionen (Pros/Cons)"
      - "Die Entscheidung"
      - "Begründung (Warum diese Wahl?)"
      - "Erwartete Konsequenzen"
  risk:
    chunking_profile: sliding_short
    retriever_weight: 0.85
    edge_defaults: ["related_to", "blocks"]
-    schema:
+    schema: ["Beschreibung", "Mitigation"]
      - "Risiko-Beschreibung"
      - "Eintrittswahrscheinlichkeit & Impact"
      - "Mitigations-Strategie (Plan B)"
-  # --- OPERATIV ---
+  belief:
    chunking_profile: sliding_short
    retriever_weight: 0.90
    edge_defaults: ["related_to"]
    schema: ["Glaubenssatz", "Reflexion"]
  # --- KERN-WISSEN (Smart Edges / LLM Active) ---
  concept:
    chunking_profile: sliding_smart_edges
    retriever_weight: 0.60
    edge_defaults: ["references", "related_to"]
    schema:
      - "Definition"
      - "Kontext"
      - "Verwandte Konzepte"
  project:
    chunking_profile: sliding_smart_edges
    retriever_weight: 0.97
    edge_defaults: ["references", "depends_on"] 
    schema:
-      - "Mission / Zielsetzung"
+      - "Mission"
-      - "Aktueller Status"
+      - "Status"
-      - "Nächste Schritte (Next Actions)"
+      - "Next Actions"
      - "Offene Fragen / Blocker"
      - "Referenzen (Links)"
-  task:
+  experience:
    chunking_profile: sliding_short
    retriever_weight: 0.80
    edge_defaults: ["depends_on", "part_of"]
    schema:
      - "Aufgabe"
      - "Kontext / Wichtigkeit"
      - "Definition of Done"
  journal:
    chunking_profile: sliding_smart_edges
-    retriever_weight: 0.80
+    retriever_weight: 0.90
    edge_defaults: ["derived_from", "references"]
    schema: ["Situation", "Aktion", "Ergebnis", "Learning"]
  # --- STRUKTUR-DATEN (Smart Structure / LLM Active) ---
  profile:
    chunking_profile: structured_smart_edges
    retriever_weight: 0.70
    edge_defaults: ["references", "related_to"]
-    schema:
+    schema: ["Rolle", "Fakten", "Historie"]
-      - "Tages-Log / Ereignisse"
+
-      - "Erkenntnisse & Gedanken"
+  value:
-      - "Entscheidungen des Tages"
+    chunking_profile: structured_smart_edges
-      - "Fokus für Morgen"
+    retriever_weight: 1.00
    edge_defaults: ["related_to"]
    schema: ["Definition", "Motivation", "Leitsätze"]
  principle:
    chunking_profile: structured_smart_edges
    retriever_weight: 0.95
    edge_defaults: ["derived_from", "references"]
    schema: ["Prinzip", "Anwendung"]
  decision:
    chunking_profile: structured_smart_edges 
    retriever_weight: 1.00
    edge_defaults: ["caused_by", "references"]
    schema: ["Problem", "Optionen", "Entscheidung", "Warum"]