types angepasst

This commit is contained in:
Lars 2025-12-12 13:19:28 +01:00
parent 0d28a6c1a7
commit 1e3fcc1633

View File

@ -1,198 +1,160 @@
version: 1.4 # Merge WP-15 (Smart Edges) & WP-07 (Schemas) version: 1.6 # Balance zwischen Speed, Kontext und Smartness
# ============================================================================== # ==============================================================================
# 1. CHUNKING PROFILES (WP-15 Smart Edge Allocation) # 1. CHUNKING PROFILES
# ============================================================================== # ==============================================================================
# Diese Profile steuern, wie Texte zerlegt und ob sie semantisch angereichert werden.
chunking_profiles: chunking_profiles:
# A. Standard / Schnell (für einfache Quellen, Logs) # A. SHORT & FAST (Für atomare Schnipsel)
# - Strategie: Sliding Window # Einsatz: Glossar, Tasks, Risiken
# - LLM-Filter: AUS (spart Kosten/Zeit) # Vorteil: Präzise Treffer für kurze Infos.
sliding_short: sliding_short:
strategy: sliding_window strategy: sliding_window
enable_smart_edge_allocation: false enable_smart_edge_allocation: false # AUS (Speed)
target: 200 target: 200
max: 350 max: 350
overlap: [30, 50] overlap: [30, 50]
# B. Smart Flow (für Konzepte, Journal, Projekte) # B. STANDARD & FAST (Der neue "Mittelweg")
# - Strategie: Sliding Window (für flüssigen Text) # Einsatz: Quellen, Journal, Daily Logs
# - LLM-Filter: AN (verteilt Kanten intelligent auf Absätze) # Vorteil: Viel Kontext für RAG, aber rasendschneller Import ohne LLM.
sliding_standard:
strategy: sliding_window
enable_smart_edge_allocation: false # AUS (Speed)
target: 450 # Größerer Kontext!
max: 650
overlap: [50, 100]
# C. SMART FLOW (Premium Chunking)
# Einsatz: Konzepte, Projekte, Erfahrungen
# Vorteil: LLM prüft Inhalt und verlinkt präzise. Kostet Zeit.
sliding_smart_edges: sliding_smart_edges:
strategy: sliding_window strategy: sliding_window
enable_smart_edge_allocation: true enable_smart_edge_allocation: true # AN (Intelligenz)
target: 400 target: 400
max: 600 max: 600
overlap: [50, 80] overlap: [50, 80]
# C. Smart Structure (für Profile, Werte, Entscheidungen) # D. SMART STRUCTURE
# - Strategie: By Heading (Harte Trennung an Überschriften) # Einsatz: Profile, Werte, Prinzipien
# - LLM-Filter: AN (verteilt Kanten auf Sektionen) # Vorteil: Respektiert die Markdown-Struktur (H2).
structured_smart_edges: structured_smart_edges:
strategy: by_heading strategy: by_heading
enable_smart_edge_allocation: true enable_smart_edge_allocation: true # AN (Intelligenz)
split_level: 2 # Trennt an H2 (##) split_level: 2
max: 600 max: 600
target: 400 target: 400
overlap: [50, 80] # Fallback overlap: [50, 80]
# ============================================================================== # ==============================================================================
# 2. DEFAULTS # 2. DEFAULTS
# ============================================================================== # ==============================================================================
defaults: defaults:
retriever_weight: 1.0 retriever_weight: 1.0
chunking_profile: sliding_smart_edges # Fallback: Immer smart versuchen chunking_profile: sliding_standard # Fallback auf Standard (sicher & performant)
edge_defaults: [] edge_defaults: []
# ============================================================================== # ==============================================================================
# 3. TYPE DEFINITIONS # 3. TYPE DEFINITIONS
# ============================================================================== # ==============================================================================
# Hier werden Chunking, Retrieval-Gewichtung und GENERIERUNGS-SCHEMATA definiert.
types: types:
# --- WISSENSBAUSTEINE --- # --- MASSENDATEN (Speed + Kontext) ---
concept:
chunking_profile: sliding_smart_edges
retriever_weight: 0.60
edge_defaults: ["references", "related_to"]
schema: # WP-07: Anleitung für LLM zur Erstellung
- "Definition & Kernidee"
- "Kontext & Hintergrund"
- "Anwendungsbeispiele"
- "Verwandte Konzepte"
source: source:
chunking_profile: sliding_short # Keine Smart Edges nötig (spart Ressourcen) chunking_profile: sliding_standard # JETZT: Mehr Kontext (450 Token), trotzdem schnell
retriever_weight: 0.50 retriever_weight: 0.50
edge_defaults: [] edge_defaults: []
schema: schema:
- "Metadaten (Autor, URL, Datum)" - "Metadaten (Autor, URL, Datum)"
- "Zusammenfassung (Key Takeaways)" - "Zusammenfassung"
- "Wichtige Zitate"
- "Originaltext / Ausschnitte" - "Originaltext / Ausschnitte"
glossary: journal:
chunking_profile: sliding_short chunking_profile: sliding_standard # JETZT: Mehr Kontext für Tagebucheinträge
retriever_weight: 0.40 retriever_weight: 0.80
edge_defaults: ["related_to"]
schema:
- "Begriffserklärung"
- "Synonyme & Abgrenzung"
# --- IDENTITÄT & PERSÖNLICHKEIT ---
profile:
chunking_profile: structured_smart_edges # Struktur ist hier wichtig
retriever_weight: 0.70
edge_defaults: ["references", "related_to"] edge_defaults: ["references", "related_to"]
schema: schema:
- "Rolle & Beziehung" - "Tages-Log"
- "Wichtige Fakten & Daten" - "Erkenntnisse"
- "Gemeinsame Historie / Erfahrungen" - "Entscheidungen"
- "Präferenzen & Werte"
value: # --- ATOMARE DATEN (Speed + Präzision) ---
chunking_profile: structured_smart_edges
retriever_weight: 1.00 # Höchste Priorität für die Decision Engine task:
chunking_profile: sliding_short # Kurz halten
retriever_weight: 0.80
edge_defaults: ["depends_on", "part_of"]
schema: ["Aufgabe", "Kontext", "DoD"]
glossary:
chunking_profile: sliding_short # Kurz halten
retriever_weight: 0.40
edge_defaults: ["related_to"] edge_defaults: ["related_to"]
schema: schema: ["Begriff", "Definition"]
- "Definition des Wertes"
- "Warum ist das wichtig? (Motivation)"
- "Leitsätze für Entscheidungen"
- "Anti-Beispiele (Was wir vermeiden)"
principle:
chunking_profile: structured_smart_edges
retriever_weight: 0.95
edge_defaults: ["derived_from", "references"]
schema:
- "Das Prinzip (Kernsatz)"
- "Herleitung / Begründung"
- "Anwendung in der Praxis"
belief:
chunking_profile: sliding_short
retriever_weight: 0.90
edge_defaults: ["related_to"]
schema:
- "Glaubenssatz"
- "Ursprung (Woher kommt das?)"
- "Ist das noch hilfreich? (Reflexion)"
experience:
chunking_profile: sliding_smart_edges
retriever_weight: 0.90
edge_defaults: ["derived_from", "references"]
schema:
- "Situation (Was ist passiert?)"
- "Aktion (Was habe ich getan?)"
- "Ergebnis (Was war die Folge?)"
- "Learning (Was nehme ich mit?)"
# --- STRATEGIE & ENTSCHEIDUNG ---
goal:
chunking_profile: sliding_smart_edges
retriever_weight: 0.95
edge_defaults: ["depends_on", "related_to"]
schema:
- "Zielsetzung (SMART)"
- "Motivation (Warum?)"
- "Erfolgskriterien (KPIs)"
- "Meilensteine"
decision:
chunking_profile: structured_smart_edges
retriever_weight: 1.00
edge_defaults: ["caused_by", "references"]
schema:
- "Kontext & Problemstellung"
- "Betrachtete Optionen (Pros/Cons)"
- "Die Entscheidung"
- "Begründung (Warum diese Wahl?)"
- "Erwartete Konsequenzen"
risk: risk:
chunking_profile: sliding_short chunking_profile: sliding_short
retriever_weight: 0.85 retriever_weight: 0.85
edge_defaults: ["related_to", "blocks"] edge_defaults: ["related_to", "blocks"]
schema: schema: ["Beschreibung", "Mitigation"]
- "Risiko-Beschreibung"
- "Eintrittswahrscheinlichkeit & Impact"
- "Mitigations-Strategie (Plan B)"
# --- OPERATIV --- belief:
chunking_profile: sliding_short
retriever_weight: 0.90
edge_defaults: ["related_to"]
schema: ["Glaubenssatz", "Reflexion"]
# --- KERN-WISSEN (Smart Edges / LLM Active) ---
concept:
chunking_profile: sliding_smart_edges
retriever_weight: 0.60
edge_defaults: ["references", "related_to"]
schema:
- "Definition"
- "Kontext"
- "Verwandte Konzepte"
project: project:
chunking_profile: sliding_smart_edges chunking_profile: sliding_smart_edges
retriever_weight: 0.97 retriever_weight: 0.97
edge_defaults: ["references", "depends_on"] edge_defaults: ["references", "depends_on"]
schema: schema:
- "Mission / Zielsetzung" - "Mission"
- "Aktueller Status" - "Status"
- "Nächste Schritte (Next Actions)" - "Next Actions"
- "Offene Fragen / Blocker"
- "Referenzen (Links)"
task: experience:
chunking_profile: sliding_short
retriever_weight: 0.80
edge_defaults: ["depends_on", "part_of"]
schema:
- "Aufgabe"
- "Kontext / Wichtigkeit"
- "Definition of Done"
journal:
chunking_profile: sliding_smart_edges chunking_profile: sliding_smart_edges
retriever_weight: 0.80 retriever_weight: 0.90
edge_defaults: ["derived_from", "references"]
schema: ["Situation", "Aktion", "Ergebnis", "Learning"]
# --- STRUKTUR-DATEN (Smart Structure / LLM Active) ---
profile:
chunking_profile: structured_smart_edges
retriever_weight: 0.70
edge_defaults: ["references", "related_to"] edge_defaults: ["references", "related_to"]
schema: schema: ["Rolle", "Fakten", "Historie"]
- "Tages-Log / Ereignisse"
- "Erkenntnisse & Gedanken" value:
- "Entscheidungen des Tages" chunking_profile: structured_smart_edges
- "Fokus für Morgen" retriever_weight: 1.00
edge_defaults: ["related_to"]
schema: ["Definition", "Motivation", "Leitsätze"]
principle:
chunking_profile: structured_smart_edges
retriever_weight: 0.95
edge_defaults: ["derived_from", "references"]
schema: ["Prinzip", "Anwendung"]
decision:
chunking_profile: structured_smart_edges
retriever_weight: 1.00
edge_defaults: ["caused_by", "references"]
schema: ["Problem", "Optionen", "Entscheidung", "Warum"]