version: 2.7.0 # WP-14 Update: Dynamisierung der Ingestion-Pipeline

# ==============================================================================
# 1. CHUNKING PROFILES
# ==============================================================================

chunking_profiles:
  
  # A. SHORT & FAST
  sliding_short:
    strategy: sliding_window
    enable_smart_edge_allocation: false
    target: 200
    max: 350
    overlap: [30, 50]

  # B. STANDARD & FAST
  sliding_standard:
    strategy: sliding_window
    enable_smart_edge_allocation: false
    target: 450
    max: 650
    overlap: [50, 100]

  # C. SMART FLOW (Text-Fluss)
  # Nutzt Sliding Window, aber mit LLM-Kanten-Analyse.
  sliding_smart_edges:
    strategy: sliding_window
    enable_smart_edge_allocation: true 
    target: 400
    max: 600
    overlap: [50, 80]

  # D. SMART STRUCTURE (Soft Split)
  # Trennt bevorzugt an H2, fasst aber kleine Abschnitte zusammen ("Soft Mode").
  structured_smart_edges:
    strategy: by_heading
    enable_smart_edge_allocation: true
    split_level: 2
    strict_heading_split: false 
    max: 600
    target: 400
    overlap: [50, 80]

  # E. SMART STRUCTURE STRICT (H2 Hard Split)
  # Trennt ZWINGEND an jeder H2. 
  # Verhindert, dass "Vater" und "Partner" (Profile) oder Werte verschmelzen.
  structured_smart_edges_strict:
    strategy: by_heading
    enable_smart_edge_allocation: true
    split_level: 2
    strict_heading_split: true # Hard Mode
    max: 600
    target: 400
    overlap: [50, 80]

  # F. SMART STRUCTURE DEEP (H3 Hard Split + Merge-Check)
  # Spezialfall für "Leitbild Prinzipien":
  # - Trennt H1, H2, H3 hart.
  # - Aber: Merged "leere" H2 (Tier 2) mit der folgenden H3 (MP1).
  structured_smart_edges_strict_L3:
    strategy: by_heading
    enable_smart_edge_allocation: true
    split_level: 3
    strict_heading_split: true
    max: 600
    target: 400
    overlap: [50, 80]

# ==============================================================================
# 2. DEFAULTS
# ==============================================================================
defaults:
  retriever_weight: 1.0
  chunking_profile: sliding_standard
  edge_defaults: [] 

# ==============================================================================
# 3. INGESTION SETTINGS (WP-14 Dynamization)
# ==============================================================================
# Steuert, welche Notizen verarbeitet werden und wie Fallbacks aussehen.
ingestion_settings:
  # Liste der Status-Werte, die beim Import ignoriert werden sollen.
  ignore_statuses: ["system", "template", "archive", "hidden"]
  # Standard-Typ, falls kein Typ im Frontmatter angegeben ist.
  default_note_type: "concept"

# ==============================================================================
# 4. SUMMARY & SCAN SETTINGS
# ==============================================================================
# Steuert die Tiefe des Pre-Scans für den Context-Cache.
summary_settings:
  max_summary_length: 500
  pre_scan_depth: 600

# ==============================================================================
# 5. LLM SETTINGS
# ==============================================================================
# Steuerzeichen und Patterns zur Bereinigung der LLM-Antworten.
llm_settings:
  cleanup_patterns: ["<s>", "</s>", "[OUT]", "[/OUT]", "```json", "```"]

# ==============================================================================
# 6. TYPE DEFINITIONS
# ==============================================================================

types:

  experience:
    chunking_profile: sliding_smart_edges
    retriever_weight: 1.10 # Erhöht für biografische Relevanz
    edge_defaults: ["derived_from", "references"]
    detection_keywords: ["erleben", "reagieren", "handeln", "prägen", "reflektieren"]
    schema:
      - "Situation (Was ist passiert?)"
      - "Meine Reaktion (Was habe ich getan?)"
      - "Ergebnis & Auswirkung"
      - "Reflexion & Learning (Was lerne ich daraus?)"

  insight:
    chunking_profile: sliding_smart_edges
    retriever_weight: 1.20 # Hoch gewichtet für aktuelle Steuerung
    edge_defaults: ["references", "based_on"]
    detection_keywords: ["beobachten", "erkennen", "verstehen", "analysieren", "schlussfolgern"]
    schema:
      - "Beobachtung (Was sehe ich?)"
      - "Interpretation (Was bedeutet das?)"
      - "Bedürfnis (Was steckt dahinter?)"
      - "Handlungsempfehlung"

  project:
    chunking_profile: sliding_smart_edges
    retriever_weight: 0.97
    edge_defaults: ["references", "depends_on"] 
    detection_keywords: ["umsetzen", "planen", "starten", "bauen", "abschließen"]
    schema:
      - "Mission & Zielsetzung"
      - "Aktueller Status & Blockaden"
      - "Nächste konkrete Schritte"

  decision:
    chunking_profile: structured_smart_edges_strict 
    retriever_weight: 1.00 
    edge_defaults: ["caused_by", "references"]
    detection_keywords: ["entscheiden", "wählen", "abwägen", "priorisieren", "festlegen"]
    schema:
      - "Kontext & Problemstellung"
      - "Betrachtete Optionen"
      - "Die Entscheidung"
      - "Begründung"

  # --- PERSÖNLICHKEIT & IDENTITÄT ---

  value:
    chunking_profile: structured_smart_edges_strict
    retriever_weight: 1.00
    edge_defaults: ["related_to"]
    detection_keywords: ["werten", "achten", "verpflichten", "bedeuten"]
    schema:
      - "Definition"
      - "Warum mir das wichtig ist"
      - "Leitsätze"

  principle:
    chunking_profile: structured_smart_edges_strict_L3
    retriever_weight: 0.95
    edge_defaults: ["derived_from", "references"]
    detection_keywords: ["leiten", "steuern", "ausrichten", "handhaben"]
    schema:
      - "Das Prinzip"
      - "Anwendung & Beispiele"

  trait:
    chunking_profile: structured_smart_edges_strict
    retriever_weight: 1.10
    edge_defaults: ["related_to"]
    detection_keywords: ["begeistern", "können", "auszeichnen", "befähigen", "stärken"]
    schema:
      - "Eigenschaft / Talent"
      - "Beispiele aus der Praxis"
      - "Potenzial für die Zukunft"

  obstacle:
    chunking_profile: structured_smart_edges_strict
    retriever_weight: 1.00
    edge_defaults: ["blocks", "related_to"]
    detection_keywords: ["blockieren", "fürchten", "vermeiden", "hindern", "zweifeln"]
    schema:
      - "Beschreibung der Hürde"
      - "Ursprung / Auslöser"
      - "Auswirkung auf Ziele"
      - "Gegenstrategie"

  belief:
    chunking_profile: sliding_short
    retriever_weight: 0.90
    edge_defaults: ["related_to"]
    detection_keywords: ["glauben", "meinen", "annehmen", "überzeugen"]
    schema:
      - "Der Glaubenssatz"
      - "Ursprung & Reflexion"

  profile:
    chunking_profile: structured_smart_edges_strict 
    retriever_weight: 0.70
    edge_defaults: ["references", "related_to"]
    detection_keywords: ["verkörpern", "verantworten", "agieren", "repräsentieren"]
    schema:
      - "Rolle / Identität"
      - "Fakten & Daten"
      - "Historie"


  idea:
    chunking_profile: sliding_short
    retriever_weight: 0.70
    edge_defaults: ["leads_to", "references"]
    detection_keywords: ["einfall", "gedanke", "potenzial", "möglichkeit"]
    schema:
      - "Der Kerngedanke"
      - "Potenzial & Auswirkung"
      - "Nächste Schritte"

  skill:
    chunking_profile: sliding_smart_edges
    retriever_weight: 0.90
    edge_defaults: ["references", "related_to"]
    detection_keywords: ["lernen", "beherrschen", "üben", "fertigkeit", "kompetenz"]
    schema:
      - "Definition der Fähigkeit"
      - "Aktueller Stand & Lernpfad"
      - "Evidenz (Proof of Work)"

  habit:
    chunking_profile: sliding_short
    retriever_weight: 0.85
    edge_defaults: ["related_to", "triggered_by"]
    detection_keywords: ["gewohnheit", "routine", "automatismus", "immer wenn"]
    schema:
      - "Auslöser (Trigger)"
      - "Routine (Handlung)"
      - "Belohnung (Reward)"
      - "Strategie"

  need:
    chunking_profile: sliding_smart_edges
    retriever_weight: 1.05
    edge_defaults: ["related_to", "impacts"]
    detection_keywords: ["bedürfnis", "brauchen", "mangel", "erfüllung"]
    schema:
      - "Das Bedürfnis"
      - "Zustand (Mangel vs. Erfüllung)"
      - "Bezug zu Werten"

  motivation:
    chunking_profile: sliding_smart_edges
    retriever_weight: 0.95
    edge_defaults: ["drives", "references"]
    detection_keywords: ["motivation", "antrieb", "warum", "energie"]
    schema:
      - "Der Antrieb"
      - "Zielbezug"
      - "Energiequelle"

  bias:
    chunking_profile: sliding_short
    retriever_weight: 0.80
    edge_defaults: ["affects", "related_to"]
    detection_keywords: ["denkfehler", "verzerrung", "vorurteil", "falle"]
    schema: ["Beschreibung der Verzerrung", "Typische Situationen", "Gegenstrategie"]

  state:
    chunking_profile: sliding_short
    retriever_weight: 0.60
    edge_defaults: ["impacts"]
    detection_keywords: ["stimmung", "energie", "gefühl", "verfassung"]
    schema: ["Aktueller Zustand", "Auslöser", "Auswirkung auf den Tag"]

  boundary:
    chunking_profile: sliding_smart_edges
    retriever_weight: 0.90
    edge_defaults: ["protects", "related_to"]
    detection_keywords: ["grenze", "nein sagen", "limit", "schutz"]
    schema: ["Die Grenze", "Warum sie wichtig ist", "Konsequenz bei Verletzung"]
  # --- STRATEGIE & RISIKO ---

  goal:
    chunking_profile: sliding_smart_edges
    retriever_weight: 0.95
    edge_defaults: ["depends_on", "related_to"]
    schema: ["Zielzustand", "Zeitrahmen & KPIs", "Motivation"]

  risk:
    chunking_profile: sliding_short
    retriever_weight: 0.85
    edge_defaults: ["related_to", "blocks"]
    detection_keywords: ["risiko", "gefahr", "bedrohung"]
    schema: ["Beschreibung des Risikos", "Auswirkungen", "Gegenmaßnahmen"]

  # --- BASIS & WISSEN ---

  concept:
    chunking_profile: sliding_smart_edges
    retriever_weight: 0.60
    edge_defaults: ["references", "related_to"]
    schema: ["Definition", "Kontext", "Verwandte Konzepte"]

  task:
    chunking_profile: sliding_short
    retriever_weight: 0.80
    edge_defaults: ["depends_on", "part_of"]
    schema: ["Aufgabe", "Kontext", "Definition of Done"]

  journal:
    chunking_profile: sliding_standard
    retriever_weight: 0.80
    edge_defaults: ["references", "related_to"]
    schema: ["Log-Eintrag", "Gedanken"]

  source:
    chunking_profile: sliding_standard
    retriever_weight: 0.50
    edge_defaults: [] 
    schema: ["Metadaten", "Zusammenfassung", "Zitate"]

  glossary:
    chunking_profile: sliding_short
    retriever_weight: 0.40
    edge_defaults: ["related_to"]
    schema: ["Begriff", "Definition"]
    
  person:
    chunking_profile: sliding_standard
    retriever_weight: 0.50
    edge_defaults: ["related_to"]
    schema: ["Rolle", "Beziehung", "Kontext"]

  event:
    chunking_profile: sliding_standard
    retriever_weight: 0.60
    edge_defaults: ["related_to"]
    schema: ["Datum & Ort", "Teilnehmer", "Ergebnisse"]

  # --- FALLBACK ---

  default:
    chunking_profile: sliding_standard
    retriever_weight: 1.00
    edge_defaults: ["references"]
    schema: ["Inhalt"]