version: 2.7.0 # WP-14 Update: Dynamisierung der Ingestion-Pipeline # ============================================================================== # 1. CHUNKING PROFILES # ============================================================================== chunking_profiles: # A. SHORT & FAST sliding_short: strategy: sliding_window enable_smart_edge_allocation: false target: 200 max: 350 overlap: [30, 50] # B. STANDARD & FAST sliding_standard: strategy: sliding_window enable_smart_edge_allocation: false target: 450 max: 650 overlap: [50, 100] # C. SMART FLOW (Text-Fluss) # Nutzt Sliding Window, aber mit LLM-Kanten-Analyse. sliding_smart_edges: strategy: sliding_window enable_smart_edge_allocation: true target: 400 max: 600 overlap: [50, 80] # D. SMART STRUCTURE (Soft Split) # Trennt bevorzugt an H2, fasst aber kleine Abschnitte zusammen ("Soft Mode"). structured_smart_edges: strategy: by_heading enable_smart_edge_allocation: true split_level: 2 strict_heading_split: false max: 600 target: 400 overlap: [50, 80] # E. SMART STRUCTURE STRICT (H2 Hard Split) # Trennt ZWINGEND an jeder H2. # Verhindert, dass "Vater" und "Partner" (Profile) oder Werte verschmelzen. structured_smart_edges_strict: strategy: by_heading enable_smart_edge_allocation: true split_level: 2 strict_heading_split: true # Hard Mode max: 600 target: 400 overlap: [50, 80] # F. SMART STRUCTURE DEEP (H3 Hard Split + Merge-Check) # Spezialfall für "Leitbild Prinzipien": # - Trennt H1, H2, H3 hart. # - Aber: Merged "leere" H2 (Tier 2) mit der folgenden H3 (MP1). structured_smart_edges_strict_L3: strategy: by_heading enable_smart_edge_allocation: true split_level: 3 strict_heading_split: true max: 600 target: 400 overlap: [50, 80] # ============================================================================== # 2. DEFAULTS # ============================================================================== defaults: retriever_weight: 1.0 chunking_profile: sliding_standard edge_defaults: [] # ============================================================================== # 3. INGESTION SETTINGS (WP-14 Dynamization) # ============================================================================== # Steuert, welche Notizen verarbeitet werden und wie Fallbacks aussehen. ingestion_settings: # Liste der Status-Werte, die beim Import ignoriert werden sollen. ignore_statuses: ["system", "template", "archive", "hidden"] # Standard-Typ, falls kein Typ im Frontmatter angegeben ist. default_note_type: "concept" # ============================================================================== # 4. SUMMARY & SCAN SETTINGS # ============================================================================== # Steuert die Tiefe des Pre-Scans für den Context-Cache. summary_settings: max_summary_length: 500 pre_scan_depth: 600 # ============================================================================== # 5. LLM SETTINGS # ============================================================================== # Steuerzeichen und Patterns zur Bereinigung der LLM-Antworten. llm_settings: cleanup_patterns: ["", "", "[OUT]", "[/OUT]", "```json", "```"] # ============================================================================== # 6. TYPE DEFINITIONS # ============================================================================== types: experience: chunking_profile: sliding_smart_edges retriever_weight: 1.10 # Erhöht für biografische Relevanz edge_defaults: ["derived_from", "references"] detection_keywords: ["erleben", "reagieren", "handeln", "prägen", "reflektieren"] schema: - "Situation (Was ist passiert?)" - "Meine Reaktion (Was habe ich getan?)" - "Ergebnis & Auswirkung" - "Reflexion & Learning (Was lerne ich daraus?)" insight: chunking_profile: sliding_smart_edges retriever_weight: 1.20 # Hoch gewichtet für aktuelle Steuerung edge_defaults: ["references", "based_on"] detection_keywords: ["beobachten", "erkennen", "verstehen", "analysieren", "schlussfolgern"] schema: - "Beobachtung (Was sehe ich?)" - "Interpretation (Was bedeutet das?)" - "Bedürfnis (Was steckt dahinter?)" - "Handlungsempfehlung" project: chunking_profile: sliding_smart_edges retriever_weight: 0.97 edge_defaults: ["references", "depends_on"] detection_keywords: ["umsetzen", "planen", "starten", "bauen", "abschließen"] schema: - "Mission & Zielsetzung" - "Aktueller Status & Blockaden" - "Nächste konkrete Schritte" decision: chunking_profile: structured_smart_edges_strict retriever_weight: 1.00 edge_defaults: ["caused_by", "references"] detection_keywords: ["entscheiden", "wählen", "abwägen", "priorisieren", "festlegen"] schema: - "Kontext & Problemstellung" - "Betrachtete Optionen" - "Die Entscheidung" - "Begründung" # --- PERSÖNLICHKEIT & IDENTITÄT --- value: chunking_profile: structured_smart_edges_strict retriever_weight: 1.00 edge_defaults: ["related_to"] detection_keywords: ["werten", "achten", "verpflichten", "bedeuten"] schema: - "Definition" - "Warum mir das wichtig ist" - "Leitsätze" principle: chunking_profile: structured_smart_edges_strict_L3 retriever_weight: 0.95 edge_defaults: ["derived_from", "references"] detection_keywords: ["leiten", "steuern", "ausrichten", "handhaben"] schema: - "Das Prinzip" - "Anwendung & Beispiele" trait: chunking_profile: structured_smart_edges_strict retriever_weight: 1.10 edge_defaults: ["related_to"] detection_keywords: ["begeistern", "können", "auszeichnen", "befähigen", "stärken"] schema: - "Eigenschaft / Talent" - "Beispiele aus der Praxis" - "Potenzial für die Zukunft" obstacle: chunking_profile: structured_smart_edges_strict retriever_weight: 1.00 edge_defaults: ["blocks", "related_to"] detection_keywords: ["blockieren", "fürchten", "vermeiden", "hindern", "zweifeln"] schema: - "Beschreibung der Hürde" - "Ursprung / Auslöser" - "Auswirkung auf Ziele" - "Gegenstrategie" belief: chunking_profile: sliding_short retriever_weight: 0.90 edge_defaults: ["related_to"] detection_keywords: ["glauben", "meinen", "annehmen", "überzeugen"] schema: - "Der Glaubenssatz" - "Ursprung & Reflexion" profile: chunking_profile: structured_smart_edges_strict retriever_weight: 0.70 edge_defaults: ["references", "related_to"] detection_keywords: ["verkörpern", "verantworten", "agieren", "repräsentieren"] schema: - "Rolle / Identität" - "Fakten & Daten" - "Historie" idea: chunking_profile: sliding_short retriever_weight: 0.70 edge_defaults: ["leads_to", "references"] detection_keywords: ["einfall", "gedanke", "potenzial", "möglichkeit"] schema: - "Der Kerngedanke" - "Potenzial & Auswirkung" - "Nächste Schritte" skill: chunking_profile: sliding_smart_edges retriever_weight: 0.90 edge_defaults: ["references", "related_to"] detection_keywords: ["lernen", "beherrschen", "üben", "fertigkeit", "kompetenz"] schema: - "Definition der Fähigkeit" - "Aktueller Stand & Lernpfad" - "Evidenz (Proof of Work)" habit: chunking_profile: sliding_short retriever_weight: 0.85 edge_defaults: ["related_to", "triggered_by"] detection_keywords: ["gewohnheit", "routine", "automatismus", "immer wenn"] schema: - "Auslöser (Trigger)" - "Routine (Handlung)" - "Belohnung (Reward)" - "Strategie" need: chunking_profile: sliding_smart_edges retriever_weight: 1.05 edge_defaults: ["related_to", "impacts"] detection_keywords: ["bedürfnis", "brauchen", "mangel", "erfüllung"] schema: - "Das Bedürfnis" - "Zustand (Mangel vs. Erfüllung)" - "Bezug zu Werten" motivation: chunking_profile: sliding_smart_edges retriever_weight: 0.95 edge_defaults: ["drives", "references"] detection_keywords: ["motivation", "antrieb", "warum", "energie"] schema: - "Der Antrieb" - "Zielbezug" - "Energiequelle" bias: chunking_profile: sliding_short retriever_weight: 0.80 edge_defaults: ["affects", "related_to"] detection_keywords: ["denkfehler", "verzerrung", "vorurteil", "falle"] schema: ["Beschreibung der Verzerrung", "Typische Situationen", "Gegenstrategie"] state: chunking_profile: sliding_short retriever_weight: 0.60 edge_defaults: ["impacts"] detection_keywords: ["stimmung", "energie", "gefühl", "verfassung"] schema: ["Aktueller Zustand", "Auslöser", "Auswirkung auf den Tag"] boundary: chunking_profile: sliding_smart_edges retriever_weight: 0.90 edge_defaults: ["protects", "related_to"] detection_keywords: ["grenze", "nein sagen", "limit", "schutz"] schema: ["Die Grenze", "Warum sie wichtig ist", "Konsequenz bei Verletzung"] # --- STRATEGIE & RISIKO --- goal: chunking_profile: sliding_smart_edges retriever_weight: 0.95 edge_defaults: ["depends_on", "related_to"] schema: ["Zielzustand", "Zeitrahmen & KPIs", "Motivation"] risk: chunking_profile: sliding_short retriever_weight: 0.85 edge_defaults: ["related_to", "blocks"] detection_keywords: ["risiko", "gefahr", "bedrohung"] schema: ["Beschreibung des Risikos", "Auswirkungen", "Gegenmaßnahmen"] # --- BASIS & WISSEN --- concept: chunking_profile: sliding_smart_edges retriever_weight: 0.60 edge_defaults: ["references", "related_to"] schema: ["Definition", "Kontext", "Verwandte Konzepte"] task: chunking_profile: sliding_short retriever_weight: 0.80 edge_defaults: ["depends_on", "part_of"] schema: ["Aufgabe", "Kontext", "Definition of Done"] journal: chunking_profile: sliding_standard retriever_weight: 0.80 edge_defaults: ["references", "related_to"] schema: ["Log-Eintrag", "Gedanken"] source: chunking_profile: sliding_standard retriever_weight: 0.50 edge_defaults: [] schema: ["Metadaten", "Zusammenfassung", "Zitate"] glossary: chunking_profile: sliding_short retriever_weight: 0.40 edge_defaults: ["related_to"] schema: ["Begriff", "Definition"] person: chunking_profile: sliding_standard retriever_weight: 0.50 edge_defaults: ["related_to"] schema: ["Rolle", "Beziehung", "Kontext"] event: chunking_profile: sliding_standard retriever_weight: 0.60 edge_defaults: ["related_to"] schema: ["Datum & Ort", "Teilnehmer", "Ergebnisse"] # --- FALLBACK --- default: chunking_profile: sliding_standard retriever_weight: 1.00 edge_defaults: ["references"] schema: ["Inhalt"]