mindnet/docs/appendix.md
2025-12-13 06:37:24 +01:00

9.6 KiB
Raw Permalink Blame History

Mindnet v2.4 Appendices & Referenzen

Datei: docs/mindnet_appendices_v2.6.md Stand: 2025-12-12 Status: FINAL (Integrierter Stand WP01WP15) Quellen: TYPE_REGISTRY_MANUAL.md, chunking_strategy.md, mindnet_technical_architecture.md, Handbuch.md.

Dieses Dokument bündelt Tabellen, Schemata und technische Referenzen, die in den Prozess-Dokumenten (Playbook, Guides) den Lesefluss stören würden.


Anhang A: Typ-Registry Referenz (Default-Werte)

Diese Tabelle zeigt die Standard-Konfiguration der types.yaml (Stand v2.6 / Config v1.6).

Typ (type) Chunk Profile Retriever Weight Smart Edges? Beschreibung
concept sliding_smart_edges 0.60 Ja Abstrakte Begriffe, Theorien.
project sliding_smart_edges 0.97 Ja Aktive Vorhaben. Hohe Priorität.
decision structured_smart_edges 1.00 Ja Entscheidungen (ADRs). Höchste Prio.
experience sliding_smart_edges 0.90 Ja Persönliche Learnings. Intensiv analysiert.
journal sliding_standard 0.80 Nein Zeitgebundene Logs. Performance-optimiert.
person sliding_standard 0.50 Nein Personen-Profile.
source sliding_standard 0.50 Nein Externe Quellen (Bücher, PDFs).
event sliding_standard 0.60 Nein Meetings, Konferenzen.
value structured_smart_edges 1.00 Ja Persönliche Werte/Prinzipien.
principle structured_smart_edges 1.00 Ja Handlungsleitlinien.
profile structured_smart_edges 0.80 Ja Eigene Identitäts-Beschreibungen.
goal sliding_standard 0.95 Nein Strategische Ziele.
belief sliding_short 0.90 Nein Glaubenssätze.
risk sliding_short 0.90 Nein Risiken & Gefahren.
task sliding_short 0.70 Nein Aufgaben.
glossary sliding_short 0.50 Nein Begriffsdefinitionen.
default sliding_standard 1.00 Nein Fallback, wenn Typ unbekannt.

Anhang B: Edge-Typen & Semantik

Referenz aller implementierten Kantenarten (kind).

Kind Herkunft (Primär) Symmetrisch? Bedeutung & Nutzung
references Wikilink [[...]] Nein Standard-Verweis. "Erwähnt X".
belongs_to Struktur (Auto) Nein Verknüpft Chunk mit seiner Note.
next / prev Struktur (Auto) Ja (Logisch) Definiert Lesereihenfolge der Chunks.
depends_on Inline / Default Nein Harte Abhängigkeit. "Braucht X um zu funktionieren".
related_to Callout / Default Ja (Oft) Thematische Nähe. "Siehe auch X".
similar_to Inline Ja Inhaltliche Ähnlichkeit. "Ist wie X".
caused_by Inline Nein Kausalität. "X ist der Grund für Y".
solves Inline Nein Lösung. "Tool X löst Problem Y".
blocks Inline Nein NEU: Blockade. "Risiko X blockiert Projekt Y".
derived_from Matrix / Default Nein Herkunft. "Erkenntnis stammt aus Prinzip X".
based_on Matrix Nein Fundament. "Erfahrung basiert auf Wert Y".
uses Matrix Nein Nutzung. "Projekt nutzt Konzept Z".

Anhang C: Datenmodelle (JSON Payloads)

Diese sind die Felder, die effektiv in Qdrant gespeichert werden.

C.1 Note Payload (mindnet_notes)

{
  "note_id": "string (keyword)",       // UUIDv5 oder Slug
  "title": "string (text)",            // Titel aus Frontmatter
  "type": "string (keyword)",          // Typ (z.B. 'project')
  "retriever_weight": "float",         // Numerische Wichtigkeit (0.0-1.0)
  "chunk_profile": "string",           // Genutztes Profil (z.B. 'sliding_smart_edges')
  "edge_defaults": ["string"],         // Liste der aktiven Default-Kanten
  "tags": ["string"],                  // Liste von Tags
  "created": "string (iso-date)",      // Erstellungsdatum
  "updated": "integer",                // Timestamp
  "fulltext": "string (no-index)"      // Gesamter Text (für Recovery)
}

C.2 Chunk Payload (mindnet_chunks)

{
  "chunk_id": "string (keyword)",      // Format: {note_id}#c{index}
  "note_id": "string (keyword)",       // FK zur Note
  "type": "string (keyword)",          // Typ-Kopie aus Note
  "text": "string (text)",             // Reintext für Anzeige (ohne Overlap)
  "window": "string (text)",           // Text + Overlap (für Embedding)
  "ord": "integer",                    // Laufende Nummer (1..N)
  "retriever_weight": "float",         // Kopie aus Note (für Query-Speed)
  "chunk_profile": "string",           // Vererbt von Note
  "neighbors_prev": ["string"],        // ID des Vorgängers
  "neighbors_next": ["string"]         // ID des Nachfolgers
}

C.3 Edge Payload (mindnet_edges)

{
  "edge_id": "string (keyword)",       // Deterministischer Hash
  "source_id": "string (keyword)",     // Chunk-ID (Start)
  "target_id": "string (keyword)",     // Chunk-ID oder Note-Titel (Ziel)
  "kind": "string (keyword)",          // z.B. 'depends_on'
  "scope": "string (keyword)",         // Immer 'chunk'
  "rule_id": "string (keyword)",       // Traceability: 'inline:rel', 'explicit:wikilink'
  "confidence": "float",               // 0.0 - 1.0
  "note_id": "string (keyword)",       // Owner Note ID
  "provenance": "keyword"              // 'explicit', 'rule', 'smart' (NEU)
}

Anhang D: Environment Variablen

Diese Variablen steuern das Verhalten der Skripte und Container.

Variable Default Beschreibung
QDRANT_URL http://localhost:6333 URL zur Vektor-DB.
QDRANT_API_KEY (leer) API-Key für Absicherung (optional).
COLLECTION_PREFIX mindnet Namensraum für Collections ({prefix}_notes etc).
VECTOR_DIM 768 NEU: Dimension für Embeddings (für Nomic).
MINDNET_TYPES_FILE config/types.yaml Pfad zur Typ-Registry.
MINDNET_RETRIEVER_CONFIG config/retriever.yaml Pfad zur Scoring-Konfiguration.
MINDNET_PROMPTS_PATH config/prompts.yaml Pfad zu LLM-Prompts (Neu in v2.2).
MINDNET_DECISION_CONFIG config/decision_engine.yaml Router & Interview Config (Neu in v2.3).
MINDNET_LLM_MODEL phi3:mini Name des Chat-Modells.
MINDNET_EMBEDDING_MODEL nomic-embed-text NEU: Name des Vektor-Modells.
MINDNET_OLLAMA_URL http://127.0.0.1:11434 URL zum LLM-Server (Neu in v2.2).
MINDNET_LLM_TIMEOUT 300.0 Timeout für Ollama (Erhöht für CPU-Inference).
MINDNET_API_TIMEOUT 300.0 NEU: Frontend Timeout (Erhöht für Smart Edges).
MINDNET_LLM_BACKGROUND_LIMIT 2 NEU: Max. parallele Import-Tasks (Traffic Control).
MINDNET_VAULT_ROOT ./vault NEU: Pfad für Write-Back Operationen.
MINDNET_HASH_COMPARE Body Vergleichsmodus für Import (Body, Frontmatter, Full).
MINDNET_HASH_SOURCE parsed Quelle für Hash (parsed, raw, file).

Anhang E: Glossar

  • Active Intelligence: Feature, das während des Schreibens Links vorschlägt.
  • Async Ingestion: Non-blocking Import-Prozess zur Vermeidung von Timeouts.
  • Decision Engine: Komponente, die den Intent prüft und Strategien wählt (WP06).
  • Draft Editor: Web-Komponente zur Bearbeitung generierter Notizen (WP10a).
  • Explanation Layer: Komponente, die Scores und Graphen als Begründung liefert.
  • Healing Parser: UI-Funktion, die defektes YAML von LLMs repariert (v2.5).
  • Hybrid Router: Kombination aus Keyword-Matching und LLM-Klassifizierung für Intents.
  • Matrix Logic: Regelwerk, das Kanten-Typen basierend auf Quell- und Ziel-Typ bestimmt.
  • Nomic: Das neue, hochpräzise Embedding-Modell (768 Dim).
  • One-Shot Extractor: LLM-Strategie zur sofortigen Generierung von Drafts ohne Rückfragen (WP07).
  • RAG (Retrieval Augmented Generation): Kombination aus Suche und Text-Generierung.
  • Resurrection Pattern: UI-Technik, um Eingaben bei Tab-Wechseln zu erhalten.
  • Smart Edge Allocation: LLM-basierte Prüfung, ob ein Link zu einem Chunk passt (WP15).
  • Traffic Control: Priorisierung von Chat-Anfragen ("Realtime") vor Import-Last ("Background") im LLM-Service (v2.6).

Anhang F: Workpackage Status (v2.6.0)

Aktueller Implementierungsstand der Module.

WP Titel Status Anmerkung
WP01 Knowledge Design 🟢 Live Typen, Frontmatter definiert.
WP02 Chunking Strategy 🟢 Live Profilbasiertes Chunking aktiv.
WP03 Edge Logic / Import 🟢 Live Neue Importer-Pipeline mit Provenance.
WP04a Retriever Scoring 🟢 Live Hybrider Score (Semantik + Graph).
WP04b Explanation Layer 🟢 Live API liefert Reasons & Breakdown.
WP04c Feedback Loop 🟢 Live Logging (JSONL) & Traceability aktiv.
WP05 Persönlichkeit / Chat 🟢 Live RAG-Integration mit Context Enrichment.
WP06 Decision Engine 🟢 Live Hybrid Router v5, Strategic Retrieval.
WP07 Interview Assistent 🟢 Live One-Shot Extractor & Schemas aktiv.
WP08 Self-Tuning 🔴 Geplant Auto-Adjustment der Gewichte.
WP10 Chat Interface 🟢 Live Web-Interface (Streamlit).
WP10a Draft Editor 🟢 Live Interaktives UI & Healing Parser.
WP11 Backend Intelligence 🟢 Live Async Ingestion, Nomic, Matrix.
WP15 Smart Edge Allocation 🟢 Live LLM-Filter & Traffic Control.
WP16 Auto-Discovery 🟡 Geplant UX & Retrieval Tuning.
WP17 Conversational Memory 🟡 Geplant Dialog-Gedächtnis.