mindnet/docs/appendix.md
2025-12-12 22:54:59 +01:00

9.1 KiB
Raw Blame History

Mindnet v2.4 Appendices & Referenzen

Datei: docs/mindnet_appendices_v2.6.md Stand: 2025-12-12 Status: FINAL (Integrierter Stand WP01WP15) Quellen: TYPE_REGISTRY_MANUAL.md, chunking_strategy.md, mindnet_technical_architecture.md, Handbuch.md.

Dieses Dokument bündelt Tabellen, Schemata und technische Referenzen, die in den Prozess-Dokumenten (Playbook, Guides) den Lesefluss stören würden.


Anhang A: Typ-Registry Referenz (Default-Werte)

Diese Tabelle zeigt die Standard-Konfiguration der types.yaml (Stand v2.6).

Typ (type) Chunk Profile Retriever Weight Smart Edges? Beschreibung
concept medium 0.60 Nein Abstrakte Begriffe, Theorien.
project long 0.97 Ja Aktive Vorhaben. Hohe Priorität.
decision long 1.00 Ja Entscheidungen (ADRs). Höchste Prio.
experience sliding_smart_edges 0.90 Ja Persönliche Learnings. Intensiv analysiert.
journal short 0.80 Nein Zeitgebundene Logs. Fein granular.
person short 0.50 Nein Personen-Profile.
source long 0.50 Nein Externe Quellen (Bücher, PDFs).
event short 0.60 Nein Meetings, Konferenzen.
value medium 1.00 Ja Persönliche Werte/Prinzipien.
goal medium 0.95 Ja Strategische Ziele.
belief medium 0.90 Ja Glaubenssätze.
risk short 0.90 Ja NEU: Risiken & Gefahren.
default medium 1.00 Nein Fallback, wenn Typ unbekannt.

Anhang B: Edge-Typen & Semantik

Referenz aller implementierten Kantenarten (kind).

Kind Herkunft (Primär) Symmetrisch? Bedeutung & Nutzung
references Wikilink [[...]] Nein Standard-Verweis. "Erwähnt X".
belongs_to Struktur (Auto) Nein Verknüpft Chunk mit seiner Note.
next / prev Struktur (Auto) Ja (Logisch) Definiert Lesereihenfolge der Chunks.
depends_on Inline / Default Nein Harte Abhängigkeit. "Braucht X um zu funktionieren".
related_to Callout / Default Ja (Oft) Thematische Nähe. "Siehe auch X".
similar_to Inline Ja Inhaltliche Ähnlichkeit. "Ist wie X".
caused_by Inline Nein Kausalität. "X ist der Grund für Y".
solves Inline Nein Lösung. "Tool X löst Problem Y".
blocks Inline Nein NEU: Blockade. "Risiko X blockiert Projekt Y".
derived_from Matrix / Default Nein Herkunft. "Erkenntnis stammt aus Prinzip X".
based_on Matrix Nein Fundament. "Erfahrung basiert auf Wert Y".
uses Matrix Nein Nutzung. "Projekt nutzt Konzept Z".

Anhang C: Datenmodelle (JSON Payloads)

Diese sind die Felder, die effektiv in Qdrant gespeichert werden.

C.1 Note Payload (mindnet_notes)

{
  "note_id": "string (keyword)",       // UUIDv5 oder Slug
  "title": "string (text)",            // Titel aus Frontmatter
  "type": "string (keyword)",          // Typ (z.B. 'project')
  "retriever_weight": "float",         // Numerische Wichtigkeit (0.0-1.0)
  "chunk_profile": "string",           // Genutztes Profil (z.B. 'long')
  "edge_defaults": ["string"],         // Liste der aktiven Default-Kanten
  "tags": ["string"],                  // Liste von Tags
  "created": "string (iso-date)",      // Erstellungsdatum
  "updated": "integer",                // Timestamp
  "fulltext": "string (no-index)"      // Gesamter Text (für Recovery)
}

C.2 Chunk Payload (mindnet_chunks)

{
  "chunk_id": "string (keyword)",      // Format: {note_id}#c{index}
  "note_id": "string (keyword)",       // FK zur Note
  "type": "string (keyword)",          // Typ-Kopie aus Note
  "text": "string (text)",             // Reintext für Anzeige (ohne Overlap)
  "window": "string (text)",           // Text + Overlap (für Embedding)
  "ord": "integer",                    // Laufende Nummer (1..N)
  "retriever_weight": "float",         // Kopie aus Note (für Query-Speed)
  "chunk_profile": "string",           // Vererbt von Note
  "neighbors_prev": ["string"],        // ID des Vorgängers
  "neighbors_next": ["string"]         // ID des Nachfolgers
}

C.3 Edge Payload (mindnet_edges)

{
  "edge_id": "string (keyword)",       // Deterministischer Hash
  "source_id": "string (keyword)",     // Chunk-ID (Start)
  "target_id": "string (keyword)",     // Chunk-ID oder Note-Titel (Ziel)
  "kind": "string (keyword)",          // z.B. 'depends_on'
  "scope": "string (keyword)",         // Immer 'chunk'
  "rule_id": "string (keyword)",       // Traceability: 'inline:rel', 'explicit:wikilink'
  "confidence": "float",               // 0.0 - 1.0
  "note_id": "string (keyword)",       // Owner Note ID
  "provenance": "keyword"              // 'explicit', 'rule', 'smart' (NEU)
}

Anhang D: Environment Variablen

Diese Variablen steuern das Verhalten der Skripte und Container.

Variable Default Beschreibung
QDRANT_URL http://localhost:6333 URL zur Vektor-DB.
QDRANT_API_KEY (leer) API-Key für Absicherung (optional).
COLLECTION_PREFIX mindnet Namensraum für Collections ({prefix}_notes etc).
VECTOR_DIM 768 NEU: Dimension für Embeddings (für Nomic).
MINDNET_TYPES_FILE config/types.yaml Pfad zur Typ-Registry.
MINDNET_RETRIEVER_CONFIG config/retriever.yaml Pfad zur Scoring-Konfiguration.
MINDNET_PROMPTS_PATH config/prompts.yaml Pfad zu LLM-Prompts (Neu in v2.2).
MINDNET_DECISION_CONFIG config/decision_engine.yaml Router & Interview Config (Neu in v2.3).
MINDNET_LLM_MODEL phi3:mini Name des Chat-Modells.
MINDNET_EMBEDDING_MODEL nomic-embed-text NEU: Name des Vektor-Modells.
MINDNET_OLLAMA_URL http://127.0.0.1:11434 URL zum LLM-Server (Neu in v2.2).
MINDNET_LLM_TIMEOUT 300.0 Timeout für Ollama (Erhöht für CPU-Inference).
MINDNET_API_TIMEOUT 300.0 NEU: Frontend Timeout (Erhöht für Smart Edges).
MINDNET_LLM_BACKGROUND_LIMIT 2 NEU: Max. parallele Import-Tasks (Traffic Control).
MINDNET_VAULT_ROOT ./vault NEU: Pfad für Write-Back Operationen.
MINDNET_HASH_COMPARE Body Vergleichsmodus für Import (Body, Frontmatter, Full).
MINDNET_HASH_SOURCE parsed Quelle für Hash (parsed, raw, file).

Anhang E: Glossar

  • Active Intelligence: Feature, das während des Schreibens Links vorschlägt.
  • Async Ingestion: Non-blocking Import-Prozess zur Vermeidung von Timeouts.
  • Decision Engine: Komponente, die den Intent prüft und Strategien wählt (WP06).
  • Draft Editor: Web-Komponente zur Bearbeitung generierter Notizen (WP10a).
  • Explanation Layer: Komponente, die Scores und Graphen als Begründung liefert.
  • Healing Parser: UI-Funktion, die defektes YAML von LLMs repariert (v2.5).
  • Hybrid Router: Kombination aus Keyword-Matching und LLM-Klassifizierung für Intents.
  • Matrix Logic: Regelwerk, das Kanten-Typen basierend auf Quell- und Ziel-Typ bestimmt.
  • Nomic: Das neue, hochpräzise Embedding-Modell (768 Dim).
  • One-Shot Extractor: LLM-Strategie zur sofortigen Generierung von Drafts ohne Rückfragen (WP07).
  • RAG (Retrieval Augmented Generation): Kombination aus Suche und Text-Generierung.
  • Resurrection Pattern: UI-Technik, um Eingaben bei Tab-Wechseln zu erhalten.
  • Smart Edge Allocation: LLM-basierte Prüfung, ob ein Link zu einem Chunk passt (WP15).
  • Traffic Control: Priorisierung von Chat-Anfragen ("Realtime") vor Import-Last ("Background") im LLM-Service (v2.6).

Anhang F: Workpackage Status (v2.6.0)

Aktueller Implementierungsstand der Module.

WP Titel Status Anmerkung
WP01 Knowledge Design 🟢 Live Typen, Frontmatter definiert.
WP02 Chunking Strategy 🟢 Live Profilbasiertes Chunking aktiv.
WP03 Edge Logic / Import 🟢 Live Neue Importer-Pipeline mit Provenance.
WP04a Retriever Scoring 🟢 Live Hybrider Score (Semantik + Graph).
WP04b Explanation Layer 🟢 Live API liefert Reasons & Breakdown.
WP04c Feedback Loop 🟢 Live Logging (JSONL) & Traceability aktiv.
WP05 Persönlichkeit / Chat 🟢 Live RAG-Integration mit Context Enrichment.
WP06 Decision Engine 🟢 Live Hybrid Router v5, Strategic Retrieval.
WP07 Interview Assistent 🟢 Live One-Shot Extractor & Schemas aktiv.
WP08 Self-Tuning 🔴 Geplant Auto-Adjustment der Gewichte.
WP10 Chat Interface 🟢 Live Web-Interface (Streamlit).
WP10a Draft Editor 🟢 Live Interaktives UI & Healing Parser.
WP11 Backend Intelligence 🟢 Live Async Ingestion, Nomic, Matrix.
WP15 Smart Edge Allocation 🟢 Live LLM-Filter & Traffic Control.
WP16 Auto-Discovery 🟡 Geplant UX & Retrieval Tuning.
WP17 Conversational Memory 🟡 Geplant Dialog-Gedächtnis.