mindnet/docs/appendix.md
2025-12-11 16:58:23 +01:00

8.4 KiB
Raw Permalink Blame History

Mindnet v2.4 Appendices & Referenzen

Datei: docs/mindnet_appendices_v2.4.md Stand: 2025-12-11 Status: FINAL (Integrierter Stand WP01WP11) Quellen: TYPE_REGISTRY_MANUAL.md, chunking_strategy.md, mindnet_technical_architecture.md, Handbuch.md.

Dieses Dokument bündelt Tabellen, Schemata und technische Referenzen, die in den Prozess-Dokumenten (Playbook, Guides) den Lesefluss stören würden.


Anhang A: Typ-Registry Referenz (Default-Werte)

Diese Tabelle zeigt die Standard-Konfiguration der types.yaml (Stand v2.4).

Typ (type) Chunk Profile Retriever Weight Edge Defaults (Auto-Kanten) Beschreibung
concept medium 0.60 references, related_to Abstrakte Begriffe, Theorien.
project long 0.97 references, depends_on Aktive Vorhaben. Hohe Priorität.
decision long 1.00 caused_by, references Entscheidungen (ADRs). Höchste Prio.
experience medium 0.90 derived_from, inspired_by Persönliche Learnings.
journal short 0.80 related_to Zeitgebundene Logs. Fein granular.
person short 0.50 related_to Personen-Profile.
source long 0.50 (keine) Externe Quellen (Bücher, PDFs).
event short 0.60 related_to Meetings, Konferenzen.
value medium 1.00 related_to Persönliche Werte/Prinzipien.
goal medium 0.95 depends_on Strategische Ziele.
belief medium 0.90 related_to Glaubenssätze.
default medium 1.00 references Fallback, wenn Typ unbekannt.

Anhang B: Edge-Typen & Semantik

Referenz aller implementierten Kantenarten (kind).

Kind Herkunft (Primär) Symmetrisch? Bedeutung & Nutzung
references Wikilink [[...]] Nein Standard-Verweis. "Erwähnt X".
belongs_to Struktur (Auto) Nein Verknüpft Chunk mit seiner Note.
next / prev Struktur (Auto) Ja (Logisch) Definiert Lesereihenfolge der Chunks.
depends_on Inline / Default Nein Harte Abhängigkeit. "Braucht X um zu funktionieren".
related_to Callout / Default Ja (Oft) Thematische Nähe. "Siehe auch X".
similar_to Inline Ja Inhaltliche Ähnlichkeit. "Ist wie X".
caused_by Inline Nein Kausalität. "X ist der Grund für Y".
solves Inline Nein Lösung. "Tool X löst Problem Y".
derived_from Matrix / Default Nein Herkunft. "Erkenntnis stammt aus Prinzip X".
based_on Matrix Nein Fundament. "Erfahrung basiert auf Wert Y".
uses Matrix Nein Nutzung. "Projekt nutzt Konzept Z".

Anhang C: Datenmodelle (JSON Payloads)

Diese sind die Felder, die effektiv in Qdrant gespeichert werden.

C.1 Note Payload (mindnet_notes)

{
  "note_id": "string (keyword)",       // UUIDv5 oder Slug
  "title": "string (text)",            // Titel aus Frontmatter
  "type": "string (keyword)",          // Typ (z.B. 'project')
  "retriever_weight": "float",         // Numerische Wichtigkeit (0.0-1.0)
  "chunk_profile": "string",           // Genutztes Profil (z.B. 'long')
  "edge_defaults": ["string"],         // Liste der aktiven Default-Kanten
  "tags": ["string"],                  // Liste von Tags
  "created": "string (iso-date)",      // Erstellungsdatum
  "updated": "integer",                // Timestamp
  "fulltext": "string (no-index)"      // Gesamter Text (für Recovery)
}

C.2 Chunk Payload (mindnet_chunks)

{
  "chunk_id": "string (keyword)",      // Format: {note_id}#c{index}
  "note_id": "string (keyword)",       // FK zur Note
  "type": "string (keyword)",          // Typ-Kopie aus Note
  "text": "string (text)",             // Reintext für Anzeige (ohne Overlap)
  "window": "string (text)",           // Text + Overlap (für Embedding)
  "ord": "integer",                    // Laufende Nummer (1..N)
  "retriever_weight": "float",         // Kopie aus Note (für Query-Speed)
  "neighbors_prev": ["string"],        // ID des Vorgängers
  "neighbors_next": ["string"]         // ID des Nachfolgers
}

C.3 Edge Payload (mindnet_edges)

{
  "edge_id": "string (keyword)",       // Deterministischer Hash
  "source_id": "string (keyword)",     // Chunk-ID (Start)
  "target_id": "string (keyword)",     // Chunk-ID oder Note-Titel (Ziel)
  "kind": "string (keyword)",          // z.B. 'depends_on'
  "scope": "string (keyword)",         // Immer 'chunk'
  "rule_id": "string (keyword)",       // Traceability: 'inline:rel', 'explicit:wikilink'
  "confidence": "float",               // 0.0 - 1.0
  "note_id": "string (keyword)"        // Owner Note ID
}

Anhang D: Environment Variablen

Diese Variablen steuern das Verhalten der Skripte und Container.

Variable Default Beschreibung
QDRANT_URL http://localhost:6333 URL zur Vektor-DB.
QDRANT_API_KEY (leer) API-Key für Absicherung (optional).
COLLECTION_PREFIX mindnet Namensraum für Collections ({prefix}_notes etc).
VECTOR_DIM 768 NEU: Dimension für Embeddings (für Nomic).
MINDNET_TYPES_FILE config/types.yaml Pfad zur Typ-Registry.
MINDNET_RETRIEVER_CONFIG config/retriever.yaml Pfad zur Scoring-Konfiguration.
MINDNET_PROMPTS_PATH config/prompts.yaml Pfad zu LLM-Prompts (Neu in v2.2).
MINDNET_DECISION_CONFIG config/decision_engine.yaml Router & Interview Config (Neu in v2.3).
MINDNET_LLM_MODEL phi3:mini Name des Chat-Modells.
MINDNET_EMBEDDING_MODEL nomic-embed-text NEU: Name des Vektor-Modells.
MINDNET_OLLAMA_URL http://127.0.0.1:11434 URL zum LLM-Server (Neu in v2.2).
MINDNET_LLM_TIMEOUT 300.0 Timeout für Ollama (Erhöht für CPU-Inference).
MINDNET_API_TIMEOUT 60.0 NEU: Frontend Timeout (Streamlit).
MINDNET_VAULT_ROOT ./vault NEU: Pfad für Write-Back Operationen.
MINDNET_HASH_COMPARE Body Vergleichsmodus für Import (Body, Frontmatter, Full).
MINDNET_HASH_SOURCE parsed Quelle für Hash (parsed, raw, file).

Anhang E: Glossar

  • Active Intelligence: Feature, das während des Schreibens Links vorschlägt.
  • Async Ingestion: Non-blocking Import-Prozess zur Vermeidung von Timeouts.
  • Decision Engine: Komponente, die den Intent prüft und Strategien wählt (WP06).
  • Draft Editor: Web-Komponente zur Bearbeitung generierter Notizen (WP10a).
  • Explanation Layer: Komponente, die Scores und Graphen als Begründung liefert.
  • Hybrid Router: Kombination aus Keyword-Matching und LLM-Klassifizierung für Intents.
  • Matrix Logic: Regelwerk, das Kanten-Typen basierend auf Quell- und Ziel-Typ bestimmt.
  • Nomic: Das neue, hochpräzise Embedding-Modell (768 Dim).
  • One-Shot Extractor: LLM-Strategie zur sofortigen Generierung von Drafts ohne Rückfragen (WP07).
  • RAG (Retrieval Augmented Generation): Kombination aus Suche und Text-Generierung.
  • Resurrection Pattern: UI-Technik, um Eingaben bei Tab-Wechseln zu erhalten.

Anhang F: Workpackage Status (v2.4.0)

Aktueller Implementierungsstand der Module.

WP Titel Status Anmerkung
WP01 Knowledge Design 🟢 Live Typen, Frontmatter definiert.
WP02 Chunking Strategy 🟢 Live Profilbasiertes Chunking aktiv.
WP03 Edge Logic / Import 🟢 Live Neue Importer-Pipeline mit Provenance.
WP04a Retriever Scoring 🟢 Live Hybrider Score (Semantik + Graph).
WP04b Explanation Layer 🟢 Live API liefert Reasons & Breakdown.
WP04c Feedback Loop 🟢 Live Logging (JSONL) & Traceability aktiv.
WP05 Persönlichkeit / Chat 🟢 Live RAG-Integration mit Context Enrichment.
WP06 Decision Engine 🟢 Live Intent-Router & Strategic Retrieval.
WP07 Interview Assistent 🟢 Live One-Shot Extractor & Schemas aktiv.
WP08 Self-Tuning 🔴 Geplant Auto-Adjustment der Gewichte.
WP10 Chat Interface 🟢 Live Web-Interface (Streamlit).
WP10a Draft Editor 🟢 Live Interaktives UI für WP07 Drafts.
WP11 Backend Intelligence 🟢 Live Async Core, Nomic, Matrix.