mindnet/docs/appendix.md

# Mindnet v2.4 – Appendices & Referenzen
**Datei:** `docs/mindnet_appendices_v2.6.md`
**Stand:** 2025-12-12
**Status:** **FINAL** (Integrierter Stand WP01–WP15)
**Quellen:** `TYPE_REGISTRY_MANUAL.md`, `chunking_strategy.md`, `mindnet_technical_architecture.md`, `Handbuch.md`.

> Dieses Dokument bündelt Tabellen, Schemata und technische Referenzen, die in den Prozess-Dokumenten (Playbook, Guides) den Lesefluss stören würden.

---

## Anhang A: Typ-Registry Referenz (Default-Werte)

Diese Tabelle zeigt die Standard-Konfiguration der `types.yaml` (Stand v2.6).

| Typ (`type`) | Chunk Profile | Retriever Weight | Smart Edges? | Beschreibung |
| :--- | :--- | :--- | :--- | :--- |
| **concept** | `medium` | 0.60 | Nein | Abstrakte Begriffe, Theorien. |
| **project** | `long` | 0.97 | Ja | Aktive Vorhaben. Hohe Priorität. |
| **decision** | `long` | 1.00 | Ja | Entscheidungen (ADRs). Höchste Prio. |
| **experience** | `sliding_smart_edges` | 0.90 | **Ja** | Persönliche Learnings. Intensiv analysiert. |
| **journal** | `short` | 0.80 | Nein | Zeitgebundene Logs. Fein granular. |
| **person** | `short` | 0.50 | Nein | Personen-Profile. |
| **source** | `long` | 0.50 | Nein | Externe Quellen (Bücher, PDFs). |
| **event** | `short` | 0.60 | Nein | Meetings, Konferenzen. |
| **value** | `medium` | 1.00 | Ja | Persönliche Werte/Prinzipien. |
| **goal** | `medium` | 0.95 | Ja | Strategische Ziele. |
| **belief** | `medium` | 0.90 | Ja | Glaubenssätze. |
| **risk** | `short` | 0.90 | Ja | **NEU:** Risiken & Gefahren. |
| **default** | `medium` | 1.00 | Nein | Fallback, wenn Typ unbekannt. |

---

## Anhang B: Edge-Typen & Semantik

Referenz aller implementierten Kantenarten (`kind`).

| Kind | Herkunft (Primär) | Symmetrisch? | Bedeutung & Nutzung |
| :--- | :--- | :--- | :--- |
| `references` | Wikilink `[[...]]` | Nein | Standard-Verweis. "Erwähnt X". |
| `belongs_to` | Struktur (Auto) | Nein | Verknüpft Chunk mit seiner Note. |
| `next` / `prev` | Struktur (Auto) | Ja (Logisch) | Definiert Lesereihenfolge der Chunks. |
| `depends_on` | Inline / Default | Nein | Harte Abhängigkeit. "Braucht X um zu funktionieren". |
| `related_to` | Callout / Default | Ja (Oft) | Thematische Nähe. "Siehe auch X". |
| `similar_to` | Inline | Ja | Inhaltliche Ähnlichkeit. "Ist wie X". |
| `caused_by` | Inline | Nein | Kausalität. "X ist der Grund für Y". |
| `solves` | Inline | Nein | Lösung. "Tool X löst Problem Y". |
| `blocks` | Inline | Nein | **NEU:** Blockade. "Risiko X blockiert Projekt Y". |
| `derived_from` | Matrix / Default | Nein | Herkunft. "Erkenntnis stammt aus Prinzip X". |
| `based_on` | Matrix | Nein | Fundament. "Erfahrung basiert auf Wert Y". |
| `uses` | Matrix | Nein | Nutzung. "Projekt nutzt Konzept Z". |

---

## Anhang C: Datenmodelle (JSON Payloads)

Diese sind die Felder, die effektiv in Qdrant gespeichert werden.

### C.1 Note Payload (`mindnet_notes`)

    {
      "note_id": "string (keyword)",       // UUIDv5 oder Slug
      "title": "string (text)",            // Titel aus Frontmatter
      "type": "string (keyword)",          // Typ (z.B. 'project')
      "retriever_weight": "float",         // Numerische Wichtigkeit (0.0-1.0)
      "chunk_profile": "string",           // Genutztes Profil (z.B. 'long')
      "edge_defaults": ["string"],         // Liste der aktiven Default-Kanten
      "tags": ["string"],                  // Liste von Tags
      "created": "string (iso-date)",      // Erstellungsdatum
      "updated": "integer",                // Timestamp
      "fulltext": "string (no-index)"      // Gesamter Text (für Recovery)
    }

### C.2 Chunk Payload (`mindnet_chunks`)

    {
      "chunk_id": "string (keyword)",      // Format: {note_id}#c{index}
      "note_id": "string (keyword)",       // FK zur Note
      "type": "string (keyword)",          // Typ-Kopie aus Note
      "text": "string (text)",             // Reintext für Anzeige (ohne Overlap)
      "window": "string (text)",           // Text + Overlap (für Embedding)
      "ord": "integer",                    // Laufende Nummer (1..N)
      "retriever_weight": "float",         // Kopie aus Note (für Query-Speed)
      "chunk_profile": "string",           // Vererbt von Note
      "neighbors_prev": ["string"],        // ID des Vorgängers
      "neighbors_next": ["string"]         // ID des Nachfolgers
    }

### C.3 Edge Payload (`mindnet_edges`)

    {
      "edge_id": "string (keyword)",       // Deterministischer Hash
      "source_id": "string (keyword)",     // Chunk-ID (Start)
      "target_id": "string (keyword)",     // Chunk-ID oder Note-Titel (Ziel)
      "kind": "string (keyword)",          // z.B. 'depends_on'
      "scope": "string (keyword)",         // Immer 'chunk'
      "rule_id": "string (keyword)",       // Traceability: 'inline:rel', 'explicit:wikilink'
      "confidence": "float",               // 0.0 - 1.0
      "note_id": "string (keyword)",       // Owner Note ID
      "provenance": "keyword"              // 'explicit', 'rule', 'smart' (NEU)
    }

---

## Anhang D: Environment Variablen

Diese Variablen steuern das Verhalten der Skripte und Container.

| Variable | Default | Beschreibung |
| :--- | :--- | :--- |
| `QDRANT_URL` | `http://localhost:6333` | URL zur Vektor-DB. |
| `QDRANT_API_KEY` | *(leer)* | API-Key für Absicherung (optional). |
| `COLLECTION_PREFIX` | `mindnet` | Namensraum für Collections (`{prefix}_notes` etc). |
| `VECTOR_DIM` | `768` | **NEU:** Dimension für Embeddings (für Nomic). |
| `MINDNET_TYPES_FILE` | `config/types.yaml` | Pfad zur Typ-Registry. |
| `MINDNET_RETRIEVER_CONFIG`| `config/retriever.yaml`| Pfad zur Scoring-Konfiguration. |
| `MINDNET_PROMPTS_PATH` | `config/prompts.yaml` | Pfad zu LLM-Prompts (Neu in v2.2). |
| `MINDNET_DECISION_CONFIG` | `config/decision_engine.yaml` | Router & Interview Config (Neu in v2.3). |
| `MINDNET_LLM_MODEL` | `phi3:mini` | Name des Chat-Modells. |
| `MINDNET_EMBEDDING_MODEL` | `nomic-embed-text` | **NEU:** Name des Vektor-Modells. |
| `MINDNET_OLLAMA_URL` | `http://127.0.0.1:11434`| URL zum LLM-Server (Neu in v2.2). |
| `MINDNET_LLM_TIMEOUT` | `300.0` | Timeout für Ollama (Erhöht für CPU-Inference). |
| `MINDNET_API_TIMEOUT` | `300.0` | **NEU:** Frontend Timeout (Erhöht für Smart Edges). |
| `MINDNET_LLM_BACKGROUND_LIMIT`| `2` | **NEU:** Max. parallele Import-Tasks (Traffic Control). |
| `MINDNET_VAULT_ROOT` | `./vault` | **NEU:** Pfad für Write-Back Operationen. |
| `MINDNET_HASH_COMPARE` | `Body` | Vergleichsmodus für Import (`Body`, `Frontmatter`, `Full`). |
| `MINDNET_HASH_SOURCE` | `parsed` | Quelle für Hash (`parsed`, `raw`, `file`). |

---

## Anhang E: Glossar

* **Active Intelligence:** Feature, das während des Schreibens Links vorschlägt.
* **Async Ingestion:** Non-blocking Import-Prozess zur Vermeidung von Timeouts.
* **Decision Engine:** Komponente, die den Intent prüft und Strategien wählt (WP06).
* **Draft Editor:** Web-Komponente zur Bearbeitung generierter Notizen (WP10a).
* **Explanation Layer:** Komponente, die Scores und Graphen als Begründung liefert.
* **Healing Parser:** UI-Funktion, die defektes YAML von LLMs repariert (v2.5).
* **Hybrid Router:** Kombination aus Keyword-Matching und LLM-Klassifizierung für Intents.
* **Matrix Logic:** Regelwerk, das Kanten-Typen basierend auf Quell- und Ziel-Typ bestimmt.
* **Nomic:** Das neue, hochpräzise Embedding-Modell (768 Dim).
* **One-Shot Extractor:** LLM-Strategie zur sofortigen Generierung von Drafts ohne Rückfragen (WP07).
* **RAG (Retrieval Augmented Generation):** Kombination aus Suche und Text-Generierung.
* **Resurrection Pattern:** UI-Technik, um Eingaben bei Tab-Wechseln zu erhalten.
* **Smart Edge Allocation:** LLM-basierte Prüfung, ob ein Link zu einem Chunk passt (WP15).
* **Traffic Control:** Priorisierung von Chat-Anfragen ("Realtime") vor Import-Last ("Background") im LLM-Service (v2.6).

---

## Anhang F: Workpackage Status (v2.6.0)

Aktueller Implementierungsstand der Module.

| WP | Titel | Status | Anmerkung |
| :--- | :--- | :--- | :--- |
| **WP01** | Knowledge Design | 🟢 Live | Typen, Frontmatter definiert. |
| **WP02** | Chunking Strategy | 🟢 Live | Profilbasiertes Chunking aktiv. |
| **WP03** | Edge Logic / Import | 🟢 Live | Neue Importer-Pipeline mit Provenance. |
| **WP04a**| Retriever Scoring | 🟢 Live | Hybrider Score (Semantik + Graph). |
| **WP04b**| Explanation Layer | 🟢 Live | API liefert Reasons & Breakdown. |
| **WP04c**| Feedback Loop | 🟢 Live | Logging (JSONL) & Traceability aktiv. |
| **WP05** | Persönlichkeit / Chat | 🟢 Live | RAG-Integration mit Context Enrichment. |
| **WP06** | Decision Engine | 🟢 Live | Hybrid Router v5, Strategic Retrieval. |
| **WP07** | Interview Assistent | 🟢 Live | **One-Shot Extractor & Schemas aktiv.** |
| **WP08** | Self-Tuning | 🔴 Geplant | Auto-Adjustment der Gewichte. |
| **WP10** | Chat Interface | 🟢 Live | Web-Interface (Streamlit). |
| **WP10a**| Draft Editor | 🟢 Live | **Interaktives UI & Healing Parser.** |
| **WP11** | Backend Intelligence | 🟢 Live | **Async Ingestion, Nomic, Matrix.** |
| **WP15** | Smart Edge Allocation | 🟢 Live | **LLM-Filter & Traffic Control.** |
| **WP16** | Auto-Discovery | 🟡 Geplant | UX & Retrieval Tuning. |
| **WP17** | Conversational Memory | 🟡 Geplant | Dialog-Gedächtnis. |