docs/mindnet_v2_implementation_playbook.md aktualisiert

2025-11-18 11:19:22 +01:00 · 2025-11-18 11:19:22 +01:00 · fafa74b0b8
commit fafa74b0b8
parent 049a39aba3
1 changed files with 42 additions and 1 deletions
--- a/docs/mindnet_v2_implementation_playbook.md
+++ b/docs/mindnet_v2_implementation_playbook.md
@ -19,6 +19,31 @@
 > **Warum so?** Qdrant‑Payload‑Indizes/Filter → schnelle, erklärbare Selektionen; Snapshots → betriebssicheres Rollback; OTel → Nachvollziehbarkeit; YAML/JSON‑Schema → Validierbarkeit & Stabilität.
 ### 0.1 Aktueller Implementierungsstand (2025-11-18)
 - Es existiert eine produktive mindnet-Instanz mit den Collections:
  - `${prefix}_notes`
  - `${prefix}_chunks`
  - `${prefix}_edges`
 - Import-Pipeline:
  - `scripts/import_markdown.py` erzeugt Notes, Chunks und Edges vollständig.
  - `types.yaml` definiert per Note-Typ:
    - `retriever_weight`
    - `chunk_profile`
    - `edge_defaults` (z. B. `depends_on`, `related_to`).
 - Edges:
  - Strukturkanten: `belongs_to`, `next`, `prev`
  - Explizite Kanten aus Wikilinks: `kind="references"`, `rule_id="explicit:wikilink"`
  - Typbasierte Default-Kanten aus `edge_defaults`: `rule_id="edge_defaults:<type>:<relation>"`
  - Inline-Kanten im Format `[[rel:<relation> <Zielnote>]]` mit `rule_id="inline:rel"`
  - alle Edges tragen eine `confidence` im Bereich `[0,1]` als Hinweis für spätere Ranking-Logiken.
 - Tests:
  - `tests/test_edges_smoke.py`, `tests/test_edges_all.py` und `scripts/edges_full_check.py` validieren Counts, Konsistenz (`belongs_to == chunks`, `next/prev`-Ketten, keine Duplikate) und Provenienz-Zählungen (`explicit`, `defaults`, `inline`, `structure`).
 - Offene Punkte:
  - Mehrere Ziele in einer Inline-Relation (`rel: similar_to [[A]] [[B]]`) sind noch nicht implementiert.
  - Retrieval-Service nutzt die neuen Edges und Weights bisher nur teilweise; ein edge-bewusster Retriever ist als nächster Schritt geplant.
 ---
 ## 1) Datenmodelle (Schemata, v2)
@ -196,10 +221,15 @@ rule_sets:
 - CI‑Job: `make schema-validate` (jsonschema).  
 - **Abnahme:** Validator grün auf 3 Gold‑Notizen.
-### Step 2 – Qdrant v2‑Collections
+### Step 2 – Qdrant v2‑Collections (Optional)
 - Anlegen der 3 v2‑Collections + Payload‑Indizes.  
 - **Abnahme:** Filter‑Query liefert erwartbare Ergebnisse.
 ### Step 2a – Edge-Pipeline v1 stabilisieren (ERLEDIGT)
 - Ziel: Vollständige Generierung von Struktur-, expliziten, typbasierten und Inline-Kanten in den bestehenden Collections `${prefix}_notes`, `${prefix}_chunks`, `${prefix}_edges`.
 - Status: Implementiert und durch `tests/test_edges_smoke.py`, `tests/test_edges_all.py` und `scripts/edges_full_check.py` verifiziert.
 ### Step 3 – Chunker v2
 - Implementierung & Flag `--chunker v2`.  
 - **Abnahme:** Chunk‑Counts ~ alt (≈171 ± 15 %), semantische Schnitte.
@ -208,6 +238,17 @@ rule_sets:
 - Reihenfolge & `provenance` strikt umsetzen, `default_resolved` integrieren.  
 - **Abnahme:** erwartete Relationensätze auf Gold‑Notizen, keine Duplikate.
 ### Step 4a – Edge-bewusster Retriever
 - Implementiere einen Retrieval-Service, der:
  - Chunks über Vektor-Suche aus `${prefix}_chunks` holt,
  - dazu passende Nachbar-Chunks (`next/prev`) und typrelevante Notizen (`edge_defaults`, Inline-Relationen, Wikilinks) über `${prefix}_edges` ergänzt,
  - `retriever_weight` und `confidence` beim Scoring berücksichtigt.
 - Liefere einen API-Endpoint `/mindnet/query` mit einem einfachen JSON-Response (Chunks + Begründung).
 - Akzeptanz:
  - mindestens ein Testfall mit dem Relations-Showcase-Vault,
  - sichtbarer Einfluss von `edge_defaults` und Inline-Relationen auf die Ergebnisliste.
 ### Step 5 – Importer‑Pipeline v2
 - `--schema v2` Side‑by‑Side; Batch‑Upserts; vollständige Payloads; Recency‑Boost Konfig **nur** in Policy.  
 - **Abnahme:** Dry‑Run/Apply‑Parität, Reports, Telemetrie‑Ereignisse sichtbar.