19 KiB
mindnet v2.1 — Programmplan
Version: 2.1
Stand: 2025-12-05
Status: Aktiv
1. Programmauftrag
mindnet v2.1 entwickelt ein persönliches, wachsendes KI-Gedächtnis, das:
- Wissen, Erfahrungen, Werte und Entscheidungen speichert,
- semantisch verknüpft und rekonstruiert,
- einen KI-Zwilling aufbaut, der wie du argumentiert, entscheidet und reflektiert,
- über Chat, Obsidian und zukünftige Interview-Assistenten gefüttert wird,
- automatisch neue Zusammenhänge erkennt und vernetzt,
- sich durch Rückmeldungen selbst verbessert (Self-Tuning).
Das System soll langfristig als digitales Gegenüber funktionieren, das:
- dich versteht,
- deine Denkweise reflektiert,
- deine Werte kennt,
- Entscheidungen begründen kann,
- Erinnerungen einordnet,
- für Nachkommen eine Art digitaler Dialogpartner wird.
mindnet ist kein statisches Wissensarchiv, sondern ein lebendes, lernendes Gedächtnismodell.
2. Vision
„Ein persönliches semantisches Gedächtnis, das mit mir wächst, meine Persönlichkeit spiegelt und mir als intelligenter, erklärbarer, lernender Begleiter dient.“
Kernprinzipien:
- Erklärbarkeit: Jede Antwort muss begründbar sein (Edges, Scores, Wertebezüge).
- Wachstum: Das System muss mit unvollständigen Daten arbeiten können.
- Flexibilität: Spätere Strukturänderungen dürfen nie Massenarbeit erfordern.
- Autonomie: mindnet ergänzt fehlende Links, Typen und Relationen selbst.
- Lernen: Feedback führt zu Justierungen im Verhalten und den Wissensstrukturen.
- Persönlichkeit: Entscheidungen werden wert- und erfahrungsbasiert begründet.
3. Programmziele
3.1 Kurzfristig (nächste Monate)
- Automatische Sammlung von Wissen aus Markdown und Chat.
- Aufbau eines soliden Graph-Speichers.
- Semantischer und graphbasierter Retriever (WP-04).
- Automatisierte Erkennung von Beziehungen.
- Schrittweises Lernen über Feedback (Score-Tuning).
- „Mitwachsendes“ Schema ohne Obsidian-Umstrukturierungen.
- Technische Basis für den KI-Zwilling.
3.2 Mittelfristig
- Persönlichkeitsprofil wird stabil erkannt und genutzt.
- KI-Assistenz für Entscheidungen (Why-Layer).
- Interview-Assistent erstellt neue Notes automatisch.
- mindnet erzeugt selbst Vorschläge für neue Notes & Edges.
- Agenten können über MCP mit mindnet kommunizieren.
3.3 Langfristig
- KI-Zwilling, der langfristig deinen Stil, deine Werte und deine typische Denkweise repräsentiert.
- Voll autonomes Self-Tuning der Wissensstruktur.
- Lebenslanges Gedächtnis, das
- konsistent bleibt,
- wächst,
- sich weiterentwickelt,
- und deine Geschichte für deine Nachkommen erzählbar macht.
4. Architekturprinzipien
-
Late Binding (späte Semantik)
Struktur und Interpretation werden möglichst spät (im Schema-/Config-Layer) festgelegt, nicht hart in Markdown-Dateien eingraviert. -
Virtual Schema Layer
Typen, Regeln und semantische Felder liegen in Konfigurationsdateien (z. B.types.yaml,knowledge_design.md) und nicht zwingend in jeder einzelnen Note. -
Self-Healing Graph
Der Graph wird regelmäßig analysiert und um fehlende Kanten ergänzt (ähnliche Inhalte, typisierte Beziehungen, Backlinks). -
Deterministische IDs
Notes, Chunks und Edges nutzen stabile IDs (z. B. UUIDv5), damit der Graph wiederaufbaubar bleibt. -
Full Explainability
Jeder Score, jede Beziehung, jeder Vorschlag muss über Edges, Pfade und Scoring-Komponenten nachvollziehbar sein. -
Persistence First
Obsidian bleibt die bevorzugte Quelle der Wahrheit. mindnet ergänzt und schlägt Änderungen vor, überschreibt aber nicht unkontrolliert. -
Minimalinvasives Schreiben
Ein späterer Rewriter darf Markdown-Dateien nur nach expliziter Zustimmung verändern. -
Incremental Growth
Das System muss mit wenigen, unvollständigen Notizen starten und sich schrittweise verdichten können, ohne manuelle Massenmigrationen auszulösen.
5. Programmstruktur (Phasenmodell)
Phase A – Fundament & Import
Phase B – Semantik, Graph & Lernen
Phase C – Persönlichkeitsmodell & KI-Zwilling
Phase D – Agenten, MCP & Interaktion
Phase E – Review, Refactoring, Dokumentation
Alle Workpackages (WP) sind diesen Phasen zugeordnet.
6. Workpackages – Übersicht
Legende Aufwand / Komplexität
- Aufwand: Niedrig / Mittel / Hoch
- Komplexität: Niedrig / Mittel / Hoch
WP-01 – Wissensdesign (abgeschlossen)
Phase: A
Status: 🟢 abgeschlossen
Ziel:
Grundlegendes Schema für mindnet festlegen (knowledge_design.md), inkl.:
- Note-Typen (z. B. concept, experience, project, decision, value, principle, person, event, etc.).
- Standardfelder (Titel, Typ, Tags, Status, Zeitstempel, Referenzen).
- Grundstruktur von Edges (belongs_to, references, depends_on, similar_to, etc.).
Aufwand / Komplexität:
- Aufwand: Mittel
- Komplexität: Mittel
Deliverables:
knowledge_design.md v0.1(liegt vor).
DoD (Definition of Done):
- Note-Typen sind definiert und verständlich.
- Edge-Arten sind beschrieben.
- Dokument ist konsistent und anschlussfähig für Parser, Importer und Retriever.
WP-02 – Chunking Strategy (abgeschlossen)
Phase: A
Status: 🟢 abgeschlossen
Ziel:
Regeln für Textsegmentierung, Overlaps und Fensterlogik definieren (chunking_strategy.md).
Inhalte:
text(Chunk-Kern ohne Overlap).window(Chunk + linker Kontext).- Overlap-Regeln (~30–40 Zeichen im Mittel).
- Stabiler Bezug zwischen Chunks und ursprünglicher Note/Position.
Aufwand / Komplexität:
- Aufwand: Mittel
- Komplexität: Mittel
Deliverables:
chunking_strategy.md v0.1.
DoD:
- Strategy-Dokument vorhanden und konsistent.
- Messwerte (Overlap, Textanteil) ermittelt.
- Tests zur Überprüfung der Chunk-Integrität vorhanden.
WP-03 – Importer + Edge-Erzeugung (abgeschlossen)
Phase: A
Status: 🟢 abgeschlossen
Ziel:
Robuster, idempotenter Importer, der Obsidian-Markdown-Dateien als:
- Notes (mit Payload),
- Chunks (mit Embeddings-Fenster),
- Edges (verschiedene Typen)
in Qdrant überführt.
Kernfunktionen:
- Parser mit Encoding-Fallback (UTF-8 → cp1252 → latin-1).
- Erkennung von YAML-Frontmatter + Body.
- Auslassung von speziellen Dateien (
CONFIG.md,index.md, etc., je nach Regel). - Hash-basierte Idempotenz (verschiedene Modi).
- Chunking gemäß
chunking_strategy.md. - Edge-Ableitung aus:
- Wikilinks:
[[Note]]→references. - Inline-Relationen:
[[rel:depends_on XYZ]]. - Callout-Edges: z. B.
> [!edge] related_to: [[ABC]]. - Typbasierten Defaults aus
types.yaml. - Strukturkanten:
belongs_to,next,prev.
- Wikilinks:
Aufwand / Komplexität:
- Aufwand: Hoch
- Komplexität: Hoch
Deliverables (Beispiele):
import_markdown.pychunk_payload.pyderive_edges.py- Testskripte (
verify_chunks_integrity.py,compare_vaults.py, etc.). - Handbuch zum Import-Prozess.
DoD:
- Vollständiger Roundtrip-Test (Vault → Qdrant → Export → Vergleich) grün.
- Edges werden deterministisch erzeugt.
- Notes/Chunks/Edges folgen dem festgelegten Schema.
- Alte Fehler (nur eine Note in Qdrant etc.) sind behoben.
WP-04 – Retriever & Scoring
Phase: B
WP-04a – Hybrider Retriever (abgeschlossen)
Status: 🟢 abgeschlossen
Ziel:
Hybrides Scoring-Modell, das:
- Embedding-Ähnlichkeit,
- Typwissen (
retriever_weight), - Edge-Information (Nachbarschaft, Edge-Konfidenz),
- ggf. Centrality-Metriken
zu einem erklärbaren Gesamtscore kombiniert.
Deliverables:
retriever.yaml(Konfiguration).- API-Endpunkt
/query(FastAPI). - Scoring-Logik mit detaillierten Komponenten.
DoD:
/queryliefert Ergebnisse mit:- Hauptscore,
- Zerlegung nach Komponenten (semantik / edges / centrality),
- Referenzpfaden und Metadaten.
- Tests für typische Anfragen grün.
WP-04b – Explanation Layer (offen)
Status: 🟡 geplant
Ziel:
Antworten und Treffer so erklären, dass du nachvollziehen kannst:
- Warum genau diese Chunks/Notes?
- Welche Edges führten dorthin?
- Welche Typen, Scores, Pfade waren entscheidend?
Umfang:
- „Top-K-Pfade“ vom Query-Embedding zu den relevanten Notes.
- Darstellung: Edgeliste + Labels + Gewichte.
- Menschlich lesbare „Why“-Erklärung pro Treffer.
Aufwand / Komplexität:
- Aufwand: Mittel
- Komplexität: Hoch
DoD:
- Jede Antwort des Retrievers kann über eine API erklärt werden.
- Erklärungen sind stabil, nachvollziehbar und nutzen Edges + Scores.
- Tests mit Beispielqueries dokumentiert.
WP-04c – Feedback Logging (offen)
Status: 🟡 geplant
Ziel:
Grundlage für Self-Tuning schaffen, indem Queries, Antworten und Feedback gespeichert werden.
Umfang:
- Logging von:
- Query-Text,
- Retriever-Konfiguration (Snapshot),
- Resultlisten + Scores,
- optional Benutzer-Feedback (z. B. „gut“, „daneben“),
- Kontext (Session-ID, Zeitpunkt).
Aufwand / Komplexität:
- Aufwand: Mittel
- Komplexität: Mittel/Hoch
DoD:
- Strukturierte Logs (z. B. JSONL, DB-Collection).
- Klar definierte Felder für Tuning späterer Retriever-Versionen.
- Export-Funktion für Trainings-/Analysezwecke.
WP-05 – Virtual Schema Layer (neu)
Phase: B
Status: 🟡 geplant
Ziel:
Sicherstellen, dass du nicht hunderte von Markdown-Dateien neu anfassen musst, wenn neue Felder oder Typen eingeführt werden.
Idee:
- Notes können unvollständig oder inkonsistent sein.
- Das „logische“ Schema liegt in:
types.yaml,knowledge_design.md,- weiteren Konfigurationsdateien.
- Qdrant-Payload kann Felder ergänzen, die in der Datei nicht explizit stehen.
Aufwand / Komplexität:
- Aufwand: Mittel
- Komplexität: Mittel
DoD:
- Alle Notes lassen sich ohne Fehler importieren, auch wenn Felder fehlen.
- Neue Schemafelder können ausschließlich über Config eingeführt werden.
- Qdrant-Payload spiegelt das „virtuelle Schema“, ohne die Markdown-Datei zu verändern.
- Abfragen können auf virtuelle Felder zugreifen.
WP-06 – Self-Healing Graph (neu)
Phase: B
Status: 🟡 geplant
Ziel:
Der Graph wird regelmäßig analysiert und automatisch verbessert.
Funktionen (Beispiele):
- Erkennung von isolierten Notes/Chunks (ohne Edges).
- Vorschlag oder automatische Anlage von:
similar_to,related_to,belongs_to(z. B. zu Projekten, Leitbild, Rollen).
- Verwendung von Typwissen, Embeddings und Strukturmustern.
Aufwand / Komplexität:
- Aufwand: Mittel
- Komplexität: Hoch
DoD:
- Selbstdiagnose des Graphen (Report).
- Optionale auto-fix-Funktionen (mit Sicherheitsregeln).
- Self-Healing läuft inkrementell und zerstört keine bestehende Struktur.
WP-07 – Retroactive Edge Generation (neu)
Phase: B
Status: 🟡 geplant
Ziel:
Wenn dein Wissensstand wächst (z. B. Leitbild später ergänzt, neue Wertedefinitionen), sollen alte Notes automatisch mit neuen Kanten angereichert werden.
Umfang:
- Clustering und Ähnlichkeitsanalyse über existierende Notes.
- Erzeugung von:
similar_to,- thematischen
related_to, - „Wertebezügen“ (z. B. Note ↔ Wert/Prinzip).
Aufwand / Komplexität:
- Aufwand: Niedrig/Mittel
- Komplexität: Mittel
DoD:
- Batch-Job(s) zur nachträglichen Edgenerierung.
- Stabilität der entstehenden Kanten (keine Dubletten-Flut).
- Kein Zwang, die ursprünglichen Markdown-Dateien zu editieren.
WP-08 – Self-Tuning (Retriever Lernen)
Phase: B
Status: 🟡 geplant
v1 – Offline Tuning
Ziel:
Anhand der geloggten Queries/Feedbacks das Scoring verbessern.
Umfang:
- Analyse von:
- Queries + Label („gut/schlecht“),
- Top-k-Treffern,
- genutzten Scores.
- Anpassung von:
semantic_weight,edge_weight,- weights einzelner Edge-Typen,
- Typprioritäten.
DoD:
- Neue Retriever-Konfigurationen auf Basis von Logdaten.
- Vergleichsmetriken, die zeigen, dass die Qualität steigt.
v2 – Semi-automatischer Optimierer
Ziel:
Ein Agent, der konkrete Konfigurationsvorschläge macht.
DoD:
- Vorschlagsmodus (nicht direkt produktiv).
- Human-in-the-loop Freigabe.
- Sicherungsmechanismen (Rollback, Versionierung der Configs).
WP-09 – Chat→Vault & Interview-Assistent
Phase: B/C
Status: 🟡 geplant
Ziel:
Ermöglichen, dass du Wissen direkt im Chat erfassen kannst, ohne selbst Markdown zu schreiben.
Umfang:
- API/Workflow:
- Chattext → Note (mit Typ, Tags, Metadaten).
- Chunking & Edges wie bei Obsidian-Notes.
- Optional:
- Rückschreiben als
.mdin deinen Obsidian-Vault.
- Rückschreiben als
- Später:
- Interview-Assistent, der strukturierte Fragen stellt und daraus Notes/Edges erzeugt.
Aufwand / Komplexität:
- Aufwand: Mittel
- Komplexität: Niedrig/Mittel
DoD:
- Chat-basiertes Erzeugen von Notes voll integriert.
- Optionaler Export nach Obsidian funktional.
- Keine Brüche in der IDs/Edge-Logik.
WP-10 – Persönlichkeitsmodell (Identity Layer)
Phase: C
Status: 🟡 geplant
Ziel:
Deine Werte, Prinzipien, Zielbilder, biografischen Ankerpunkte und typischen Entscheidungsweisen werden in ein konsistentes Modell integriert.
Umfang:
- Extraktion aus:
- Leitbild-Notes,
- Werte- und Prinzipien-Assessments,
- Entscheidungen und deren Begründungen.
- Repräsentation:
- Eigene Note/Typen (z. B.
identity_profile,value,principle,role). - Edges zwischen Identitätskern und konkreten Erfahrungen/Entscheidungen.
- Eigene Note/Typen (z. B.
- Nutzung im Retriever und in der Entscheidungsschicht.
Aufwand / Komplexität:
- Aufwand: Hoch
- Komplexität: Hoch
DoD:
- Klar definierter Identity-Core im Graphen.
- Abfragen können explizit „aus deiner Perspektive“ beantwortet werden.
- Erste einfache Identity-Evaluationsszenarien (z. B. „passt diese Option zu meinen Werten X/Y?“).
WP-11 – Decision Engine
Phase: C
Status: 🟡 geplant
Ziel:
Begründete, konsistente Entscheidungen auf Basis deiner Daten, Werte und Präferenzen.
Umfang:
- Entscheidungs-Pipelines:
- Faktenlage zusammenstellen (Retriever).
- Werte/Prinzipien interpretieren.
- Alternativen generieren.
- Abwägungen begründen.
- „Warum?“-Layer: jedes Urteil soll begründet sein.
Aufwand / Komplexität:
- Aufwand: Hoch
- Komplexität: Hoch
DoD:
- Mindestens einige exemplarische Entscheidungsfälle (z. B. Trainingsplanung, Projektpriorisierung, Investitionsentscheidungen), die konsistent und erklärbar durchlaufen werden können.
WP-12 – Knowledge Rewriter (Soft Mode)
Phase: C
Status: 🟡 geplant
Ziel:
Optionaler Assistent, der vorhandene Notes „aufräumt“, zusammenfasst oder reorganisiert.
Einschränkung:
- Änderungen dürfen nur nach expliziter Freigabe erfolgen.
- Kein „still und leise überschreiben“.
Aufwand / Komplexität:
- Aufwand: Niedrig/Mittel
- Komplexität: Mittel
DoD:
- Vorschlagsmodus:
- Rewriter generiert Vorschlag (neue Version).
- Diff sichtbar.
- Manueller Merge / Freigabe.
- Nach Freigabe:
- konsistente IDs/Edges bleiben erhalten oder werden aktualisiert.
WP-13 – MCP Integration & Agenten-Layer
Phase: D
Status: 🟡 geplant
Ziel:
mindnet als MCP-Server bereitstellen, damit Agenten/LLMs über standardisierte Tools darauf zugreifen.
Umfang:
- MCP-Server mit Tools wie:
mindnet_query,mindnet_subgraph,mindnet_store_note,mindnet_explain.
- Integration in deine bestehende n8n-/LLM-Umgebung.
Aufwand / Komplexität:
- Aufwand: Mittel
- Komplexität: Mittel
DoD:
- Lokaler MCP-Server läuft.
- Tools können aus einem LLM/Client heraus genutzt werden.
- Sicherheits- und Loggingkonzept aufgesetzt.
WP-14 – Review / Refactoring / Dokumentation
Phase: E
Status: 🟡 geplant
Ziel:
Aufräumen, dokumentieren, stabilisieren.
Deliverables (Beispiele):
tech_architecture.mdidentity_model.mdapi_spec.mdmcp_integration.md- konsolidiertes Handbuch für mindnet v2.x
Aufwand / Komplexität:
- Aufwand: Mittel
- Komplexität: Niedrig/Mittel
DoD:
- Aktueller Stand ist sauber dokumentiert.
- Wichtige Designentscheidungen sind festgehalten.
- Onboarding eines Dritten wäre mit dieser Dokumentation möglich.
7. Abhängigkeiten (vereinfacht)
WP01 → WP02 → WP03 → WP04a
WP04a → WP04b → WP04c → WP08
WP03 → WP05 → WP06 → WP07
WP03 → WP09
WP01/WP03 → WP10 → WP11 → WP12
WP03/WP04 → WP13
Alles → WP14
8. Laufzeit- & Komplexitätsindikatoren
| WP | Aufwand | Komplexität |
|---|---|---|
| WP04b | Mittel | Hoch |
| WP04c | Mittel | Mittel/Hoch |
| WP05 | Mittel | Mittel |
| WP06 | Mittel | Hoch |
| WP07 | Niedrig/Mittel | Mittel |
| WP08 | Hoch | Hoch |
| WP09 | Mittel | Niedrig/Mittel |
| WP10 | Hoch | Hoch |
| WP11 | Hoch | Hoch |
| WP12 | Niedrig/Mittel | Mittel |
| WP13 | Mittel | Mittel |
| WP14 | Mittel | Niedrig/Mittel |
9. Programmfortschritt (Ampel)
| WP | Status |
|---|---|
| WP01 | 🟢 |
| WP02 | 🟢 |
| WP03 | 🟢 |
| WP04a | 🟢 |
| WP04b | 🟡 |
| WP04c | 🟡 |
| WP05 | 🟡 |
| WP06 | 🟡 |
| WP07 | 🟡 |
| WP08 | 🟡 |
| WP09 | 🟡 |
| WP10 | 🟡 |
| WP11 | 🟡 |
| WP12 | 🟡 |
| WP13 | 🟡 |
| WP14 | 🟡 |
10. Governance
- Versionierung über Gitea (Branches, Tags, Releases).
- Jede wesentliche Änderung an Architektur/Schema: eigener Commit + kurze Notiz.
- Jeder WP bekommt ein eigenes Chatfenster mit dediziertem Prompt.
- Programmleitung verantwortet:
- Konsistenz,
- Abhängigkeiten,
- Priorisierung,
- Dokumentation,
- Freigabe von Meilensteinen.
11. Executive Summary
mindnet v2.1 ist als Programm so aufgesetzt, dass:
- du schrittweise Wissen erfassen kannst (Obsidian + Chat),
- die Struktur mitwächst, ohne Retro-Massenarbeit,
- ein hybrider Retriever qualitativ hochwertige, erklärbare Antworten liefert,
- ein Self-Healing- und Self-Tuning-Mechanismus vorbereitet ist,
- ein Persönlichkeitsmodell und eine Decision Engine aufgebaut werden,
- langfristig ein KI-Zwilling entsteht, der deine Werte, Erfahrungen und Denkweise spiegelt.
Dieser Plan ist bewusst inkrementell angelegt, sodass du jederzeit starten, pausieren, erweitern kannst – ohne deine bestehenden Obsidian-Daten zerstören oder massiv umbauen zu müssen.