Lars/mindnet

Fork 0

Lars ba0cdea9d0

Deploy mindnet to llm-node / deploy (push) Successful in 3s

Details

Programmmanagement/Programmplan_V2.1.md aktualisiert

2025-12-05 20:39:46 +01:00

19 KiB

Raw Blame History

mindnet v2.1 — Programmplan

Version: 2.1
Stand: 2025-12-05
Status: Aktiv

1. Programmauftrag

mindnet v2.1 entwickelt ein persönliches, wachsendes KI-Gedächtnis, das:

Wissen, Erfahrungen, Werte und Entscheidungen speichert,
semantisch verknüpft und rekonstruiert,
einen KI-Zwilling aufbaut, der wie du argumentiert, entscheidet und reflektiert,
über Chat, Obsidian und zukünftige Interview-Assistenten gefüttert wird,
automatisch neue Zusammenhänge erkennt und vernetzt,
sich durch Rückmeldungen selbst verbessert (Self-Tuning).

Das System soll langfristig als digitales Gegenüber funktionieren, das:

dich versteht,
deine Denkweise reflektiert,
deine Werte kennt,
Entscheidungen begründen kann,
Erinnerungen einordnet,
für Nachkommen eine Art digitaler Dialogpartner wird.

mindnet ist kein statisches Wissensarchiv, sondern ein lebendes, lernendes Gedächtnismodell.

2. Vision

„Ein persönliches semantisches Gedächtnis, das mit mir wächst, meine Persönlichkeit spiegelt und mir als intelligenter, erklärbarer, lernender Begleiter dient.“

Kernprinzipien:

Erklärbarkeit: Jede Antwort muss begründbar sein (Edges, Scores, Wertebezüge).
Wachstum: Das System muss mit unvollständigen Daten arbeiten können.
Flexibilität: Spätere Strukturänderungen dürfen nie Massenarbeit erfordern.
Autonomie: mindnet ergänzt fehlende Links, Typen und Relationen selbst.
Lernen: Feedback führt zu Justierungen im Verhalten und den Wissensstrukturen.
Persönlichkeit: Entscheidungen werden wert- und erfahrungsbasiert begründet.

3. Programmziele

3.1 Kurzfristig (nächste Monate)

Automatische Sammlung von Wissen aus Markdown und Chat.
Aufbau eines soliden Graph-Speichers.
Semantischer und graphbasierter Retriever (WP-04).
Automatisierte Erkennung von Beziehungen.
Schrittweises Lernen über Feedback (Score-Tuning).
„Mitwachsendes“ Schema ohne Obsidian-Umstrukturierungen.
Technische Basis für den KI-Zwilling.

3.2 Mittelfristig

Persönlichkeitsprofil wird stabil erkannt und genutzt.
KI-Assistenz für Entscheidungen (Why-Layer).
Interview-Assistent erstellt neue Notes automatisch.
mindnet erzeugt selbst Vorschläge für neue Notes & Edges.
Agenten können über MCP mit mindnet kommunizieren.

3.3 Langfristig

KI-Zwilling, der langfristig deinen Stil, deine Werte und deine typische Denkweise repräsentiert.
Voll autonomes Self-Tuning der Wissensstruktur.
Lebenslanges Gedächtnis, das
- konsistent bleibt,
- wächst,
- sich weiterentwickelt,
- und deine Geschichte für deine Nachkommen erzählbar macht.

4. Architekturprinzipien

Late Binding (späte Semantik)
Struktur und Interpretation werden möglichst spät (im Schema-/Config-Layer) festgelegt, nicht hart in Markdown-Dateien eingraviert.
Virtual Schema Layer
Typen, Regeln und semantische Felder liegen in Konfigurationsdateien (z. B. types.yaml, knowledge_design.md) und nicht zwingend in jeder einzelnen Note.
Self-Healing Graph
Der Graph wird regelmäßig analysiert und um fehlende Kanten ergänzt (ähnliche Inhalte, typisierte Beziehungen, Backlinks).
Deterministische IDs
Notes, Chunks und Edges nutzen stabile IDs (z. B. UUIDv5), damit der Graph wiederaufbaubar bleibt.
Full Explainability
Jeder Score, jede Beziehung, jeder Vorschlag muss über Edges, Pfade und Scoring-Komponenten nachvollziehbar sein.
Persistence First
Obsidian bleibt die bevorzugte Quelle der Wahrheit. mindnet ergänzt und schlägt Änderungen vor, überschreibt aber nicht unkontrolliert.
Minimalinvasives Schreiben
Ein späterer Rewriter darf Markdown-Dateien nur nach expliziter Zustimmung verändern.
Incremental Growth
Das System muss mit wenigen, unvollständigen Notizen starten und sich schrittweise verdichten können, ohne manuelle Massenmigrationen auszulösen.

5. Programmstruktur (Phasenmodell)

Phase A – Fundament & Import
Phase B – Semantik, Graph & Lernen
Phase C – Persönlichkeitsmodell & KI-Zwilling
Phase D – Agenten, MCP & Interaktion
Phase E – Review, Refactoring, Dokumentation

Alle Workpackages (WP) sind diesen Phasen zugeordnet.

6. Workpackages – Übersicht

Legende Aufwand / Komplexität

Aufwand: Niedrig / Mittel / Hoch
Komplexität: Niedrig / Mittel / Hoch

WP-01 – Wissensdesign (abgeschlossen)

Phase: A
Status: 🟢 abgeschlossen
Ziel:
Grundlegendes Schema für mindnet festlegen (knowledge_design.md), inkl.:

Note-Typen (z. B. concept, experience, project, decision, value, principle, person, event, etc.).
Standardfelder (Titel, Typ, Tags, Status, Zeitstempel, Referenzen).
Grundstruktur von Edges (belongs_to, references, depends_on, similar_to, etc.).

Aufwand / Komplexität:

Aufwand: Mittel
Komplexität: Mittel

Deliverables:

knowledge_design.md v0.1 (liegt vor).

DoD (Definition of Done):

Note-Typen sind definiert und verständlich.
Edge-Arten sind beschrieben.
Dokument ist konsistent und anschlussfähig für Parser, Importer und Retriever.

WP-02 – Chunking Strategy (abgeschlossen)

Phase: A
Status: 🟢 abgeschlossen
Ziel:
Regeln für Textsegmentierung, Overlaps und Fensterlogik definieren (chunking_strategy.md).

Inhalte:

text (Chunk-Kern ohne Overlap).
window (Chunk + linker Kontext).
Overlap-Regeln (~30–40 Zeichen im Mittel).
Stabiler Bezug zwischen Chunks und ursprünglicher Note/Position.

Aufwand / Komplexität:

Aufwand: Mittel
Komplexität: Mittel

Deliverables:

chunking_strategy.md v0.1.

DoD:

Strategy-Dokument vorhanden und konsistent.
Messwerte (Overlap, Textanteil) ermittelt.
Tests zur Überprüfung der Chunk-Integrität vorhanden.

WP-03 – Importer + Edge-Erzeugung (abgeschlossen)

Phase: A
Status: 🟢 abgeschlossen

Ziel:
Robuster, idempotenter Importer, der Obsidian-Markdown-Dateien als:

Notes (mit Payload),
Chunks (mit Embeddings-Fenster),
Edges (verschiedene Typen)

in Qdrant überführt.

Kernfunktionen:

Parser mit Encoding-Fallback (UTF-8 → cp1252 → latin-1).
Erkennung von YAML-Frontmatter + Body.
Auslassung von speziellen Dateien (CONFIG.md, index.md, etc., je nach Regel).
Hash-basierte Idempotenz (verschiedene Modi).
Chunking gemäß chunking_strategy.md.
Edge-Ableitung aus:
- Wikilinks: [[Note]] → references.
- Inline-Relationen: [[rel:depends_on XYZ]].
- Callout-Edges: z. B. > [!edge] related_to: [[ABC]].
- Typbasierten Defaults aus types.yaml.
- Strukturkanten: belongs_to, next, prev.

Aufwand / Komplexität:

Aufwand: Hoch
Komplexität: Hoch

Deliverables (Beispiele):

import_markdown.py
chunk_payload.py
derive_edges.py
Testskripte (verify_chunks_integrity.py, compare_vaults.py, etc.).
Handbuch zum Import-Prozess.

DoD:

Vollständiger Roundtrip-Test (Vault → Qdrant → Export → Vergleich) grün.
Edges werden deterministisch erzeugt.
Notes/Chunks/Edges folgen dem festgelegten Schema.
Alte Fehler (nur eine Note in Qdrant etc.) sind behoben.

WP-04 – Retriever & Scoring

Phase: B

WP-04a – Hybrider Retriever (abgeschlossen)

Status: 🟢 abgeschlossen

Ziel:
Hybrides Scoring-Modell, das:

Embedding-Ähnlichkeit,
Typwissen (retriever_weight),
Edge-Information (Nachbarschaft, Edge-Konfidenz),
ggf. Centrality-Metriken

zu einem erklärbaren Gesamtscore kombiniert.

Deliverables:

retriever.yaml (Konfiguration).
API-Endpunkt /query (FastAPI).
Scoring-Logik mit detaillierten Komponenten.

DoD:

/query liefert Ergebnisse mit:
- Hauptscore,
- Zerlegung nach Komponenten (semantik / edges / centrality),
- Referenzpfaden und Metadaten.
Tests für typische Anfragen grün.

WP-04b – Explanation Layer (offen)

Status: 🟡 geplant

Ziel:
Antworten und Treffer so erklären, dass du nachvollziehen kannst:

Warum genau diese Chunks/Notes?
Welche Edges führten dorthin?
Welche Typen, Scores, Pfade waren entscheidend?

Umfang:

„Top-K-Pfade“ vom Query-Embedding zu den relevanten Notes.
Darstellung: Edgeliste + Labels + Gewichte.
Menschlich lesbare „Why“-Erklärung pro Treffer.

Aufwand / Komplexität:

Aufwand: Mittel
Komplexität: Hoch

DoD:

Jede Antwort des Retrievers kann über eine API erklärt werden.
Erklärungen sind stabil, nachvollziehbar und nutzen Edges + Scores.
Tests mit Beispielqueries dokumentiert.

WP-04c – Feedback Logging (offen)

Status: 🟡 geplant

Ziel:
Grundlage für Self-Tuning schaffen, indem Queries, Antworten und Feedback gespeichert werden.

Umfang:

Logging von:
- Query-Text,
- Retriever-Konfiguration (Snapshot),
- Resultlisten + Scores,
- optional Benutzer-Feedback (z. B. „gut“, „daneben“),
- Kontext (Session-ID, Zeitpunkt).

Aufwand / Komplexität:

Aufwand: Mittel
Komplexität: Mittel/Hoch

DoD:

Strukturierte Logs (z. B. JSONL, DB-Collection).
Klar definierte Felder für Tuning späterer Retriever-Versionen.
Export-Funktion für Trainings-/Analysezwecke.

WP-05 – Virtual Schema Layer (neu)

Phase: B
Status: 🟡 geplant

Ziel:
Sicherstellen, dass du nicht hunderte von Markdown-Dateien neu anfassen musst, wenn neue Felder oder Typen eingeführt werden.

Idee:

Notes können unvollständig oder inkonsistent sein.
Das „logische“ Schema liegt in:
- types.yaml,
- knowledge_design.md,
- weiteren Konfigurationsdateien.
Qdrant-Payload kann Felder ergänzen, die in der Datei nicht explizit stehen.

Aufwand / Komplexität:

Aufwand: Mittel
Komplexität: Mittel

DoD:

Alle Notes lassen sich ohne Fehler importieren, auch wenn Felder fehlen.
Neue Schemafelder können ausschließlich über Config eingeführt werden.
Qdrant-Payload spiegelt das „virtuelle Schema“, ohne die Markdown-Datei zu verändern.
Abfragen können auf virtuelle Felder zugreifen.

WP-06 – Self-Healing Graph (neu)

Phase: B
Status: 🟡 geplant

Ziel:
Der Graph wird regelmäßig analysiert und automatisch verbessert.

Funktionen (Beispiele):

Erkennung von isolierten Notes/Chunks (ohne Edges).
Vorschlag oder automatische Anlage von:
- similar_to,
- related_to,
- belongs_to (z. B. zu Projekten, Leitbild, Rollen).
Verwendung von Typwissen, Embeddings und Strukturmustern.

Aufwand / Komplexität:

Aufwand: Mittel
Komplexität: Hoch

DoD:

Selbstdiagnose des Graphen (Report).
Optionale auto-fix-Funktionen (mit Sicherheitsregeln).
Self-Healing läuft inkrementell und zerstört keine bestehende Struktur.

WP-07 – Retroactive Edge Generation (neu)

Phase: B
Status: 🟡 geplant

Ziel:
Wenn dein Wissensstand wächst (z. B. Leitbild später ergänzt, neue Wertedefinitionen), sollen alte Notes automatisch mit neuen Kanten angereichert werden.

Umfang:

Clustering und Ähnlichkeitsanalyse über existierende Notes.
Erzeugung von:
- similar_to,
- thematischen related_to,
- „Wertebezügen“ (z. B. Note ↔ Wert/Prinzip).

Aufwand / Komplexität:

Aufwand: Niedrig/Mittel
Komplexität: Mittel

DoD:

Batch-Job(s) zur nachträglichen Edgenerierung.
Stabilität der entstehenden Kanten (keine Dubletten-Flut).
Kein Zwang, die ursprünglichen Markdown-Dateien zu editieren.

WP-08 – Self-Tuning (Retriever Lernen)

Phase: B
Status: 🟡 geplant

v1 – Offline Tuning

Ziel:
Anhand der geloggten Queries/Feedbacks das Scoring verbessern.

Umfang:

Analyse von:
- Queries + Label („gut/schlecht“),
- Top-k-Treffern,
- genutzten Scores.
Anpassung von:
- semantic_weight,
- edge_weight,
- weights einzelner Edge-Typen,
- Typprioritäten.

DoD:

Neue Retriever-Konfigurationen auf Basis von Logdaten.
Vergleichsmetriken, die zeigen, dass die Qualität steigt.

v2 – Semi-automatischer Optimierer

Ziel:
Ein Agent, der konkrete Konfigurationsvorschläge macht.

DoD:

Vorschlagsmodus (nicht direkt produktiv).
Human-in-the-loop Freigabe.
Sicherungsmechanismen (Rollback, Versionierung der Configs).

WP-09 – Chat→Vault & Interview-Assistent

Phase: B/C
Status: 🟡 geplant

Ziel:
Ermöglichen, dass du Wissen direkt im Chat erfassen kannst, ohne selbst Markdown zu schreiben.

Umfang:

API/Workflow:
- Chattext → Note (mit Typ, Tags, Metadaten).
- Chunking & Edges wie bei Obsidian-Notes.
Optional:
- Rückschreiben als .md in deinen Obsidian-Vault.
Später:
- Interview-Assistent, der strukturierte Fragen stellt und daraus Notes/Edges erzeugt.

Aufwand / Komplexität:

Aufwand: Mittel
Komplexität: Niedrig/Mittel

DoD:

Chat-basiertes Erzeugen von Notes voll integriert.
Optionaler Export nach Obsidian funktional.
Keine Brüche in der IDs/Edge-Logik.

WP-10 – Persönlichkeitsmodell (Identity Layer)

Phase: C
Status: 🟡 geplant

Ziel:
Deine Werte, Prinzipien, Zielbilder, biografischen Ankerpunkte und typischen Entscheidungsweisen werden in ein konsistentes Modell integriert.

Umfang:

Extraktion aus:
- Leitbild-Notes,
- Werte- und Prinzipien-Assessments,
- Entscheidungen und deren Begründungen.
Repräsentation:
- Eigene Note/Typen (z. B. identity_profile, value, principle, role).
- Edges zwischen Identitätskern und konkreten Erfahrungen/Entscheidungen.
Nutzung im Retriever und in der Entscheidungsschicht.

Aufwand / Komplexität:

Aufwand: Hoch
Komplexität: Hoch

DoD:

Klar definierter Identity-Core im Graphen.
Abfragen können explizit „aus deiner Perspektive“ beantwortet werden.
Erste einfache Identity-Evaluationsszenarien (z. B. „passt diese Option zu meinen Werten X/Y?“).

WP-11 – Decision Engine

Phase: C
Status: 🟡 geplant

Ziel:
Begründete, konsistente Entscheidungen auf Basis deiner Daten, Werte und Präferenzen.

Umfang:

Entscheidungs-Pipelines:
- Faktenlage zusammenstellen (Retriever).
- Werte/Prinzipien interpretieren.
- Alternativen generieren.
- Abwägungen begründen.
„Warum?“-Layer: jedes Urteil soll begründet sein.

Aufwand / Komplexität:

Aufwand: Hoch
Komplexität: Hoch

DoD:

Mindestens einige exemplarische Entscheidungsfälle (z. B. Trainingsplanung, Projektpriorisierung, Investitionsentscheidungen), die konsistent und erklärbar durchlaufen werden können.

WP-12 – Knowledge Rewriter (Soft Mode)

Phase: C
Status: 🟡 geplant

Ziel:
Optionaler Assistent, der vorhandene Notes „aufräumt“, zusammenfasst oder reorganisiert.

Einschränkung:

Änderungen dürfen nur nach expliziter Freigabe erfolgen.
Kein „still und leise überschreiben“.

Aufwand / Komplexität:

Aufwand: Niedrig/Mittel
Komplexität: Mittel

DoD:

Vorschlagsmodus:
- Rewriter generiert Vorschlag (neue Version).
- Diff sichtbar.
- Manueller Merge / Freigabe.
Nach Freigabe:
- konsistente IDs/Edges bleiben erhalten oder werden aktualisiert.

WP-13 – MCP Integration & Agenten-Layer

Phase: D
Status: 🟡 geplant

Ziel:
mindnet als MCP-Server bereitstellen, damit Agenten/LLMs über standardisierte Tools darauf zugreifen.

Umfang:

MCP-Server mit Tools wie:
- mindnet_query,
- mindnet_subgraph,
- mindnet_store_note,
- mindnet_explain.
Integration in deine bestehende n8n-/LLM-Umgebung.

Aufwand / Komplexität:

Aufwand: Mittel
Komplexität: Mittel

DoD:

Lokaler MCP-Server läuft.
Tools können aus einem LLM/Client heraus genutzt werden.
Sicherheits- und Loggingkonzept aufgesetzt.

WP-14 – Review / Refactoring / Dokumentation

Phase: E
Status: 🟡 geplant

Ziel:
Aufräumen, dokumentieren, stabilisieren.

Deliverables (Beispiele):

tech_architecture.md
identity_model.md
api_spec.md
mcp_integration.md
konsolidiertes Handbuch für mindnet v2.x

Aufwand / Komplexität:

Aufwand: Mittel
Komplexität: Niedrig/Mittel

DoD:

Aktueller Stand ist sauber dokumentiert.
Wichtige Designentscheidungen sind festgehalten.
Onboarding eines Dritten wäre mit dieser Dokumentation möglich.

7. Abhängigkeiten (vereinfacht)

WP01 → WP02 → WP03 → WP04a
WP04a → WP04b → WP04c → WP08
WP03 → WP05 → WP06 → WP07
WP03 → WP09
WP01/WP03 → WP10 → WP11 → WP12
WP03/WP04 → WP13
Alles → WP14

8. Laufzeit- & Komplexitätsindikatoren

WP	Aufwand	Komplexität
WP04b	Mittel	Hoch
WP04c	Mittel	Mittel/Hoch
WP05	Mittel	Mittel
WP06	Mittel	Hoch
WP07	Niedrig/Mittel	Mittel
WP08	Hoch	Hoch
WP09	Mittel	Niedrig/Mittel
WP10	Hoch	Hoch
WP11	Hoch	Hoch
WP12	Niedrig/Mittel	Mittel
WP13	Mittel	Mittel
WP14	Mittel	Niedrig/Mittel

9. Programmfortschritt (Ampel)

WP	Status
WP01	🟢
WP02	🟢
WP03	🟢
WP04a	🟢
WP04b	🟡
WP04c	🟡
WP05	🟡
WP06	🟡
WP07	🟡
WP08	🟡
WP09	🟡
WP10	🟡
WP11	🟡
WP12	🟡
WP13	🟡
WP14	🟡

10. Governance

Versionierung über Gitea (Branches, Tags, Releases).
Jede wesentliche Änderung an Architektur/Schema: eigener Commit + kurze Notiz.
Jeder WP bekommt ein eigenes Chatfenster mit dediziertem Prompt.
Programmleitung verantwortet:
- Konsistenz,
- Abhängigkeiten,
- Priorisierung,
- Dokumentation,
- Freigabe von Meilensteinen.

11. Executive Summary

mindnet v2.1 ist als Programm so aufgesetzt, dass:

du schrittweise Wissen erfassen kannst (Obsidian + Chat),
die Struktur mitwächst, ohne Retro-Massenarbeit,
ein hybrider Retriever qualitativ hochwertige, erklärbare Antworten liefert,
ein Self-Healing- und Self-Tuning-Mechanismus vorbereitet ist,
ein Persönlichkeitsmodell und eine Decision Engine aufgebaut werden,
langfristig ein KI-Zwilling entsteht, der deine Werte, Erfahrungen und Denkweise spiegelt.

Dieser Plan ist bewusst inkrementell angelegt, sodass du jederzeit starten, pausieren, erweitern kannst – ohne deine bestehenden Obsidian-Daten zerstören oder massiv umbauen zu müssen.

19 KiB Raw Blame History Unescape Escape

mindnet v2.1 — Programmplan

1. Programmauftrag

2. Vision

3. Programmziele

3.1 Kurzfristig (nächste Monate)

3.2 Mittelfristig

3.3 Langfristig

4. Architekturprinzipien

5. Programmstruktur (Phasenmodell)

6. Workpackages – Übersicht

Legende Aufwand / Komplexität

WP-01 – Wissensdesign (abgeschlossen)

WP-02 – Chunking Strategy (abgeschlossen)

WP-03 – Importer + Edge-Erzeugung (abgeschlossen)

WP-04 – Retriever & Scoring

WP-04a – Hybrider Retriever (abgeschlossen)

WP-04b – Explanation Layer (offen)

WP-04c – Feedback Logging (offen)

WP-05 – Virtual Schema Layer (neu)

WP-06 – Self-Healing Graph (neu)

WP-07 – Retroactive Edge Generation (neu)

WP-08 – Self-Tuning (Retriever Lernen)

v1 – Offline Tuning

v2 – Semi-automatischer Optimierer

WP-09 – Chat→Vault & Interview-Assistent

WP-10 – Persönlichkeitsmodell (Identity Layer)

WP-11 – Decision Engine

WP-12 – Knowledge Rewriter (Soft Mode)

WP-13 – MCP Integration & Agenten-Layer

WP-14 – Review / Refactoring / Dokumentation

7. Abhängigkeiten (vereinfacht)

8. Laufzeit- & Komplexitätsindikatoren

9. Programmfortschritt (Ampel)

10. Governance

11. Executive Summary

19 KiB

Raw Blame History