4.4 KiB
4.4 KiB
| doc_type | audience | status | context |
|---|---|---|---|
| archive | historian, architect | archived | Archivierte Details zu abgeschlossenen Workpackages (WP01-WP19). Referenz für historische Design-Entscheidungen. |
Legacy Workpackages (Archiv)
Quellen: Programmplan_V2.2.md, Active Roadmap
Status: Abgeschlossen / Implementiert. Dieses Dokument dient als Referenz für die Entstehungsgeschichte von Mindnet v2.6.
Phase A: Fundament (WP01-03)
WP-01 – Wissensdesign
- Ziel: Definition der Datenstruktur.
- Ergebnis: Entscheidung gegen komplexe Ontologien (RDF/OWL), für pragmatische Typen (
project,concept). Definition der YAML-Frontmatter-Pflichtfelder. - Artefakt:
01_knowledge_design.md.
WP-02 – Chunking & Hash-Strategie
- Ziel: Texte suchbar machen und Änderungen erkennen.
- Ergebnis: Implementierung des
SlidingWindowChunker. Einführung von UUIDv5 für deterministische IDs. - Learning: Starre Chunking-Grenzen zerschneiden oft den Kontext. Daher Einführung von Overlap (50 Tokens).
WP-03 – Import-Pipeline & Edge-System
- Ziel: Markdown in Vektoren wandeln.
- Ergebnis: Der "Importer" (
import_markdown.py). Entscheidung, Kanten (_edges) als eigene Collection zu führen statt als Payload in Chunks (für bessere Graphen-Algorithmen wie Centrality).
Phase B: Semantik (WP04)
WP-04a – Retriever & Graph-Scoring
- Ziel: Bessere Suchergebnisse als reines Vektor-Matching.
- Ergebnis: Die Formel
Score = Semantik + GraphBonus + TypGewicht. - Learning: Reine Vektorsuche reichte nicht, um den Kontext ("Warum ist das wichtig?") zu erfassen. Der "Graph Bonus" war der Durchbruch für assoziatives Finden.
WP-04b – Explanation Layer ("Why-Layer")
- Ziel: Transparenz.
- Ergebnis:
explain=TrueParameter. Die API liefert menschenlesbare Gründe ("Gefunden, weil Projekt Alpha davon abhängt").
WP-04c – Feedback Logging
- Ziel: Datenbasis für zukünftiges Lernen schaffen.
- Ergebnis: Das "Data Flywheel". Jede Suche und Bewertung wird in JSONL-Dateien geloggt (
search_history.jsonl,feedback.jsonl).
Phase C: Persönlichkeit (WP05-07)
WP-05 – RAG-Chat
- Ziel: Natürliche Sprache statt Suchergebnisse.
- Ergebnis: Integration von Ollama (
phi3). - Tech: Prompt-Engineering (
prompts.yaml) statt Fine-Tuning, um flexibel zu bleiben.
WP-06 – Decision Engine
- Ziel: Strategische Beratung statt nur Fakten.
- Ergebnis: Der Hybrid Router.
- Konzept: Unterscheidung von Fragen (RAG) und Handlungen (Interview). Strategisches Laden von Werten (
type: value), um Entscheidungen moralisch zu begründen.
WP-07 – Interview-Assistent
- Ziel: Bekämpfung des "Writer's Block".
- Ergebnis: One-Shot Extraction. Der Chatbot generiert aus einem losen Satz ("Neues Projekt Alpha") einen strukturierten Markdown-Draft.
Phase D: Interaktion (WP10-15)
WP-10/10a – Web UI & Draft Editor
- Ziel: Usability für Nicht-Techniker.
- Ergebnis: Streamlit App. Ablösung des Terminals.
- Feature: "Healing Parser", der defektes JSON vom LLM repariert.
WP-11 – Backend Intelligence
- Ziel: Automatisierung der Vernetzung.
- Ergebnis: AsyncIO Umstellung für Performance. Einführung von
nomic-embed-text(768d) für präzise Semantik. Matrix-Logik für automatische Kanten-Typisierung.
WP-15 – Smart Edge Allocation (Meilenstein)
- Problem: "Broadcasting". Ein Chunk erbte alle Links der Note, auch irrelevante. Das verwässerte die Suchergebnisse.
- Lösung: LLM prüft jeden Chunk auf Link-Relevanz.
- Tech: Einführung von Traffic Control (Semaphore), um Import und Chat zu parallelisieren, ohne die Hardware zu überlasten.
Phase E: Visualisierung & Maintenance (WP19)
WP-19 – Graph Visualisierung & Modularisierung
- Ziel: Transparenz über die Datenstruktur schaffen und technische Schulden (Monolith) abbauen.
- Ergebnis:
- Modularisierung: Aufsplittung der
ui.pyin Router, Services und Views (ui_*.py). - Graph Explorer: Einführung von
st-cytoscapefür stabile, nicht-überlappende Layouts (COSE) als Ergänzung zur Legacy-Engine (Agraph). - Single Source of Truth: Der Editor lädt Inhalte nun direkt vom Dateisystem statt aus (potenziell veralteten) Vektor-Payloads.
- UX: Einführung von URL-Persistenz für Layout-Settings und CSS-basiertes Highlighting zur Vermeidung von Re-Renders.
- Modularisierung: Aufsplittung der