ResearchAgent/docs/backlog.md
2026-01-31 12:11:16 +01:00

23 lines
1.0 KiB
Markdown

# Projekt-Backlog: CIA
## Epics & User Stories
### [EP-01] Infrastruktur & Core (Prio: Hoch)
* **ST-01:** Setup Docker-Compose für Qdrant, n8n und Python-Worker. (Draft vorhanden)
* **ST-02:** Einrichtung Gitea-Repository und Webhook-Anbindung an n8n.
* **ST-03:** Konfiguration der Konnektivität zwischen n8n und lokalem Ollama.
### [EP-02] The Scout (Discovery) (Prio: Hoch)
* **ST-04:** Entwicklung eines Moduls zur dynamischen Identifikation von News-Sektionen.
* **ST-05:** Implementierung eines RSS/Sitemap-Scanners in n8n.
### [EP-03] The Harvester (Extraction) (Prio: Mittel)
* **ST-06:** PDF-Download-Logik mit Retries und User-Agent-Rotation.
* **ST-07:** OCR-Pipeline für nicht-durchsuchbare PDFs (Tesseract/OCRmyPDF).
### [EP-04] The Analyst (Intelligence) (Prio: Mittel)
* **ST-08:** Prompt-Engineering für Abstracts und Kategorisierung via Ollama.
* **ST-09:** Qdrant-Schema Definition und Embedding-Pipeline.
### [EP-05] The Consultant (Application) (Prio: Niedrig)
* **ST-10:** RAG-Interface für vergleichende Fragen (z.B. McKinsey vs. BCG Themen).