# Projekt-Backlog: CIA ## Epics & User Stories ### [EP-01] Infrastruktur & Core (Prio: Hoch) * **ST-01:** Setup Docker-Compose für Qdrant, n8n und Python-Worker. (Draft vorhanden) * **ST-02:** Einrichtung Gitea-Repository und Webhook-Anbindung an n8n. * **ST-03:** Konfiguration der Konnektivität zwischen n8n und lokalem Ollama. ### [EP-02] The Scout (Discovery) (Prio: Hoch) * **ST-04:** Entwicklung eines Moduls zur dynamischen Identifikation von News-Sektionen. * **ST-05:** Implementierung eines RSS/Sitemap-Scanners in n8n. ### [EP-03] The Harvester (Extraction) (Prio: Mittel) * **ST-06:** PDF-Download-Logik mit Retries und User-Agent-Rotation. * **ST-07:** OCR-Pipeline für nicht-durchsuchbare PDFs (Tesseract/OCRmyPDF). ### [EP-04] The Analyst (Intelligence) (Prio: Mittel) * **ST-08:** Prompt-Engineering für Abstracts und Kategorisierung via Ollama. * **ST-09:** Qdrant-Schema Definition und Embedding-Pipeline. ### [EP-05] The Consultant (Application) (Prio: Niedrig) * **ST-10:** RAG-Interface für vergleichende Fragen (z.B. McKinsey vs. BCG Themen).