ResearchAgent/docs/requirements_specs.md
2026-01-31 12:11:16 +01:00

23 lines
1.4 KiB
Markdown

# Lastenheft: Consultancy Intelligence Agent (CIA)
**Status:** Initial | **Datum:** 31.01.2026 | **Rolle:** Solution Architecture
## 1. Zielsetzung
Automatisierte Überwachung, Extraktion und Analyse von Publikationen führender Unternehmensberatungen (z.B. McKinsey, BCG, Bain). Das System soll Wissen lokal sichern, strukturieren und für komplexe Abfragen (RAG) bereitstellen.
## 2. Funktionale Anforderungen (FA)
* **FA-01: Dynamische Discovery:** Automatisches Finden von Publikations-URLs basierend auf Basis-Domains.
* **FA-02: Web-Scraping:** Extraktion von Inhalten unter Umgehung von API-Kosten durch lokale Headless-Browser.
* **FA-03: PDF-Management:** Download, OCR-Verarbeitung und lokale Speicherung auf Ubuntu Server.
* **FA-04: Metadaten-Extraktion:** Identifikation von Datum, Autoren, Tags und Erstellung eines Abstracts via Ollama.
* **FA-05: Vector-Storage:** Indizierung der Inhalte in Qdrant für semantische Suche.
## 3. Nicht-funktionale Anforderungen (NFA)
* **NFA-01: Local-First:** Primäre Nutzung lokaler Ressourcen (Ollama, Ubuntu, Qdrant).
* **NFA-02: Kosteneffizienz:** Minimierung von API-Calls durch Web-Scraping und lokale Modelle.
* **NFA-03: Modularität:** Einfaches Hinzufügen neuer Beratungsanbieter über n8n-Nodes.
## 4. Ziel-Infrastruktur
* **Orchestrator:** n8n (lokal)
* **LLM:** Ollama (lokal) & OpenRouter (Fallback/Reasoning)
* **Vector DB:** Qdrant (lokal)
* **Development:** Cursor & Gitea