23 lines
1.4 KiB
Markdown
23 lines
1.4 KiB
Markdown
# Lastenheft: Consultancy Intelligence Agent (CIA)
|
|
**Status:** Initial | **Datum:** 31.01.2026 | **Rolle:** Solution Architecture
|
|
|
|
## 1. Zielsetzung
|
|
Automatisierte Überwachung, Extraktion und Analyse von Publikationen führender Unternehmensberatungen (z.B. McKinsey, BCG, Bain). Das System soll Wissen lokal sichern, strukturieren und für komplexe Abfragen (RAG) bereitstellen.
|
|
|
|
## 2. Funktionale Anforderungen (FA)
|
|
* **FA-01: Dynamische Discovery:** Automatisches Finden von Publikations-URLs basierend auf Basis-Domains.
|
|
* **FA-02: Web-Scraping:** Extraktion von Inhalten unter Umgehung von API-Kosten durch lokale Headless-Browser.
|
|
* **FA-03: PDF-Management:** Download, OCR-Verarbeitung und lokale Speicherung auf Ubuntu Server.
|
|
* **FA-04: Metadaten-Extraktion:** Identifikation von Datum, Autoren, Tags und Erstellung eines Abstracts via Ollama.
|
|
* **FA-05: Vector-Storage:** Indizierung der Inhalte in Qdrant für semantische Suche.
|
|
|
|
## 3. Nicht-funktionale Anforderungen (NFA)
|
|
* **NFA-01: Local-First:** Primäre Nutzung lokaler Ressourcen (Ollama, Ubuntu, Qdrant).
|
|
* **NFA-02: Kosteneffizienz:** Minimierung von API-Calls durch Web-Scraping und lokale Modelle.
|
|
* **NFA-03: Modularität:** Einfaches Hinzufügen neuer Beratungsanbieter über n8n-Nodes.
|
|
|
|
## 4. Ziel-Infrastruktur
|
|
* **Orchestrator:** n8n (lokal)
|
|
* **LLM:** Ollama (lokal) & OpenRouter (Fallback/Reasoning)
|
|
* **Vector DB:** Qdrant (lokal)
|
|
* **Development:** Cursor & Gitea |