app/services/embeddings_client.py hinzugefügt

2025-10-07 13:34:27 +02:00 · 2025-10-07 13:34:27 +02:00 · 26ef257e06
commit 26ef257e06
parent 6864ea7b53
1 changed files with 46 additions and 0 deletions
--- a/app/services/embeddings_client.py
+++ b/app/services/embeddings_client.py
@ -0,0 +1,46 @@
 """
 app/services/embeddings_client.py — Text→Embedding (WP-04)
 Zweck:
    Liefert 384-d Embeddings für Textqueries (lazy load, einmal pro Prozess).
    Standard: Sentence-Transformers (MODEL_NAME aus app.config.Settings).
    Hinweis: Kein Netz-Zugriff; nutzt lokal installierte Modelle.
 Kompatibilität:
    Python 3.12+, sentence-transformers 5.x
 Version:
    0.1.0  (Erstanlage)
 Stand:
    2025-10-07
 Bezug:
    - app/core/retriever.py (nutzt embed_text_if_needed)
    - app/config.py (MODEL_NAME, VECTOR_SIZE)
 Nutzung:
    from app.services.embeddings_client import embed_text
 Änderungsverlauf:
    0.1.0 (2025-10-07) – Erstanlage.
 """
 from __future__ import annotations
 from typing import List
 from functools import lru_cache
 from app.config import get_settings
 # Lazy import, damit Testläufe ohne Modell-Laden schnell sind
 def _load_model():
    from sentence_transformers import SentenceTransformer  # import hier, nicht top-level
    s = get_settings()
    return SentenceTransformer(s.MODEL_NAME, device="cpu")
@lru_cache(maxsize=1)
 def _cached_model():
    return _load_model()
 def embed_text(text: str) -> List[float]:
    """
    Erzeugt einen 384-d Vektor (oder laut Settings.VECTOR_SIZE) für den gegebenen Text.
    """
    if not text or not text.strip():
        raise ValueError("embed_text: leerer Text")
    model = _cached_model()
    vec = model.encode([text], normalize_embeddings=True)[0]
    return vec.astype(float).tolist()