llm-api/plan_router.py aktualisiert

2025-08-13 11:47:18 +02:00 · 2025-08-13 11:47:18 +02:00 · 249f1aeea0
commit 249f1aeea0
parent 0b34b85a5a
1 changed files with 79 additions and 57 deletions
--- a/llm-api/plan_router.py
+++ b/llm-api/plan_router.py
@ -1,13 +1,12 @@
 # -*- coding: utf-8 -*-
 """
-plan_router.py – v0.13.3 (WP-15)
+plan_router.py – v0.13.4 (WP-15)

-Minimal-CRUD + List/Filter für Templates & Pläne.
-
-Änderungen ggü. v0.13.2
- /plans: Mehrseitiges Scrollen, bis mindestens offset+limit Treffer eingesammelt sind.
- Stabilisiert Zeitfenster-Filter in großen Collections; verhindert leere Resultate,
-  wenn gesuchte Items nicht auf der ersten Scroll-Seite liegen.
+Änderungen ggü. v0.13.3
+- Idempotenter POST /plan: Wenn ein Plan mit gleichem Fingerprint existiert und die neue
+  Anfrage ein späteres `created_at` trägt, wird der gespeicherte Plan mit dem neueren
+  `created_at` und `created_at_ts` aktualisiert (kein Duplikat, aber zeitlich „frisch“).
+- /plans: Mehrseitiges Scrollen bleibt aktiv; Zeitfenster-Filter robust (serverseitig + Fallback).
 """
 from fastapi import APIRouter, HTTPException, Query
 from pydantic import BaseModel, Field
@ -41,8 +40,8 @@ class TemplateSection(BaseModel):
    name: str
    target_minutes: int
    must_keywords: List[str] = []
-    ideal_keywords: List[str] = []          # wünschenswert
-    supplement_keywords: List[str] = []     # ergänzend
+    ideal_keywords: List[str] = []
+    supplement_keywords: List[str] = []
    forbid_keywords: List[str] = []
    capability_targets: Dict[str, int] = {}

@ -147,14 +146,15 @@ def _fingerprint_for_plan(p: Plan) -> str:
    raw = json.dumps(core, sort_keys=True, ensure_ascii=False)
    return hashlib.sha256(raw.encode("utf-8")).hexdigest()

-def _get_by_field(collection: str, key: str, value: Any) -> Optional[Dict[str, Any]]:
+def _get_by_field(collection: str, key: str, value: Any):
    flt = Filter(must=[FieldCondition(key=key, match=MatchValue(value=value))])
    pts, _ = qdrant.scroll(collection_name=collection, scroll_filter=flt, limit=1, with_payload=True)
    if not pts:
        return None
-    payload = dict(pts[0].payload or {})
-    payload.setdefault("id", str(pts[0].id))
-    return payload
+    point = pts[0]
+    payload = dict(point.payload or {})
+    payload.setdefault("id", str(point.id))
+    return {"id": point.id, "payload": payload}

 def _as_model(model_cls, payload: Dict[str, Any]):
    fields = getattr(model_cls, "model_fields", None) or getattr(model_cls, "__fields__", {})
@ -170,8 +170,13 @@ def _exists_in_collection(collection: str, key: str, value: Any) -> bool:
    pts, _ = qdrant.scroll(collection_name=collection, scroll_filter=flt, limit=1, with_payload=False)
    return bool(pts)

+def _parse_iso_to_ts(iso_str: str) -> float:
+    try:
+        return float(datetime.fromisoformat(iso_str.replace("Z", "+00:00")).timestamp())
+    except Exception:
+        return float(datetime.now(timezone.utc).timestamp())
+
 def _scroll_collect(collection: str, flt: Optional[Filter], need: int, page: int = 256):
-    """Scrollt mehrere Seiten und sammelt mind. `need` Punkte ein (oder bis keine mehr kommen)."""
    out = []
    offset = None
    page = max(1, min(page, 1024))
@ -231,7 +236,7 @@ def get_plan_template(tpl_id: str):
    found = _get_by_field(PLAN_TEMPLATE_COLLECTION, "id", tpl_id)
    if not found:
        raise HTTPException(status_code=404, detail="not found")
-    return _as_model(PlanTemplate, found)
+    return _as_model(PlanTemplate, found["payload"])

@router.get(
    "/plan_templates",
@ -271,18 +276,10 @@ def list_plan_templates(
    if goal:
        must.append(FieldCondition(key="goals", match=MatchValue(value=goal)))
    if keyword:
-        for k in (
-            "section_must_keywords",
-            "section_ideal_keywords",
-            "section_supplement_keywords",
-            "section_forbid_keywords",
-        ):
+        for k in ("section_must_keywords","section_ideal_keywords","section_supplement_keywords","section_forbid_keywords"):
            should.append(FieldCondition(key=k, match=MatchValue(value=keyword)))

-    flt = None
-    if must or should:
-        flt = Filter(must=must or None, should=should or None)
-
+    flt = Filter(must=must or None, should=should or None) if (must or should) else None
    need = max(offset + limit, 1)
    pts = _scroll_collect(PLAN_TEMPLATE_COLLECTION, flt, need)
    items: List[PlanTemplate] = []
@ -302,7 +299,7 @@ def list_plan_templates(
    description=(
        "Erstellt einen konkreten Trainingsplan.\n\n"
        "Idempotenz: gleicher Fingerprint (title + items) → gleicher Plan (kein Duplikat).\n"
-        "Optional: Validierung von template_id und Exercises (Strict-Mode)."
+        "Bei erneutem POST mit späterem `created_at` wird `created_at`/`created_at_ts` des bestehenden Plans aktualisiert."
    ),
 )
 def create_plan(p: Plan):
@ -324,19 +321,13 @@ def create_plan(p: Plan):
        if missing:
            raise HTTPException(status_code=422, detail={"error": "unknown exercise_external_id", "missing": sorted(set(missing))})

-    # Fingerprint + Idempotenz
+    # Fingerprint
    fp = _fingerprint_for_plan(p)
    p.fingerprint = p.fingerprint or fp
-    existing = _get_by_field(PLAN_COLLECTION, "fingerprint", p.fingerprint)
-    if existing:
-        return _as_model(Plan, existing)

-    # Normalisieren + Materialisierung
-    p.goals = _norm_list(p.goals)
-    payload = p.model_dump()
-
-    # created_at → ISO + numerischer Zeitstempel (FLOAT)
-    dt = payload.get("created_at")
+    # Ziel-ISO + TS aus Request berechnen (auch wenn Duplikat)
+    req_payload = p.model_dump()
+    dt = req_payload.get("created_at")
    if isinstance(dt, datetime):
        dt = dt.astimezone(timezone.utc).isoformat()
    elif isinstance(dt, str):
@ -346,22 +337,53 @@ def create_plan(p: Plan):
            dt = datetime.now(timezone.utc).isoformat()
    else:
        dt = datetime.now(timezone.utc).isoformat()
-    payload["created_at"] = dt
-    try:
-        ts = datetime.fromisoformat(dt.replace("Z", "+00:00")).timestamp()
-    except Exception:
-        ts = datetime.now(timezone.utc).timestamp()
-    payload["created_at_ts"] = float(ts)
+    req_payload["created_at"] = dt
+    req_ts = _parse_iso_to_ts(dt)
+    req_payload["created_at_ts"] = float(req_ts)

-    # Materialisierte Section-Namen (robuste Filter/Indizes)
-    try:
-        payload["plan_section_names"] = _norm_list([
-            (s.get("name") or "").strip() for s in (payload.get("sections") or []) if isinstance(s, dict)
-        ])
-    except Exception:
-        payload["plan_section_names"] = _norm_list([
-            (getattr(s, "name", "") or "").strip() for s in (p.sections or [])
-        ])
+    # Dup-Check
+    existing = _get_by_field(PLAN_COLLECTION, "fingerprint", p.fingerprint)
+    if existing:
+        # Falls neues created_at später ist → gespeicherten Plan aktualisieren
+        cur = existing["payload"]
+        cur_ts = cur.get("created_at_ts")
+        if cur_ts is None:
+            cur_ts = _parse_iso_to_ts(str(cur.get("created_at", dt)))
+        if req_ts > float(cur_ts):
+            try:
+                qdrant.set_payload(
+                    collection_name=PLAN_COLLECTION,
+                    payload={"created_at": req_payload["created_at"], "created_at_ts": req_payload["created_at_ts"]},
+                    points=[existing["id"]],
+                )
+                # Antwort-Objekt aktualisieren
+                cur["created_at"] = req_payload["created_at"]
+                cur["created_at_ts"] = req_payload["created_at_ts"]
+            except Exception:
+                pass
+        return _as_model(Plan, cur)
+
+    # Neu anlegen
+    p.goals = _norm_list(p.goals)
+    payload = req_payload  # enthält bereits korrektes created_at + created_at_ts
+    payload.update({
+        "id": p.id,
+        "template_id": p.template_id,
+        "title": p.title,
+        "discipline": p.discipline,
+        "age_group": p.age_group,
+        "target_group": p.target_group,
+        "total_minutes": p.total_minutes,
+        "sections": [s.model_dump() for s in p.sections],
+        "goals": _norm_list(p.goals),
+        "capability_summary": p.capability_summary,
+        "novelty_against_last_n": p.novelty_against_last_n,
+        "fingerprint": p.fingerprint,
+        "created_by": p.created_by,
+        "source": p.source,
+    })
+    # Section-Namen materialisieren
+    payload["plan_section_names"] = _norm_list([ (s.get("name") or "").strip() for s in (payload.get("sections") or []) if isinstance(s, dict) ])

    vec = _embed(_plan_embed_text(p))
    qdrant.upsert(collection_name=PLAN_COLLECTION, points=[PointStruct(id=str(p.id), vector=vec, payload=payload)])
@ -378,12 +400,13 @@ def get_plan(plan_id: str):
    found = _get_by_field(PLAN_COLLECTION, "id", plan_id)
    if not found:
        raise HTTPException(status_code=404, detail="not found")
-    if isinstance(found.get("created_at"), str):
+    payload = found["payload"]
+    if isinstance(payload.get("created_at"), str):
        try:
-            found["created_at"] = datetime.fromisoformat(found["created_at"])
+            payload["created_at"] = datetime.fromisoformat(payload["created_at"])
        except Exception:
            pass
-    return _as_model(Plan, found)
+    return _as_model(Plan, payload)

@router.get(
    "/plans",
@ -457,13 +480,12 @@ def list_plans(
    def _in_window(py: Dict[str, Any]) -> bool:
        if not (created_from or created_to):
            return True
-        # Wenn serverseitig Range aktiv war und Treffer kamen, brauchen wir keinen lokalen Check
        if applied_server_range and not fallback_local_time_check:
-            return True
+            return True  # serverseitig bereits gefiltert
        ts = py.get("created_at")
        if isinstance(ts, dict) and ts.get("$date"):
            ts = ts["$date"]
-        if isinstance(ts, (int, float)) and py.get("created_at_ts") is not None:
+        if isinstance(py.get("created_at_ts"), (int, float)):
            dt = datetime.fromtimestamp(float(py["created_at_ts"]), tz=timezone.utc)
        elif isinstance(ts, str):
            try: