feat: enhance formatting and normalization of activity metrics

- Introduced `format_scalar_for_prompt_text` function to standardize the representation of scalar values in activity summaries and details. - Updated `get_activity_summary` and `get_activity_detail` functions to utilize the new formatting for improved readability. - Added normalization for float values in session metrics to prevent excessively long representations. - Enhanced unit tests to verify the new formatting and normalization behavior.
2026-04-18 10:32:29 +02:00 · 2026-04-18 10:32:29 +02:00 · 178534e9eb
commit 178534e9eb
parent 6756dc60f3
5 changed files with 103 additions and 4 deletions
--- a/backend/data_layer/activity_session_metrics.py
+++ b/backend/data_layer/activity_session_metrics.py
@ -13,9 +13,31 @@ from data_layer.activity_data_canon import (
    ACTIVITY_LOG_LEGACY_COLUMN_FOR_EAV_PRIMARY_PARAM,
    ACTIVITY_MODULE_REGISTRY_FIELD_KEYS,
 )
 from data_layer.prompt_output_compact import normalize_prompt_number
 logger = logging.getLogger(__name__)
 def _normalize_metric_value_for_read(data_type: str, val: Any) -> Any:
    """Lesepfad (Layer 1): keine unnötig langen Float-Strings für KI/UI (Issue 53 / Platzhalter)."""
    if val is None:
        return None
    dt = (data_type or "").strip().lower()
    if dt == "string":
        return val
    if dt == "boolean":
        return bool(val)
    if dt == "integer":
        try:
            if isinstance(val, bool):
                return int(val)
            return int(val)
        except (TypeError, ValueError):
            return normalize_prompt_number(val)
    if dt == "float":
        return normalize_prompt_number(val)
    return normalize_prompt_number(val)
 # Diese Spalten nicht aus CSV-Parameter-Zuordnung überschreiben (kommen aus Typ-Mapping / System).
 ACTIVITY_LOG_PATCH_FORBIDDEN = frozenset(
    {
@ -430,6 +452,8 @@ def merge_column_backed_and_eav_metrics(
            keys_handled.add(k)
    merged.sort(key=lambda x: x["key"])
    for m in merged:
        m["value"] = _normalize_metric_value_for_read(m.get("data_type") or "", m.get("value"))
    return merged
--- a/backend/data_layer/prompt_output_compact.py
+++ b/backend/data_layer/prompt_output_compact.py
@ -70,6 +70,31 @@ def compact_json_payload_for_prompts(obj: Any) -> Any:
    return normalize_prompt_number(obj)
 def format_scalar_for_prompt_text(x: Any) -> str:
    """
    Kurzdarstellung für Text-Platzhalter (activity_detail, Tabellen, …).
    Nutzt dieselbe Komprimierung wie JSON (normalize_prompt_number).
    """
    if x is None:
        return "—"
    if isinstance(x, bool):
        return "ja" if x else "nein"
    if isinstance(x, str):
        return x
    n = normalize_prompt_number(x)
    if isinstance(n, bool):
        return "ja" if n else "nein"
    if isinstance(n, int) and not isinstance(n, bool):
        return str(n)
    if isinstance(n, float):
        if not math.isfinite(n):
            return str(n)
        if abs(n - round(n)) < 1e-9:
            return str(int(round(n)))
        return str(n)
    return str(n)
 def session_metrics_list_to_key_value_compact(metrics: list[Any] | None) -> dict[str, Any]:
    """
    Session-Metriken für KI-JSON: nur key → Wert (keine wiederholten Namen/Beschreibungen).
--- a/backend/placeholder_resolver.py
+++ b/backend/placeholder_resolver.py
@ -28,6 +28,8 @@ from data_layer.nutrition_metrics import (
    get_nutrition_days_data,
    get_protein_targets_data
 )
 from data_layer.prompt_output_compact import format_scalar_for_prompt_text
 from data_layer.activity_metrics import (
    get_activity_summary_data,
    get_activity_detail_data,
@ -350,7 +352,11 @@ def get_activity_summary(profile_id: str, days: int = 14) -> str:
    if data['confidence'] == 'insufficient':
        return f"Keine Aktivitäten in den letzten {days} Tagen"
-    return f"{data['activity_count']} Einheiten in {days} Tagen (Ø {data['avg_duration_min']} min/Einheit, {data['total_kcal']} kcal gesamt)"
+    return (
        f"{data['activity_count']} Einheiten in {days} Tagen (Ø "
        f"{format_scalar_for_prompt_text(data['avg_duration_min'])} min/Einheit, "
        f"{format_scalar_for_prompt_text(data['total_kcal'])} kcal gesamt)"
    )
 def calculate_age(dob) -> str:
@ -423,18 +429,23 @@ def get_activity_detail(profile_id: str, days: int = 14) -> str:
    # Format as readable list (max 20 entries to avoid token bloat)
    lines = []
    for activity in data["activities"][:20]:
-        hr_str = f", HF={activity['hr_avg']}" if activity.get("hr_avg") else ""
+        hr_str = (
            f", HF={format_scalar_for_prompt_text(activity['hr_avg'])}"
            if activity.get("hr_avg") is not None
            else ""
        )
        eav_parts = []
        for m in activity.get("session_metrics") or []:
            k, v = m.get("key"), m.get("value")
            if k is None or v is None:
                continue
            label = m.get("name_de") or m.get("name_en") or k
-            eav_parts.append(f"{label} ({k})={v}")
+            eav_parts.append(f"{label} ({k})={format_scalar_for_prompt_text(v)}")
        eav_str = f" | EAV: {'; '.join(eav_parts)}" if eav_parts else ""
        lines.append(
            f"{activity['date']}: {activity['activity_type']} "
-            f"({activity['duration_min']}min, {activity['kcal_active']}kcal{hr_str}{eav_str})"
+            f"({format_scalar_for_prompt_text(activity['duration_min'])}min, "
            f"{format_scalar_for_prompt_text(activity['kcal_active'])}kcal{hr_str}{eav_str})"
        )
    return "\n".join(lines)
--- a/backend/tests/test_activity_session_metrics.py
+++ b/backend/tests/test_activity_session_metrics.py
@ -121,6 +121,38 @@ def test_merge_parameter_schema_includes_descriptions():
    assert merged[0]["description_en"] == "5 min average power"
 def test_merge_eav_float_value_normalized_no_long_tail():
    """Layer 1: lange Floats (z. B. kcal_per_km) für Lesepfad kompakt."""
    schema = [
        {
            "training_parameter_id": 1,
            "key": "kcal_per_km",
            "data_type": "float",
            "unit": "kcal/km",
            "validation_rules": {},
            "source_field": None,
            "name_de": "Kcal/km",
            "name_en": "kcal/km",
            "description_de": None,
            "description_en": None,
            "param_category": "performance",
        }
    ]
    eav = [
        {
            "training_parameter_id": 1,
            "key": "kcal_per_km",
            "data_type": "float",
            "unit": "kcal/km",
            "value": 51.5818181818181818,
        }
    ]
    out = merge_column_backed_and_eav_metrics({}, schema, eav)
    assert len(out) == 1
    v = out[0]["value"]
    assert "581818" not in repr(v)
 def test_merge_column_backed_includes_human_labels_from_schema():
    schema = [
        {
--- a/backend/tests/test_prompt_output_compact.py
+++ b/backend/tests/test_prompt_output_compact.py
@ -5,6 +5,7 @@ import pytest
 from data_layer.prompt_output_compact import (
    compact_float_for_prompt,
    compact_json_payload_for_prompts,
    format_scalar_for_prompt_text,
    normalize_prompt_number,
    session_metrics_list_to_key_value_compact,
 )
@ -38,6 +39,12 @@ def test_compact_json_nested():
    assert out["d"][0] == 1.11
 def test_format_scalar_no_long_float_tail():
    s = format_scalar_for_prompt_text(51.5818181818181818)
    assert "181818" not in s
    assert len(s) <= 8
 def test_session_metrics_key_value_only():
    sm = [
        {