# tests/test_smart_chunking_integration.py import asyncio import unittest import os import sys from pathlib import Path from typing import List, Dict import time import threading # Import für die Thread-basierte Schließung # --- PFAD-KORREKTUR --- ROOT_DIR = Path(__file__).resolve().parent.parent sys.path.insert(0, str(ROOT_DIR)) # ---------------------- # Import der Kernkomponenten from app.core import chunker from app.core import derive_edges # Import der benötigten Klasse SemanticAnalyzer from app.services.semantic_analyzer import SemanticAnalyzer # 1. Definieren der Test-Note (Simuliert eine journal.md Datei) TEST_NOTE_ID = "20251211-journal-sem-test" TEST_NOTE_TYPE = "journal" TEST_MARKDOWN = """ --- id: 20251211-journal-sem-test title: Tägliches Log - Semantischer Test type: journal status: active created: 2025-12-11 tags: [test, daily-log] --- # Log-Eintrag 2025-12-11 Heute war ein guter Tag. Zuerst habe ich mit der R1 Meditation begonnen, um meinen Nordstern Fokus zu klären. Das Ritual [[leitbild-rituale-system]] hat mir geholfen, ruhig in den Tag zu starten. Ich habe gespürt, wie wichtig meine [[leitbild-werte#Integrität]] für meine Entscheidungen ist. Das ist das Fundament. Am Nachmittag gab es einen Konflikt bei der Karate-Trainer-Ausbildung. Ein Schüler war uneinsichtig. Ich habe die Situation nach [[leitbild-prinzipien#P4 Gerechtigkeit & Fairness]] behandelt und beide Seiten gehört (Steelman). Das war anstrengend, aber ich habe meine [[leitbild-rollen#Karate-Trainer]] Mission erfüllt. Die Konsequenz war klar und ruhig. Abends habe ich den wöchentlichen Load-Check mit meinem Partner gemacht. Das Paar-Ritual [[leitbild-rituale-system#R5]] hilft, das Ziel [[leitbild-ziele-portfolio#Nordstern Partner]] aktiv zu verfolgen. Es ist der operative Rhythmus für uns beide. """ # --- HILFSFUNKTION FÜR DAS ASYNCHRONE SCHLIESSEN IN SYNCHRONER UMGEBUNG --- # Dies löst den Event Loop is closed Fehler in Python 3.12+ def run_async_in_new_loop(coro): """Führt eine Koroutine in einem neuen, temporären asyncio-Loop aus.""" loop = asyncio.new_event_loop() asyncio.set_event_loop(loop) try: return loop.run_until_complete(coro) finally: loop.close() asyncio.set_event_loop(asyncio.new_event_loop()) # Setzt den Loop zurück class TestSemanticChunking(unittest.TestCase): _analyzer_instance = None @classmethod def setUpClass(cls): """Initialisiert den SemanticAnalyzer einmalig.""" # WICHTIG: Die Instanz muss erzeugt werden, bevor der erste async-Call läuft. cls._analyzer_instance = SemanticAnalyzer() # Stellt sicher, dass der Chunker diese Singleton-Instanz verwendet chunker._semantic_analyzer_instance = cls._analyzer_instance @classmethod def tearDownClass(cls): """Schließt den httpx.AsyncClient nach allen Tests (Löst Loop-Konflikt).""" if cls._analyzer_instance: # Wir führen die async close Methode in einem neuen Loop aus run_async_in_new_loop(cls._analyzer_instance.close()) def setUp(self): self.config = chunker.get_chunk_config(TEST_NOTE_TYPE) def test_a_strategy_selection(self): """Prüft, ob die Strategie 'semantic_llm' für den Typ 'journal' gewählt wird.""" self.assertEqual(self.config['strategy'], 'semantic_llm', "Fehler: 'journal' sollte die Strategie 'semantic_llm' nutzen.") def test_b_llm_chunking_and_injection(self): """ Prüft den gesamten End-to-End-Flow: 1. LLM-Chunking, 2. Kanten-Injektion, 3. Kanten-Erkennung. """ # --- 1. Chunking (Asynchron) --- chunks = asyncio.run(chunker.assemble_chunks( note_id=TEST_NOTE_ID, md_text=TEST_MARKDOWN, note_type=TEST_NOTE_TYPE )) print(f"\n--- LLM Chunker Output: {len(chunks)} Chunks ---") # Assertion B1: Zerlegung (Das LLM muss mehr als 1 Chunk liefern) # Die LLM-Stabilität ist das Problem. Wir prüfen auf erfolgreiche Zerlegung. self.assertTrue(len(chunks) > 1, "Assertion B1 Fehler: LLM hat nicht zerlegt (Fallback aktiv). Prüfe LLM-Stabilität.") # --- 2. Injektion prüfen --- chunk_1_text = chunks[0].text self.assertIn("[[rel:", chunk_1_text, "Assertion B2 Fehler: Der Chunk-Text muss die injizierte [[rel: Kante enthalten.") # --- 3. Kanten-Derivation (Synchron) --- edges = derive_edges.build_edges_for_note( note_id=TEST_NOTE_ID, chunks=[c.__dict__ for c in chunks] ) print(f"--- Edge Derivation Output: {len(edges)} Kanten ---") # Assertion B3: Mindestens 3 LLM-Kanten (inline:rel) llm_generated_edges = [ e for e in edges if e.get('rule_id') == 'inline:rel' and e.get('source_id').startswith(TEST_NOTE_ID + '#sem') ] self.assertTrue(len(llm_generated_edges) >= 3, "Assertion B3 Fehler: Es wurden weniger als 3 semantische Kanten gefunden.") # Assertion B4: Check für die Matrix-Logik / Werte-Kante has_matrix_kante = any( e['target_id'].startswith('leitbild-werte') and e['kind'] in ['based_on', 'derived_from'] for e in llm_generated_edges ) self.assertTrue(has_matrix_kante, "Assertion B4 Fehler: Die Matrix-Logik / Werte-Kante wurde nicht erkannt.") print("\n✅ Integrationstest für Semantic Chunking erfolgreich.") def test_c_draft_status_prevention(self): """Prüft, ob 'draft' Status semantic_llm auf by_heading überschreibt.""" DRAFT_MARKDOWN = TEST_MARKDOWN.replace("status: active", "status: draft") # 1. Chunking mit Draft Status chunks = asyncio.run(chunker.assemble_chunks( note_id=TEST_NOTE_ID, md_text=DRAFT_MARKDOWN, note_type=TEST_NOTE_TYPE )) # 2. Prüfen der Chunker-IDs self.assertFalse(chunks[0].id.startswith(TEST_NOTE_ID + '#sem'), "Assertion C1 Fehler: LLM-Chunking wurde für den Status 'draft' nicht verhindert.") self.assertTrue(chunks[0].id.startswith(TEST_NOTE_ID + '#c'), "Assertion C2 Fehler: Fallback-Strategie 'by_heading' wurde nicht korrekt ausgeführt.") print(f"\n✅ Prevention Test: Draft-Status hat LLM-Chunking verhindert (Fallback ID: {chunks[0].id}).") if __name__ == '__main__': print("Starte den Semantic Chunking Integrationstest.") unittest.main()