feat(simulation): stabilize IPC layer and verify full workflow

2026-02-23 19:53:32 -05:00
parent ba97ccda3c
commit 8bd280efc1
5 changed files with 205 additions and 32 deletions
--- a/api_hook_client.py
+++ b/api_hook_client.py
@@ -3,7 +3,7 @@ import json
 import time
 class ApiHookClient:
-    def __init__(self, base_url="http://127.0.0.1:8999", max_retries=3, retry_delay=1):
+    def __init__(self, base_url="http://127.0.0.1:8999", max_retries=5, retry_delay=2):
        self.base_url = base_url
        self.max_retries = max_retries
        self.retry_delay = retry_delay
@@ -29,9 +29,9 @@ class ApiHookClient:
        for attempt in range(self.max_retries + 1):
            try:
                if method == 'GET':
-                    response = requests.get(url, timeout=2)
+                    response = requests.get(url, timeout=5)
                elif method == 'POST':
-                    response = requests.post(url, json=data, headers=headers, timeout=2)
+                    response = requests.post(url, json=data, headers=headers, timeout=5)
                else:
                    raise ValueError(f"Unsupported HTTP method: {method}")
@@ -108,15 +108,28 @@ class ApiHookClient:
            "value": value
        })
-    def click(self, item):
+    def click(self, item, *args, **kwargs):
        """Simulates a click on a GUI button or item."""
        user_data = kwargs.pop('user_data', None)
        return self.post_gui({
            "action": "click",
-            "item": item
+            "item": item,
            "args": args,
            "kwargs": kwargs,
            "user_data": user_data
        })
    def get_indicator_state(self, tag):
-        """Checks if an indicator is shown."""
+        """Checks if an indicator is shown using the diagnostics endpoint."""
-        # This requires a new API endpoint or using an existing one that returns GUI state.
+        # Mapping tag to the keys used in diagnostics endpoint
-        # Let's check if /api/gui GET exists.
+        mapping = {
-        return self._make_request('GET', f'/api/gui/state/{tag}')
+            "thinking_indicator": "thinking",
            "operations_live_indicator": "live",
            "prior_session_indicator": "prior"
        }
        key = mapping.get(tag, tag)
        try:
            diag = self._make_request('GET', '/api/gui/diagnostics')
            return {"tag": tag, "shown": diag.get(key, False)}
        except Exception as e:
            return {"tag": tag, "shown": False, "error": str(e)}
--- a/api_hooks.py
+++ b/api_hooks.py
@@ -21,11 +21,12 @@ class HookHandler(BaseHTTPRequestHandler):
            self.end_headers()
            self.wfile.write(json.dumps({'status': 'ok'}).encode('utf-8'))
        elif self.path == '/api/project':
            import project_manager
            self.send_response(200)
            self.send_header('Content-Type', 'application/json')
            self.end_headers()
-            self.wfile.write(
+            flat = project_manager.flat_config(app.project)
-                json.dumps({'project': app.project}).encode('utf-8'))
+            self.wfile.write(json.dumps({'project': flat}).encode('utf-8'))
        elif self.path == '/api/session':
            self.send_response(200)
            self.send_header('Content-Type', 'application/json')
@@ -41,16 +42,35 @@ class HookHandler(BaseHTTPRequestHandler):
            if hasattr(app, 'perf_monitor'):
                metrics = app.perf_monitor.get_metrics()
            self.wfile.write(json.dumps({'performance': metrics}).encode('utf-8'))
-        elif self.path.startswith('/api/gui/state/'):
+        elif self.path == '/api/gui/diagnostics':
-            tag = self.path.replace('/api/gui/state/', '')
+            # Safe way to query multiple states at once via the main thread queue
-            import dearpygui.dearpygui as dpg
+            event = threading.Event()
-            shown = False
+            result = {}
-            if dpg.does_item_exist(tag):
+            
-                shown = dpg.is_item_shown(tag)
+            def check_all():
-            self.send_response(200)
+                import dearpygui.dearpygui as dpg
-            self.send_header('Content-Type', 'application/json')
+                try:
-            self.end_headers()
+                    result["thinking"] = dpg.is_item_shown("thinking_indicator") if dpg.does_item_exist("thinking_indicator") else False
-            self.wfile.write(json.dumps({'tag': tag, 'shown': shown}).encode('utf-8'))
+                    result["live"] = dpg.is_item_shown("operations_live_indicator") if dpg.does_item_exist("operations_live_indicator") else False
                    result["prior"] = dpg.is_item_shown("prior_session_indicator") if dpg.does_item_exist("prior_session_indicator") else False
                finally:
                    event.set()
            with app._pending_gui_tasks_lock:
                app._pending_gui_tasks.append({
                    "action": "custom_callback",
                    "callback": check_all
                })
            if event.wait(timeout=2):
                self.send_response(200)
                self.send_header('Content-Type', 'application/json')
                self.end_headers()
                self.wfile.write(json.dumps(result).encode('utf-8'))
            else:
                self.send_response(504)
                self.end_headers()
                self.wfile.write(json.dumps({'error': 'timeout'}).encode('utf-8'))
        else:
            self.send_response(404)
            self.end_headers()
@@ -80,11 +100,6 @@ class HookHandler(BaseHTTPRequestHandler):
                self.wfile.write(
                    json.dumps({'status': 'updated'}).encode('utf-8'))
            elif self.path == '/api/gui':
                if not hasattr(app, '_pending_gui_tasks'):
                    app._pending_gui_tasks = []
                if not hasattr(app, '_pending_gui_tasks_lock'):
                    app._pending_gui_tasks_lock = threading.Lock()
                with app._pending_gui_tasks_lock:
                    app._pending_gui_tasks.append(data)
@@ -115,6 +130,13 @@ class HookServer:
    def start(self):
        if not getattr(self.app, 'test_hooks_enabled', False):
            return
        # Ensure the app has the task queue and lock initialized
        if not hasattr(self.app, '_pending_gui_tasks'):
            self.app._pending_gui_tasks = []
        if not hasattr(self.app, '_pending_gui_tasks_lock'):
            self.app._pending_gui_tasks_lock = threading.Lock()
        self.server = HookServerInstance(('127.0.0.1', self.port), HookHandler, self.app)
        self.thread = threading.Thread(target=self.server.serve_forever, daemon=True)
        self.thread.start()
--- a/gui.py
+++ b/gui.py
@@ -129,7 +129,7 @@ def _add_text_field(parent: str, label: str, value: str):
            if wrap:
                with dpg.child_window(height=80, border=True):
                    # add_input_text for selection
-                    dpg.add_input_text(default_value=value, multiline=True, readonly=True, width=-1, height=-1, border=False)
+                    dpg.add_input_text(default_value=value, multiline=True, readonly=True, width=-1, height=-1)
            else:
                dpg.add_input_text(
                    default_value=value,
@@ -140,14 +140,14 @@ def _add_text_field(parent: str, label: str, value: str):
                )
        else:
            # Short selectable text
-            dpg.add_input_text(default_value=value if value else "(empty)", readonly=True, width=-1, border=False)
+            dpg.add_input_text(default_value=value if value else "(empty)", readonly=True, width=-1)
 def _add_kv_row(parent: str, key: str, val, val_color=None):
    """Single key: value row, horizontally laid out."""
    with dpg.group(horizontal=True, parent=parent):
        dpg.add_text(f"{key}:", color=_LABEL_COLOR)
-        dpg.add_input_text(default_value=str(val), readonly=True, width=-1, border=False)
+        dpg.add_input_text(default_value=str(val), readonly=True, width=-1)
 def _render_usage(parent: str, usage: dict):
@@ -1506,6 +1506,28 @@ class App:
        self._rebuild_projects_list()
        self._update_status(f"created project: {name}")
    def _cb_new_project_automated(self, path):
        """Automated version of cb_new_project that doesn't show a dialog."""
        if not path:
            return
        name = Path(path).stem
        proj = project_manager.default_project(name)
        project_manager.save_project(proj, path)
        if path not in self.project_paths:
            self.project_paths.append(path)
        # Safely queue project switch and list rebuild for the main thread
        def main_thread_work():
            self._switch_project(path)
            self._rebuild_projects_list()
            self._update_status(f"created project: {name}")
        with self._pending_gui_tasks_lock:
            self._pending_gui_tasks.append({
                "action": "custom_callback",
                "callback": main_thread_work
            })
    def cb_browse_git_dir(self):
        root = hide_tk_root()
        d = filedialog.askdirectory(title="Select Git Directory")
@@ -1882,6 +1904,9 @@ class App:
            no_close=False,
            no_collapse=True,
        ):
            with dpg.group(tag="automated_actions_group", show=False):
                dpg.add_button(tag="btn_project_new_automated", callback=lambda s, a, u: self._cb_new_project_automated(u))
            with dpg.tab_bar():
                with dpg.tab(label="Projects"):
                    proj_meta = self.project.get("project", {})
@@ -2301,10 +2326,24 @@ class App:
                        dpg.set_value(item, val)
                elif action == "click":
                    item = task.get("item")
                    args = task.get("args", [])
                    kwargs = task.get("kwargs", {})
                    user_data = task.get("user_data")
                    if item and dpg.does_item_exist(item):
                        cb = dpg.get_item_callback(item)
                        if cb:
-                            cb()
+                            try:
                                # DPG callbacks can have (sender, app_data, user_data)
                                # If we have specific args/kwargs we use them, 
                                # otherwise we try to follow the DPG pattern.
                                if args or kwargs:
                                    cb(*args, **kwargs)
                                elif user_data is not None:
                                    cb(item, None, user_data)
                                else:
                                    cb()
                            except Exception as e:
                                print(f"Error in GUI hook callback for {item}: {e}")
                elif action == "select_tab":
                    tab_bar = task.get("tab_bar")
                    tab = task.get("tab")
@@ -2320,6 +2359,13 @@ class App:
                            # Dear PyGui callbacks for listbox usually receive (sender, app_data, user_data)
                            # app_data is the selected value.
                            cb(listbox, val)
                elif action == "custom_callback":
                    cb = task.get("callback")
                    if cb:
                        try:
                            cb()
                        except Exception as e:
                            print(f"Error in custom GUI hook callback: {e}")
                elif action == "refresh_api_metrics":
                    self._refresh_api_metrics(task.get("payload", {}))
            except Exception as e:
--- a/tests/conftest.py
+++ b/tests/conftest.py
@@ -32,11 +32,15 @@ def live_gui():
    """
    print("\n[Fixture] Starting gui.py --enable-test-hooks...")
    # Ensure logs directory exists
    os.makedirs("logs", exist_ok=True)
    log_file = open("logs/gui_test.log", "w", encoding="utf-8")
    # Start gui.py as a subprocess.
    process = subprocess.Popen(
        ["uv", "run", "python", "gui.py", "--enable-test-hooks"],
-        stdout=subprocess.DEVNULL,
+        stdout=log_file,
-        stderr=subprocess.DEVNULL,
+        stderr=log_file,
        text=True,
        creationflags=subprocess.CREATE_NEW_PROCESS_GROUP if os.name == 'nt' else 0
    )
--- a/tests/test_live_workflow.py
+++ b/tests/test_live_workflow.py
@@ -0,0 +1,88 @@
 import pytest
 import time
 import sys
 import os
 # Ensure project root is in path
 sys.path.append(os.path.abspath(os.path.join(os.path.dirname(__file__), "..")))
 from api_hook_client import ApiHookClient
@pytest.mark.integration
 def test_full_live_workflow(live_gui):
    """
    Integration test that drives the GUI through a full workflow.
    """
    client = ApiHookClient()
    assert client.wait_for_server(timeout=10)
    time.sleep(2)
    # 1. Reset
    client.click("btn_reset")
    time.sleep(1)
    # 2. Project Setup
    temp_project_path = os.path.abspath("tests/temp_project.toml")
    if os.path.exists(temp_project_path):
        os.remove(temp_project_path)
    client.click("btn_project_new_automated", user_data=temp_project_path)
    time.sleep(1) # Wait for project creation and switch
    # Verify metadata update
    proj = client.get_project()
    test_git = os.path.abspath(".")
    client.set_value("project_git_dir", test_git)
    client.click("btn_project_save")
    time.sleep(1)
    proj = client.get_project()
    # flat_config returns {"project": {...}, "output": ...} 
    # so proj is {"project": {"project": {"git_dir": ...}}}
    assert proj['project']['project']['git_dir'] == test_git
    # Enable auto-add so the response ends up in history
    client.set_value("auto_add_history", True)
    time.sleep(0.5)
    # 3. Discussion Turn
    client.set_value("ai_input", "Hello! This is an automated test. Just say 'Acknowledged'.")
    client.click("btn_gen_send")
    # Verify thinking indicator appears (might be brief)
    thinking_seen = False
    print("\nPolling for thinking indicator...")
    for i in range(20):
        state = client.get_indicator_state("thinking_indicator")
        if state.get('shown'):
            thinking_seen = True
            print(f"Thinking indicator seen at poll {i}")
            break
        time.sleep(0.5)
    # 4. Wait for response in session
    success = False
    print("Waiting for AI response in session...")
    for i in range(60):
        session = client.get_session()
        entries = session.get('session', {}).get('entries', [])
        if any(e.get('role') == 'AI' for e in entries):
            success = True
            print(f"AI response found at second {i}")
            break
        time.sleep(1)
    assert success, "AI failed to respond within 60 seconds"
    # 5. Switch Discussion
    client.set_value("disc_new_name_input", "AutoDisc")
    client.click("btn_disc_create")
    time.sleep(0.5)
    client.select_list_item("disc_listbox", "AutoDisc")
    time.sleep(0.5)
    # Verify session is empty in new discussion
    session = client.get_session()
    assert len(session.get('session', {}).get('entries', [])) == 0