From 808c9d3d132bd76af56469e21ea7fc4fb2a3ba72 Mon Sep 17 00:00:00 2001
From: "Abiba (pi)" <abiba@sysloggh.com>
Date: Sat, 16 May 2026 22:12:21 +0000
Subject: [PATCH] Router: 300s timeout, gpu_decr bugfix. Dashboard: Bootstrap 5
 modern redesign with KPI stats, equal-height cards, queue ring. Nginx: 600s
 timeout.

---
 dashboard/dashboard.py | 360 +++++++++++++++++------------------------
 nginx/nginx.conf       |   2 +-
 router/router.py       |   7 +-
 3 files changed, 156 insertions(+), 213 deletions(-)
diff --git a/dashboard/dashboard.py b/dashboard/dashboard.py
index b8f218f..a1e5ee6 100644
--- a/dashboard/dashboard.py
+++ b/dashboard/dashboard.py
@@ -1,10 +1,9 @@
-"""SyslogAI Harness Dashboard."""
+"""SyslogAI Harness Dashboard — Modern Design."""
 import os, json, time, queue, threading
 import requests
 from flask import Flask, request, render_template_string, Response, stream_with_context
 
 ROUTER_METRICS = os.environ.get("ROUTER_METRICS_URL", "http://router:9000/metrics")
-
 app = Flask(__name__)
 sse_subscribers = []; sse_lock = threading.Lock()
 
@@ -20,239 +19,182 @@ def broadcast_loop():
         time.sleep(3)
         data = fetch_state(); payload = json.dumps(data)
         with sse_lock:
-            dead = []
-            for q in sse_subscribers:
-                try: q.put(payload)
-                except Exception: dead.append(q)
+            dead = [q for q in sse_subscribers if not q.put(payload)]
             for q in dead: sse_subscribers.remove(q)
-
 threading.Thread(target=broadcast_loop, daemon=True).start()
 
 DASHBOARD_HTML = r"""<!DOCTYPE html>
-<html lang="en">
+<html lang="en" data-bs-theme="dark">
 <head>
-<meta charset="UTF-8">
-<meta name="viewport" content="width=device-width, initial-scale=1.0">
-<title>SyslogAI Harness - Syslog Solution LLC</title>
+<meta charset="UTF-8"><meta name="viewport" content="width=device-width, initial-scale=1.0">
+<title>SyslogAI Harness</title>
+<link href="https://cdn.jsdelivr.net/npm/bootstrap@5.3.3/dist/css/bootstrap.min.css" rel="stylesheet">
 <style>
-:root {
-  --bg: #0a0e14; --card: #131820; --border: #1e2a3a; --text: #c9d1d9;
-  --dim: #5c6670; --accent: #39bae6; --green: #7fd962; --yellow: #ffb454;
-  --red: #f26d78; --blue: #59c2ff; --purple: #d2a6ff;
-}
-* { margin:0; padding:0; box-sizing:border-box; }
-body {
-  font-family: -apple-system, BlinkMacSystemFont, 'SF Pro Display', 'Segoe UI', system-ui, sans-serif;
-  background: var(--bg); color: var(--text); min-height: 100vh;
-  padding: clamp(12px, 3vw, 32px);
-}
-.header { display: flex; align-items: center; justify-content: space-between; flex-wrap: wrap; gap: 12px; margin-bottom: 24px; }
-.header h1 { font-size: clamp(18px, 4vw, 26px); font-weight: 700; color: #fff; }
-.header h1 span { color: var(--accent); }
-.status-bar { display: flex; gap: 16px; align-items: center; flex-wrap: wrap; font-size: 13px; color: var(--dim); }
-.status-dot { width: 8px; height: 8px; border-radius: 50%; display: inline-block; }
-.status-dot.live { background: var(--green); animation: pulse 2s infinite; }
-@keyframes pulse { 0%,100%{opacity:1} 50%{opacity:0.3} }
-.grid { display: grid; grid-template-columns: repeat(auto-fit, minmax(min(100%, 340px), 1fr)); gap: 16px; }
-.card { background: var(--card); border: 1px solid var(--border); border-radius: 12px; padding: clamp(12px, 3vw, 20px); }
-.card-title { font-size: 13px; font-weight: 600; text-transform: uppercase; letter-spacing: 0.5px; color: var(--dim); margin-bottom: 14px; }
-.full { grid-column: 1 / -1; }
-.gpu-row { display: flex; align-items: center; gap: 14px; padding: 10px 0; border-bottom: 1px solid rgba(255,255,255,0.04); }
-.gpu-row:last-child { border-bottom: none; }
-.gpu-icon { width: 40px; height: 40px; border-radius: 10px; display: flex; align-items: center; justify-content: center; font-size: 18px; flex-shrink: 0; }
-.gpu-icon.green { background: rgba(127,217,98,0.12); color: var(--green); }
-.gpu-icon.yellow { background: rgba(255,180,84,0.12); color: var(--yellow); }
-.gpu-icon.red { background: rgba(242,109,120,0.12); color: var(--red); }
-.gpu-info { flex:1; min-width: 0; }
-.gpu-name { font-size: 14px; font-weight: 600; color: #e6edf3; }
-.gpu-metrics { display: flex; gap: 20px; flex-wrap: wrap; margin-top: 6px; }
-.gpu-metric { font-size: 12px; }
-.gpu-metric .label { color: var(--dim); }
-.gpu-metric .value { color: #e6edf3; font-weight: 500; font-variant-numeric: tabular-nums; }
-.vram-bar { width: 100%; height: 4px; background: rgba(255,255,255,0.06); border-radius: 2px; margin-top: 6px; overflow: hidden; }
-.vram-fill { height: 100%; border-radius: 2px; transition: width 0.6s ease; }
-.vram-fill.green { background: var(--green); }
-.vram-fill.yellow { background: var(--yellow); }
-.vram-fill.red { background: var(--red); }
-.slot-row { display: flex; gap: 3px; margin-top: 6px; }
-.slot-dot { flex: 1; height: 6px; border-radius: 2px; background: rgba(255,255,255,0.06); }
-.slot-dot.active { background: var(--accent); }
-.slot-label { font-size: 10px; margin-top: 2px; }
-.bar-row { margin-bottom: 10px; }
-.bar-label { display: flex; justify-content: space-between; font-size: 12px; margin-bottom: 4px; }
-.bar-label .name { color: #e6edf3; }
-.bar-label .count { color: var(--dim); font-variant-numeric: tabular-nums; }
-.bar-track { height: 6px; background: rgba(255,255,255,0.06); border-radius: 3px; overflow: hidden; }
+body { background: #0b0f17; color: #bcc3cd; font-family: -apple-system, BlinkMacSystemFont, 'Segoe UI', system-ui, sans-serif; padding: 20px 24px; }
+.card { background: #111827; border: 1px solid #1e293b; border-radius: 10px; height: 100%; }
+.stat-card { background: #111827; border: 1px solid #1e293b; border-radius: 10px; padding: 18px 20px; text-align: center; }
+.stat-value { font-size: 28px; font-weight: 700; line-height: 1.1; }
+.stat-label { font-size: 11px; text-transform: uppercase; letter-spacing: 0.6px; color: #64748b; margin-top: 4px; }
+.gpu-card { background: #111827; border: 1px solid #1e293b; border-radius: 10px; padding: 16px 18px; height: 100%; }
+.gpu-card .title { font-size: 13px; font-weight: 600; color: #e2e8f0; margin-bottom: 12px; display: flex; align-items: center; gap: 8px; }
+.gpu-card .status-dot { width: 8px; height: 8px; border-radius: 50%; flex-shrink: 0; }
+.gpu-card .row-metric { display: flex; justify-content: space-between; font-size: 12px; padding: 2px 0; }
+.gpu-card .row-metric .lbl { color: #64748b; }
+.gpu-card .row-metric .val { color: #e2e8f0; font-variant-numeric: tabular-nums; }
+.gpu-card .slot-bar { display: flex; gap: 3px; margin-top: 8px; }
+.gpu-card .slot-bar .s { flex: 1; height: 5px; border-radius: 2px; background: #1e293b; }
+.gpu-card .slot-bar .s.active { background: #38bdf8; }
+.chart-card { background: #111827; border: 1px solid #1e293b; border-radius: 10px; padding: 16px 18px; height: 100%; display: flex; flex-direction: column; }
+.chart-card .title { font-size: 13px; font-weight: 600; color: #e2e8f0; margin-bottom: 12px; }
+.bar-row { margin-bottom: 8px; }
+.bar-label { display: flex; justify-content: space-between; font-size: 11px; margin-bottom: 3px; color: #64748b; }
+.bar-label .name { color: #cbd5e1; }
+.bar-track { height: 5px; background: #1e293b; border-radius: 3px; overflow: hidden; }
 .bar-fill { height: 100%; border-radius: 3px; transition: width 0.6s ease; }
-.route-table { width: 100%; font-size: 12px; border-collapse: collapse; }
-.route-table th, .route-table td { text-align: left; padding: 6px 10px; }
-.route-table th { color: var(--dim); font-weight: 500; font-size: 11px; text-transform: uppercase; letter-spacing: 0.3px; border-bottom: 1px solid var(--border); }
-.route-table td { border-bottom: 1px solid rgba(255,255,255,0.03); color: #b0b8c4; }
-.agent-tag { display: inline-block; padding: 1px 7px; border-radius: 10px; font-size: 11px; font-weight: 600; }
-.agent-abiba { background: rgba(57,186,230,0.15); color: var(--accent); }
-.agent-mumuni { background: rgba(210,166,255,0.15); color: var(--purple); }
-.agent-tanko { background: rgba(255,180,84,0.15); color: var(--yellow); }
-.agent-koby { background: rgba(89,194,255,0.15); color: var(--blue); }
-.agent-kagenz0 { background: rgba(127,217,98,0.15); color: var(--green); }
-.agent-koonimo { background: rgba(255,180,84,0.15); color: #ff8c42; }
-.agent-unknown { background: rgba(255,255,255,0.06); color: var(--dim); }
-.period-btn { background: var(--card); border: 1px solid var(--border); color: var(--dim); padding: 4px 12px; border-radius: 6px; font-size: 12px; cursor: pointer; font-family: inherit; transition: all 0.2s; }
-.period-btn.active { background: var(--accent); color: #000; border-color: var(--accent); }
-.period-btn:hover { border-color: var(--accent); color: #e6edf3; }
-.queue-ring { position: relative; display: inline-block; margin-bottom: 8px; }
-.queue-center { position: absolute; top: 50%; left: 50%; transform: translate(-50%,-50%); text-align: center; }
-@media (max-width: 600px) {
-  .gpu-metrics { gap: 10px; }
-  .route-table { font-size: 11px; }
-  .route-table th, .route-table td { padding: 4px 6px; }
-}
+.table-custom { font-size: 11px; margin: 0; }
+.table-custom th { color: #64748b; font-weight: 500; font-size: 10px; text-transform: uppercase; border-color: #1e293b; padding: 8px 10px; }
+.table-custom td { color: #94a3b8; border-color: rgba(30,41,59,0.5); padding: 6px 10px; }
+.agent-badge { font-size: 10px; padding: 2px 7px; border-radius: 8px; font-weight: 600; }
+.btn-sm-period { font-size: 10px; padding: 3px 10px; border-radius: 6px; border: 1px solid #1e293b; color: #64748b; background: transparent; cursor: pointer; }
+.btn-sm-period.active { background: #1d4ed8; color: #fff; border-color: #1d4ed8; }
+.ring-label { font-size: 22px; font-weight: 700; }
+.ring-sublabel { font-size: 10px; color: #64748b; }
 </style>
 </head>
 <body>
-<div class="header">
-  <h1><span>&#x26A1;</span> SyslogAI Harness</h1>
-  <div class="status-bar">
-    <span class="status-dot" id="live-dot"></span>
-    <span id="connection-status">connecting...</span>
-    <span id="update-time"></span>
-    <span id="total-requests">0 requests</span>
+
+<!-- HEADER -->
+<div class="d-flex justify-content-between align-items-center mb-4">
+  <div>
+    <h5 class="mb-0 text-white fw-bold">&#x26A1; SyslogAI Harness</h5>
+    <div class="small text-secondary" id="live-indicator">
+      <span class="status-dot" id="live-dot" style="width:6px;height:6px;border-radius:50%;display:inline-block;background:#22c55e;animation:pulse 2s infinite"></span>
+      <span id="connection-status">live</span> &middot; <span id="update-time"></span>
+    </div>
+  </div>
+  <div class="d-flex gap-2">
+    <div class="stat-card" style="min-width:100px"><div class="stat-value text-info" id="kpi-total">0</div><div class="stat-label">Requests</div></div>
+    <div class="stat-card" style="min-width:100px"><div class="stat-value text-warning" id="kpi-active">0</div><div class="stat-label">Active</div></div>
+    <div class="stat-card" style="min-width:100px"><div class="stat-value" style="color:#a78bfa" id="kpi-agents">0</div><div class="stat-label">Agents</div></div>
   </div>
 </div>
-<div class="grid">
-  <!-- ROW 1: GPU Health -->
-  <div class="card full">
-    <div class="card-title">GPU Health</div>
-    <div id="gpu-container">Loading...</div>
-  </div>
-  <!-- ROW 2: Queue Status | Model Distribution | Agent Activity -->
-  <div class="card">
-    <div class="card-title">Queue Status</div>
-    <div id="queue-viz" style="text-align:center;padding:10px 0">
-      <div style="color:var(--dim);font-size:13px">Loading...</div>
+
+<div class="row g-3 align-items-stretch">
+  <!-- ROW 1: 3 GPU Cards -->
+  <div class="col-md-4"><div class="gpu-card" id="gpu-moe"><div class="text-secondary small">Loading...</div></div></div>
+  <div class="col-md-4"><div class="gpu-card" id="gpu-dense"><div class="text-secondary small">Loading...</div></div></div>
+  <div class="col-md-4"><div class="gpu-card" id="gpu-light"><div class="text-secondary small">Loading...</div></div></div>
+
+  <!-- ROW 2: Queue + Model + Agent -->
+  <div class="col-md-4"><div class="chart-card"><div class="title">Queue Status</div><div class="text-center" id="queue-viz"></div></div></div>
+  <div class="col-md-4"><div class="chart-card"><div class="title">Model Distribution</div><div id="route-bars"></div></div></div>
+  <div class="col-md-4"><div class="chart-card"><div class="title">Agent Activity</div><div id="agent-bars"></div></div></div>
+
+  <!-- ROW 3: Usage Chart (8) + GPU Metrics (4) -->
+  <div class="col-md-8"><div class="chart-card"><div class="title d-flex justify-content-between align-items-center">
+    <span>Usage Over Time</span>
+    <div class="d-flex gap-1">
+      <button class="btn-sm-period active" onclick="switchPeriod('day')">24h</button>
+      <button class="btn-sm-period" onclick="switchPeriod('week')">7d</button>
+      <button class="btn-sm-period" onclick="switchPeriod('month')">30d</button>
     </div>
-  </div>
-  <div class="card">
-    <div class="card-title">Model Distribution</div>
-    <div id="route-bars">-</div>
-  </div>
-  <div class="card">
-    <div class="card-title">Agent Activity</div>
-    <div id="agent-bars">-</div>
-  </div>
-  <!-- ROW 3: Usage Over Time -->
-  <div class="card full">
-    <div class="card-title" style="display:flex;justify-content:space-between;align-items:center;flex-wrap:wrap;gap:4px">
-      <span>Usage Over Time</span>
-      <div style="display:flex;gap:4px">
-        <button class="period-btn active" onclick="switchPeriod('day')">24h</button>
-        <button class="period-btn" onclick="switchPeriod('week')">7d</button>
-        <button class="period-btn" onclick="switchPeriod('month')">30d</button>
-      </div>
-    </div>
-    <div id="timeseries-chart" style="height:140px;position:relative;overflow:hidden">
-      <div style="color:var(--dim);font-size:13px;padding:50px 0;text-align:center">Loading...</div>
-    </div>
-    <div id="timeseries-legend" style="display:flex;gap:16px;justify-content:center;margin-top:8px;flex-wrap:wrap"></div>
-  </div>
-  <!-- ROW 4: Live Request Stream -->
-  <div class="card full">
-    <div class="card-title">Live Request Stream</div>
-    <div style="overflow-x:auto">
-      <table class="route-table">
-        <thead><tr><th>Time</th><th>Agent</th><th>Model</th><th>Reason</th><th>Tier</th></tr></thead>
-        <tbody id="route-tbody"><tr><td colspan="5">Waiting for data...</td></tr></tbody>
-      </table>
-    </div>
-  </div>
+  </div><div id="timeseries-chart" style="height:150px"></div><div id="timeseries-legend" class="d-flex justify-content-center gap-3 mt-2 flex-wrap small"></div></div></div>
+  <div class="col-md-4"><div class="chart-card"><div class="title">GPU Metrics</div><div id="gpu-metrics-card"></div></div></div>
+
+  <!-- ROW 4: Live Stream -->
+  <div class="col-12"><div class="chart-card"><div class="title">Live Stream</div>
+    <div class="table-responsive"><table class="table table-custom mb-0">
+      <thead><tr><th>Time</th><th>Agent</th><th>Model</th><th>Reason</th><th>Tier</th></tr></thead>
+      <tbody id="route-tbody"></tbody>
+    </table></div>
+  </div></div>
 </div>
+
 <script>
-const MODEL_COLORS = {'gemma-4-E4B':'#7fd962','qwen3.6-27B-code':'#ffb454','qwen3.6-35B-A3B':'#d2a6ff'};
-const MODEL_LABELS = {'gemma-4-E4B':'Gemma 4B','qwen3.6-27B-code':'Qwen Code 27B','qwen3.6-35B-A3B':'Qwen MoE 35B'};
-const GPU_LABELS = {'NVIDIA GeForce RTX 5070':'RTX 5070 - Gemma 4B','NVIDIA GeForce RTX 3090':'RTX 3090 - Qwen Code 27B','AMD Radeon (Strix Halo)':'Strix Halo - Qwen MoE 35B'};
+var MC={'gemma-4-E4B':'#22c55e','qwen3.6-27B-code':'#f59e0b','qwen3.6-35B-A3B':'#a78bfa'};
+var ML={'gemma-4-E4B':'Gemma 4B','qwen3.6-27B-code':'Qwen Code','qwen3.6-35B-A3B':'Qwen MoE'};
+var GL={'qwen3.6-35B-A3B':'MoE - Strix Halo','qwen3.6-27B-code':'Dense - RTX 3090','gemma-4-E4B':'Light - RTX 5070'};
+function $(id){return document.getElementById(id);}
 
-function statusIcon(s) { return s==='healthy'?'<span class="gpu-icon green">&#x25CF;</span>':s==='saturated'?'<span class="gpu-icon yellow">&#x25C9;</span>':'<span class="gpu-icon red">&#x25CB;</span>'; }
-function vramClass(p) { return p>90?'red':p>75?'yellow':'green'; }
-
-function render(data) {
-  if(!data||!data.gpus)return;
-  var total = Object.values(data.route_counts||{}).reduce(function(a,b){return a+b;},0);
-  document.getElementById('total-requests').textContent = total + ' requests';
-  document.getElementById('update-time').textContent = new Date().toLocaleTimeString();
-  var gpus = data.gpus||[];
-  document.getElementById('gpu-container').innerHTML = gpus.map(function(g){
-    var active = g.active_requests||0, max = g.max_concurrent||1;
-    var slots = '';
-    for(var i=0;i<max;i++) slots += '<div class="slot-dot'+(i<active?' active':'')+'"></div>';
-    var slotLabel = '<div class="slot-label" style="color:'+(active>=max?'var(--red)':'var(--dim)')+'">'+active+'/'+max+' active</div>';
-    return '<div class="gpu-row">'+statusIcon(g.status)+'<div class="gpu-info"><div class="gpu-name">'+(GPU_LABELS[g.gpu_name]||g.gpu_name||g.id||'?')+'</div><div class="gpu-metrics"><div class="gpu-metric"><span class="label">VRAM</span> <span class="value">'+(g.vram_used_mb||'?')+'/'+(g.vram_total_mb||'?')+' MB</span></div><div class="gpu-metric"><span class="label">Temp</span> <span class="value">'+(g.temp_c||'?')+'C</span></div><div class="gpu-metric"><span class="label">Util</span> <span class="value">'+(g.gpu_util_pct||0)+'%</span></div>'+(g.power_w!=null?'<div class="gpu-metric"><span class="label">Power</span> <span class="value">'+g.power_w+'W</span></div>':'')+'</div><div class="vram-bar"><div class="vram-fill '+vramClass(g.gpu_util_pct||0)+'" style="width:'+(g.gpu_util_pct||0)+'%"></div></div><div class="slot-row">'+slots+'</div>'+slotLabel+'</div><div style="font-size:24px;font-weight:700;color:'+(vramClass(g.gpu_util_pct||0)==='red'?'var(--red)':vramClass(g.gpu_util_pct||0)==='yellow'?'var(--yellow)':'var(--green)')+';min-width:50px;text-align:right">'+(g.gpu_util_pct||0)+'%</div></div>';
-  }).join('');
-
-  var rc = data.route_counts||{}, maxR = Math.max(1,rc.gemma||0,rc.qwen||0);
-  document.getElementById('route-bars').innerHTML = Object.entries(rc).length ? Object.entries(rc).sort(function(a,b){return b[1]-a[1];}).map(function(e){var m=e[0],c=e[1];return '<div class="bar-row"><div class="bar-label"><span class="name">'+(MODEL_LABELS[m]||m)+'</span><span class="count">'+c+' ('+(total?Math.round(c/total*100):0)+'%)</span></div><div class="bar-track"><div class="bar-fill" style="width:'+(c/maxR*100)+'%;background:'+(MODEL_COLORS[m]||'#39bae6')+'"></div></div></div>';}).join('') : '<div style="color:var(--dim);font-size:13px">No data yet</div>';
-
-  var ac = data.agent_counts||{}, maxA = Math.max(1,ac.Tanko||0,ac.Koby||0,ac.Koonimo||0);
-  document.getElementById('agent-bars').innerHTML = Object.entries(ac).length ? Object.entries(ac).sort(function(a,b){return b[1]-a[1];}).map(function(e){var a=e[0],c=e[1];var cl='agent-'+a.toLowerCase().replace(/[^a-z]/g,'');return '<div class="bar-row"><div class="bar-label"><span class="name '+cl+'">'+a+'</span><span class="count">'+c+' reqs</span></div><div class="bar-track"><div class="bar-fill" style="width:'+(c/maxA*100)+'%;background:var(--accent)"></div></div></div>';}).join('') : '<div style="color:var(--dim);font-size:13px">No activity yet</div>';
-
-  var recent = data.recent||[];
-  document.getElementById('route-tbody').innerHTML = recent.length ? recent.slice(0,25).map(function(r){var d=new Date(r.ts*1000),a=r.agent||'?',cl='agent-'+a.toLowerCase().replace(/[^a-z0-9]/g,'');return'<tr><td style="color:var(--dim);font-size:11px">'+d.toLocaleTimeString()+'</td><td><span class="agent-tag '+cl+'">'+a+'</span></td><td>'+(MODEL_LABELS[r.model]||r.model)+'</td><td style="color:var(--dim);font-size:11px">'+(r.reason||'')+'</td><td style="font-size:11px;text-transform:uppercase;color:'+(r.tier==='enterprise'?'var(--purple)':r.tier==='professional'?'var(--blue)':'var(--dim)')+'">'+(r.tier||'')+'</td></tr>';}).join('') : '<tr><td colspan="5" style="color:var(--dim)">Waiting...</td></tr>';
-
-  renderQueue(data);
+function render(data){
+if(!data||!data.gpus)return;
+var t=Object.values(data.route_counts||{}).reduce((a,b)=>a+b,0);
+var ta=0,tm=0;data.gpus.forEach(function(g){ta+=(g.active_requests||0);tm+=(g.max_concurrent||1)});
+$('kpi-total').textContent=t;$('kpi-active').textContent=ta+'/'+tm;$('kpi-agents').textContent=Object.keys(data.agent_counts||{}).length;
+$('update-time').textContent=new Date().toLocaleTimeString();
+var ids={'qwen3.6-35B-A3B':'gpu-moe','qwen3.6-27B-code':'gpu-dense','gemma-4-E4B':'gpu-light'};
+data.gpus.forEach(function(g){
+var el=$(ids[g.id]);if(!el)return;
+var a=g.active_requests||0,mx=g.max_concurrent||1;
+var sc=g.status==='healthy'?'#22c55e':g.status==='saturated'?'#f59e0b':'#ef4444';
+var ss=g.status==='healthy'?'Online':g.status==='saturated'?'Busy':'Offline';
+var slots='';for(var i=0;i<mx;i++)slots+='<span class=\"s'+(i<a?' active':'')+'\"></span>';
+var h='<div class=\"title\"><span class=\"status-dot\" style=\"background:'+sc+'\"></span>'+GL[g.id]+'<span class=\"ms-auto small\" style=\"color:'+sc+'\">'+ss+'</span></div>';
+h+='<div class=\"row-metric\"><span class=\"lbl\">VRAM</span><span class=\"val\">'+g.vram_used_mb+' / '+g.vram_total_mb+' MB</span></div>';
+h+='<div class=\"row-metric\"><span class=\"lbl\">Utilization</span><span class=\"val\">'+g.gpu_util_pct+'%</span></div>';
+h+='<div class=\"row-metric\"><span class=\"lbl\">Temperature</span><span class=\"val\" style=\"color:'+(g.temp_c>85?'#ef4444':g.temp_c>70?'#f59e0b':'#22c55e')+'\">'+g.temp_c+'C</span></div>';
+if(g.power_w)h+='<div class=\"row-metric\"><span class=\"lbl\">Power</span><span class=\"val\">'+g.power_w+'W'+(g.power_limit_w?'/'+g.power_limit_w+'W':'')+'</span></div>';
+h+='<div class=\"row-metric\"><span class=\"lbl\">Slots</span><span class=\"val\" style=\"color:'+(a>=mx?'#ef4444':'#e2e8f0')+'\">'+a+' / '+mx+'</span></div>';
+h+='<div class=\"slot-bar\">'+slots+'</div>';el.innerHTML=h;
+});
+renderQueue(data);renderGPUMetrics(data);
+var rc=data.route_counts||{},mr=Math.max(1,...Object.values(rc));
+$('route-bars').innerHTML=Object.entries(rc).length?Object.entries(rc).sort((a,b)=>b[1]-a[1]).map(function(e){var m=e[0],c=e[1];return'<div class=\"bar-row\"><div class=\"bar-label\"><span class=\"name\">'+(ML[m]||m)+'</span><span>'+c+' ('+(t?Math.round(c/t*100):0)+'%)</span></div><div class=\"bar-track\"><div class=\"bar-fill\" style=\"width:'+(c/mr*100)+'%;background:'+(MC[m]||'#38bdf8')+'\"></div></div></div>';}).join(''):'<div class=\"text-secondary small\">-</div>';
+var ac=data.agent_counts||{},ma=Math.max(1,...Object.values(ac));
+$('agent-bars').innerHTML=Object.entries(ac).length?Object.entries(ac).sort((a,b)=>b[1]-a[1]).map(function(e){return'<div class=\"bar-row\"><div class=\"bar-label\"><span class=\"name\">'+e[0]+'</span><span>'+e[1]+'</span></div><div class=\"bar-track\"><div class=\"bar-fill\" style=\"width:'+(e[1]/ma*100)+'%;background:#38bdf8\"></div></div></div>';}).join(''):'<div class=\"text-secondary small\">-</div>';
+var recent=data.recent||[];
+$('route-tbody').innerHTML=recent.length?recent.slice(0,20).map(function(r){var d=new Date(r.ts*1000),ag=r.agent||'?';return'<tr><td class=\"text-secondary\">'+d.toLocaleTimeString()+'</td><td><span class=\"agent-badge\" style=\"background:rgba(56,189,248,0.12);color:#38bdf8\">'+ag+'</span></td><td>'+(ML[r.model]||r.model)+'</td><td class=\"text-secondary\">'+(r.reason||'')+'</td><td class=\"text-uppercase\" style=\"font-size:10px;color:'+(r.tier==='enterprise'?'#a78bfa':'#64748b')+'\">'+(r.tier||'')+'</td></tr>';}).join(''):'<tr><td colspan=\"5\" class=\"text-secondary\">Waiting...</td></tr>';
 }
 
-function renderQueue(data) {
-  var c = document.getElementById('queue-viz'); if(!c) return;
-  var gpus = data.gpus||[];
-  var totA=0, totM=0;
-  gpus.forEach(function(g){ totA+=(g.active_requests||0); totM+=(g.max_concurrent||1); });
-  var pct = totM>0?Math.round(totA/totM*100):0;
-  var status = pct>=100?'SATURATED':pct>=50?'BUSY':'IDLE';
-  var sc = pct>=100?'var(--red)':pct>=50?'var(--yellow)':'var(--green)';
-  var circ = 2*Math.PI*32, dash = (pct/100)*circ;
-  var h = '<div class="queue-ring"><svg width="80" height="80" viewBox="0 0 80 80"><circle cx="40" cy="40" r="32" fill="none" stroke="rgba(255,255,255,0.06)" stroke-width="8"/><circle cx="40" cy="40" r="32" fill="none" stroke="'+sc+'" stroke-width="8" stroke-dasharray="'+dash+' '+(circ-dash)+'" stroke-linecap="round" transform="rotate(-90 40 40)"/></svg><div class="queue-center"><div style="font-size:22px;font-weight:700;color:'+sc+'">'+totA+'</div><div style="font-size:10px;color:var(--dim)">/ '+totM+'</div></div></div>';
-  h += '<div style="font-size:12px;font-weight:600;color:'+sc+';margin-bottom:8px">'+status+'</div>';
-  var labels = {'qwen3.6-35B-A3B':'MoE','qwen3.6-27B-code':'Dense','gemma-4-E4B':'Gemma'};
-  gpus.forEach(function(g){
-    var a=g.active_requests||0,mx=g.max_concurrent||1,gp=mx>0?Math.round(a/mx*100):0;
-    var gc=gp>=100?'var(--red)':gp>=50?'var(--yellow)':'var(--green)';
-    h+='<div style="display:flex;align-items:center;gap:6px;margin-bottom:4px;justify-content:center">';
-    h+='<span style="min-width:45px;text-align:right;font-size:11px">'+(labels[g.id]||g.id)+'</span>';
-    h+='<div style="flex:1;max-width:100px;height:4px;background:rgba(255,255,255,0.06);border-radius:2px;overflow:hidden"><div style="height:100%;width:'+gp+'%;background:'+gc+';border-radius:2px"></div></div>';
-    h+='<span style="min-width:25px;font-size:11px;color:'+(a>=mx?'var(--red)':'var(--dim)')+'">'+a+'/'+mx+'</span></div>';
-  });
-  c.innerHTML = h;
+function renderQueue(data){
+var el=$('queue-viz');if(!el)return;
+var ta=0,tm=0;data.gpus.forEach(function(g){ta+=(g.active_requests||0);tm+=(g.max_concurrent||1)});
+var pct=tm>0?Math.round(ta/tm*100):0,st=pct>=100?'SATURATED':pct>=50?'BUSY':'IDLE';
+var sc=pct>=100?'#ef4444':pct>=50?'#f59e0b':'#22c55e';
+var circ=188.5,dash=(pct/100)*circ;
+var h='<div class=\"d-inline-block position-relative mb-2\"><svg width=\"72\" height=\"72\"><circle cx=\"36\" cy=\"36\" r=\"30\" fill=\"none\" stroke=\"#1e293b\" stroke-width=\"6\"/><circle cx=\"36\" cy=\"36\" r=\"30\" fill=\"none\" stroke=\"'+sc+'\" stroke-width=\"6\" stroke-dasharray=\"'+dash+' '+(circ-dash)+'\" stroke-linecap=\"round\" transform=\"rotate(-90 36 36)\"/></svg><div style=\"position:absolute;top:50%;left:50%;transform:translate(-50%,-50%);text-align:center\"><div class=\"ring-label\" style=\"color:'+sc+'\">'+ta+'</div><div class=\"ring-sublabel\">/ '+tm+' slots</div></div></div>';
+h+='<div class=\"fw-bold mb-2 small\" style=\"color:'+sc+'\">'+st+'</div>';
+var lb={'qwen3.6-35B-A3B':'MoE','qwen3.6-27B-code':'Dense','gemma-4-E4B':'Gemma'};
+data.gpus.forEach(function(g){var a=g.active_requests||0,mx=g.max_concurrent||1,gp=mx>0?Math.round(a/mx*100):0;h+='<div class=\"d-flex align-items-center gap-2 mb-1 justify-content-center\"><span class=\"small\" style=\"min-width:32px;text-align:right;font-size:10px\">'+(lb[g.id]||g.id)+'</span><div style=\"flex:1;max-width:70px;height:3px;background:#1e293b;border-radius:2px;overflow:hidden\"><div style=\"height:100%;width:'+gp+'%;background:'+sc+';border-radius:2px\"></div></div><span class=\"small\" style=\"min-width:22px;font-size:10px\">'+a+'/'+mx+'</span></div>'});
+el.innerHTML=h;
 }
 
-var currentPeriod = 'day';
-function switchPeriod(p) { currentPeriod=p; document.querySelectorAll('.period-btn').forEach(function(b){b.classList.remove('active');}); document.querySelectorAll('.period-btn').forEach(function(b){if(b.textContent.trim().startsWith(p==='day'?'24h':p==='week'?'7d':'30d'))b.classList.add('active');}); loadTimeseries(); }
-function loadTimeseries() { fetch('/api/timeseries?period='+currentPeriod).then(function(r){return r.json();}).then(renderTimeseries).catch(function(){}); }
-function renderTimeseries(d) {
-  var models=d.models||{},labels=d.labels||[];
-  if(!labels.length)return;
-  var c=document.getElementById('timeseries-chart'),l=document.getElementById('timeseries-legend');
-  var mn=Object.keys(models);
-  if(!mn.length){c.innerHTML='<div style="color:var(--dim);font-size:13px;padding:50px 0;text-align:center">No data yet</div>';return;}
-  var colors={'gemma-4-E4B':'#7fd962','qwen3.6-27B-code':'#ffb454','qwen3.6-35B-A3B':'#d2a6ff'};
-  var sn={'gemma-4-E4B':'Gemma','qwen3.6-27B-code':'Qwen Code','qwen3.6-35B-A3B':'Qwen MoE'};
-  var mv=1; for(var m in models) for(var i=0;i<models[m].length;i++) if(models[m][i]>mv)mv=models[m][i];
-  mv=Math.ceil(mv*1.15)||1;
-  var W=labels.length>1?100/(labels.length-1):100,H=130;
-  var paths='';
-  for(var mi=0;mi<mn.length;mi++){var m=mn[mi],vals=models[m]||[],d='';for(var i=0;i<vals.length;i++){var x=i*W,y=H-(vals[i]/mv)*H;d+=(i===0?'M':'L')+x.toFixed(1)+','+y.toFixed(1)+' ';}paths+='<path d="'+d+'" fill="none" stroke="'+(colors[m]||'#39bae6')+'" stroke-width="2.5" stroke-linecap="round" stroke-linejoin="round" opacity="0.85"/>';}
-  var grid='';for(var g=0;g<=4;g++){var y=(g/4)*H;grid+='<line x1="0" y1="'+y.toFixed(1)+'" x2="100" y2="'+y.toFixed(1)+'" stroke="rgba(255,255,255,0.05)" stroke-width="1"/>';}
-  var svg='<svg viewBox="0 0 100 '+(H+16)+'" style="width:100%;height:'+(H+20)+'px;display:block" preserveAspectRatio="none">'+grid+paths+'</svg>';
-  var step=Math.max(1,Math.floor(labels.length/8)),lh='<div style="display:flex;margin-top:2px;font-size:10px;color:var(--dim);overflow:hidden">';
-  for(var i=0;i<labels.length;i+=step)lh+='<div style="flex:1;text-align:center">'+labels[i]+'</div>';
-  lh+='</div>'; c.innerHTML=svg+lh;
-  l.innerHTML=mn.map(function(m){return'<span style="display:flex;align-items:center;gap:6px;font-size:11px;color:var(--dim)"><svg width="18" height="10"><line x1="0" y1="5" x2="18" y2="5" stroke="'+(colors[m]||'#39bae6')+'" stroke-width="2.5"/></svg>'+sn[m]+'</span>';}).join('');
+function renderGPUMetrics(data){
+var el=$('gpu-metrics-card');if(!el)return;
+var lb={'qwen3.6-35B-A3B':'MoE','qwen3.6-27B-code':'Dense','gemma-4-E4B':'Gemma'};
+var h='';data.gpus.forEach(function(g){
+var nm=lb[g.id]||g.id,tp=g.temp_c||0,ut=g.gpu_util_pct||0,pw=g.power_w||0,pl=g.power_limit_w||0;
+var tc=tp>85?'#ef4444':tp>70?'#f59e0b':'#22c55e',uc=ut>90?'#ef4444':ut>70?'#f59e0b':'#22c55e';
+h+='<div class=\"mb-3\"><div class=\"fw-bold small text-white-50 mb-1\">'+nm+'</div>';
+h+='<div class=\"d-flex align-items-center gap-2 mb-1\"><span class=\"small text-secondary\" style=\"min-width:30px\">T</span><div class=\"flex-grow-1\" style=\"height:3px;background:#1e293b;border-radius:2px;overflow:hidden\"><div style=\"height:100%;width:'+Math.min(tp,100)+'%;background:'+tc+';border-radius:2px\"></div></div><span class=\"small\" style=\"color:'+tc+';min-width:30px;text-align:right\">'+tp+'C</span></div>';
+h+='<div class=\"d-flex align-items-center gap-2 mb-1\"><span class=\"small text-secondary\" style=\"min-width:30px\">U</span><div class=\"flex-grow-1\" style=\"height:3px;background:#1e293b;border-radius:2px;overflow:hidden\"><div style=\"height:100%;width:'+ut+'%;background:'+uc+';border-radius:2px\"></div></div><span class=\"small\" style=\"color:'+uc+';min-width:30px;text-align:right\">'+ut+'%</span></div>';
+if(pw>0){var pp=pl>0?Math.round(pw/pl*100):0,pc=pp>90?'#ef4444':pp>70?'#f59e0b':'#22c55e';h+='<div class=\"d-flex align-items-center gap-2\"><span class=\"small text-secondary\" style=\"min-width:30px\">P</span><div class=\"flex-grow-1\" style=\"height:3px;background:#1e293b;border-radius:2px;overflow:hidden\"><div style=\"height:100%;width:'+pp+'%;background:'+pc+';border-radius:2px\"></div></div><span class=\"small\" style=\"color:'+pc+';min-width:30px;text-align:right\">'+pw+'W</span></div>';}
+h+='</div>';});
+el.innerHTML=h;
 }
 
-function poll(){fetch('/api/state').then(function(r){return r.json();}).then(function(data){render(data);document.getElementById('connection-status').textContent='live';document.getElementById('live-dot').className='status-dot live';}).catch(function(){document.getElementById('connection-status').textContent='reconnecting...';document.getElementById('live-dot').className='status-dot';});}
-poll();setInterval(poll,3000);loadTimeseries();
+var cp='day';
+function switchPeriod(p){cp=p;document.querySelectorAll('.btn-sm-period').forEach(function(b){b.classList.remove('active')});event.target.classList.add('active');loadTS();}
+function loadTS(){fetch('/api/timeseries?period='+cp).then(function(r){return r.json()}).then(renderTS).catch(function(){})}
+function renderTS(d){
+var models=d.models||{},labels=d.labels||[];
+if(!labels.length)return;
+var cn=$('timeseries-chart'),lg=$('timeseries-legend'),mn=Object.keys(models);
+if(!mn.length){cn.innerHTML='<div class=\"text-secondary small text-center py-4\">-</div>';return;}
+var mv=1;for(var m in models)for(var i=0;i<models[m].length;i++)if(models[m][i]>mv)mv=models[m][i];mv=Math.ceil(mv*1.15)||1;
+var W=labels.length>1?100/(labels.length-1):100,H=130;
+var paths='';for(var mi=0;mi<mn.length;mi++){var m=mn[mi],vals=models[m]||[],d='';for(var i=0;i<vals.length;i++){var x=i*W,y=H-(vals[i]/mv)*H;d+=(i===0?'M':'L')+x.toFixed(1)+','+y.toFixed(1)+' ';}paths+='<path d=\"'+d+'\" fill=\"none\" stroke=\"'+(MC[m]||'#38bdf8')+'\" stroke-width=\"2\" stroke-linecap=\"round\" opacity=\"0.8\"/>';}
+var grid='';for(var g=0;g<=4;g++){var y=(g/4)*H;grid+='<line x1=\"0\" y1=\"'+y.toFixed(1)+'\" x2=\"100\" y2=\"'+y.toFixed(1)+'\" stroke=\"#1e293b\" stroke-width=\"1\"/>';}
+cn.innerHTML='<svg viewBox=\"0 0 100 '+(H+16)+'\" style=\"width:100%;height:'+(H+20)+'px;display:block\" preserveAspectRatio=\"none\">'+grid+paths+'</svg>';
+lg.innerHTML=mn.map(function(m){return'<span class=\"d-flex align-items-center gap-1\"><svg width=\"14\" height=\"8\"><line x1=\"0\" y1=\"4\" x2=\"14\" y2=\"4\" stroke=\"'+(MC[m]||'#38bdf8')+'\" stroke-width=\"2\"/></svg>'+(ML[m]||m)+'</span>';}).join('');
+}
+function poll(){fetch('/api/state').then(function(r){return r.json()}).then(function(data){render(data);$('connection-status').textContent='live';}).catch(function(){$('connection-status').textContent='reconnecting';});}
+poll();setInterval(poll,3000);loadTS();
 </script>
 </body>
 </html>"""
 
-@app.route("/")
+@app.route("/") 
 def dashboard(): return render_template_string(DASHBOARD_HTML)
 
 @app.route("/api/state")
diff --git a/nginx/nginx.conf b/nginx/nginx.conf
index fc101ee..c5363ff 100644
--- a/nginx/nginx.conf
+++ b/nginx/nginx.conf
@@ -32,7 +32,7 @@ http {
             proxy_set_header X-Real-IP $remote_addr;
             proxy_set_header Authorization $http_authorization;
             proxy_connect_timeout 10s;
-            proxy_read_timeout 300s;
+            proxy_read_timeout 600s;
             proxy_buffering off;
         }
 
diff --git a/router/router.py b/router/router.py
index 2af7acd..ffdceb8 100644
--- a/router/router.py
+++ b/router/router.py
@@ -210,7 +210,7 @@ def chat():
             except Exception: pass
         start = time.time()
         resp = requests.post(url+"/chat/completions", json=rd,
-            headers={"Content-Type":"application/json","Authorization":"Bearer not-needed"}, timeout=120, stream=is_stream)
+            headers={"Content-Type":"application/json","Authorization":"Bearer not-needed"}, timeout=300, stream=is_stream)
         lat = int((time.time()-start)*1000)
         gpu_decr(model)  # Release slot
         
@@ -229,8 +229,9 @@ def chat():
         data["routing"] = {"model":model,"reason":reason,"gpu":url,"tier":tier,"agent":agent,"latency_ms":lat,"active_gpu":gpu_active_count(model)}
         bcast()
         return jsonify(data)
-    except requests.Timeout: 
-        gpu_decr(model if 'model' in dir() else "unknown")
+    except requests.Timeout:
+        try: gpu_decr(model)
+        except: pass
         return jsonify({"error":"timeout"}), 504
     except Exception as e:
         log.error("Error: %s\n%s", e, traceback.format_exc())