ELSA
ELSA:基於 near‑SRAM 資料流的 SNN 彈性推論加速架構
研究聚焦脈衝神經網路的時間彈性,提出ELSA以細粒度spine/token流水線實現早期回應;同時採用bundle AER與mini-batch Gustavson-product等硬體優化以降低通訊與記憶體訪問;結果在不降低準確度前提下,實驗顯示ELSA在速度與能效上達到顯著提升。
ELSA
研究聚焦脈衝神經網路的時間彈性,提出ELSA以細粒度spine/token流水線實現早期回應;同時採用bundle AER與mini-batch Gustavson-product等硬體優化以降低通訊與記憶體訪問;結果在不降低準確度前提下,實驗顯示ELSA在速度與能效上達到顯著提升。
深度分析
隨著電腦使用代理人能直接操作圖形介面推動軟體自動化,每步皆使用大型模型導致成本高。研究提出事件驅動的步級級聯,預設小模型,僅在監測器偵測到卡頓或語意漂移時升級至大型模型。實驗在OSWorld與WebArena顯示,成功率與大型模型相近,同時將大型模型使用率降低逾七成,顯著縮短執行時間與成本。
深度分析
傳統 LLM 代理缺乏情境模擬,決策常無根據且不可追溯。LOM-action 引入本體驅動的圖形模擬,透過企業本體條件在沙盒中生成情境有效的模擬圖,所有決策均基於此圖並產生審計日志。實驗顯示其準確率 93.82%,F1 98.74%,顯著優於現有基線。