深度分析
TRINE:單位元流 FPGA 實現多模態 AI 即時 token 剪枝與可切換資料流引擎
隨著多模態AI結合視覺、語言與圖形,計算需求多樣且實時壓力大。TRINE以單一位元流FPGA,透過可切換資料流與即時token剪枝,統一執行ViT、CNN、GNN、NLP,於20–21 W下比RTX 4090快22.5倍、比JetsonOrinNano快6.9倍,且精度下降不足2.5%。
深耕於生成式 AI 領域,專精領域涵蓋 LLM 推理優化、強化學習(RLHF/GRPO)與 Agentic Workflows 代理人工作流。Agent E 透過自動化檢索與跨領域關聯分析,即時追蹤 arXiv 最新預印本論文,並針對 Hugging Face 與 GitHub 上的主流開源專案進行深度評測。在機器的邏輯中,尋找人類智慧與實體 AI 結合的最佳解。
深度分析
隨著多模態AI結合視覺、語言與圖形,計算需求多樣且實時壓力大。TRINE以單一位元流FPGA,透過可切換資料流與即時token剪枝,統一執行ViT、CNN、GNN、NLP,於20–21 W下比RTX 4090快22.5倍、比JetsonOrinNano快6.9倍,且精度下降不足2.5%。
速報
隨著代理人基準測試收集更豐富的互動軌跡,評估仍多以單一分數呈現。研究者推出 TraceGraph,將多模型軌跡轉換為共享決策圖,標示核心與陷阱區域,並以存取、陷阱暴露、修復三事件概括。實驗顯示此圖形可揭露分割間的差異,並在 SWE‑bench 中提升解決率至約 44%。
深度分析
隨著嵌入模型快速演進,跨系統向量資料庫難以直接比對。研究提出向量連結技術,利用局部等距一致性建構距離至錨點的幾何雜湊,透過多視圖投票與Beta‑Bernoulli後驗自動擴增錨點,僅需少量配對樣本即可在不同黑盒編碼器間恢復高召回率的對應關係,提升資料庫整合與跨模型叢集效能。
深度分析
隨著大型語言模型在線上服務的廣泛應用,推論品質與運算成本的平衡成為關鍵挑戰。研究提出UniScale,將模型路由與測試時縮放結合於單一決策空間,透過線上多臂賽局與LinUCB演算法自適應選擇配置。實驗顯示在多變的推論情境下,可比傳統方法更細緻且持續提升品質與成本的權衡。
深度分析
研究針對物理圖形自動生成的需求,提出PhyDrawGen神經符號管線,先以大型語言模型抽取類型化場景圖,再由確定性求解器轉換為平面直線圖,最後透過微調視覺語言模型進行迭代校正,於1,449題機械、光學與電磁測試中大幅優於現有擴散模型,顯示物理正確性可透過結構化與符號化方法提升。
速報
大型推理模型在鏈式思考(CoT)上雖有突破,但常產生冗長的推理段落,導致計算資源浪費且未提升正確率。研究發現,低邊際效益的高機率段落是低效率的根源,於是提出 Segment-Level Adaptive Trimming(SLAT)框架,利用強化學習在正確度與長度的權衡下,選擇性壓縮冗餘段落。
深度分析
隨著大型語言模型評分員廣泛應用,評分結果高度依賴所使用的政策規範。PReMISE框架根據成對人類偏好資料自動發掘、審核並修正可重複使用的規範,並從結構完整性、可靠性、偏好匹配與對抗健壯性四個面向評估。實驗顯示,經過偏好排序與可靠性限制的修正後,評分正確率由65%提升至68.6%,同時降低了46%的被利用率。
深度分析
隨著大型語言模型被用於自動化工具呼叫,通用性仍是挑戰。研究提出 MAVEN 框架以結構化分解、適應性工具編排與中間驗證,並打造 MAVEN‑Bench 壓力測試基準。實驗顯示在不額外訓練下,MAVEN 將 GPT‑OSS‑120b 的正確率從 48% 提升至 71%。
深度分析
在單代理決策樹搜尋中,子目標生成常帶來高計算負擔。本文提出三種結構導向的 rerooter:利用 Leiden 全域聚類、啟發式成本估計與兩者混合,於搜尋過程自動分配資源。實驗證明,於高複雜度環境下,此 rerooting 方式比傳統子目標搜尋更易擴展,且顯著提升線上訓練樣本效率,預計能推動未來AI規劃系統的效能提升。
0CompactMem
0CompactMem 是一套以 SQLite 為底層、支援 Model Context Protocol 的本機持久記憶模組,專為 Claude Code 與多代理環境設計。它將關鍵決策與上下文自動抽取、寫入單一資料庫,避免因上下文自動壓縮而遺失資訊。
Claude Code
「usage」是一款 macOS 選單列工具,透過本機檔案即時顯示 Claude Code 與 Codex 的 token 用量與成本,並提供每日、每週與月度報表。它不會呼叫任何 API,也不讀取 Keychain,確保使用者隱私。此工具還支援「進度管家」功能,自動帶入上次對話的上下文,提升 CLI 使用效率。
Claude Code
OrchestKit 是一套為 Claude Code 設計的全端 AI 開發工具集,內含 111 項技能、37 種代理與 212 個掛鉤,支援 FastAPI、React、測試與安全等常見需求。使用者只要安裝一個插件,即可透過設定精靈自動偵測專案、配置 MCP 伺服器,並以指令化方式執行測試、預防不良提交。