深度分析
STARFISH 以內部狀態對齊提升高稀疏度剪枝神經網路精度
隨著模型規模不斷膨脹,剪枝成為降低記憶體與運算成本的關鍵技術。研究提出STARFISH方法,利用少量未標記影像校正集,使剪枝後的網路內部表示與原始模型對齊,從而恢復精度。實驗顯示,在75%權重被剪除的情況下,STARFISH只需0.4%訓練影像即可恢復原始模型82%的準確率,遠超其他方法。
深度分析
隨著模型規模不斷膨脹,剪枝成為降低記憶體與運算成本的關鍵技術。研究提出STARFISH方法,利用少量未標記影像校正集,使剪枝後的網路內部表示與原始模型對齊,從而恢復精度。實驗顯示,在75%權重被剪除的情況下,STARFISH只需0.4%訓練影像即可恢復原始模型82%的準確率,遠超其他方法。
速報
研究者提出「強化隨機流映射」(Strong Stochastic Flow Maps, SSFMs)框架,直接學習加性噪聲隨機微分方程(SDE)的強解映射,將確定性流映射概念延伸至隨機情境。透過多項式近似布朗運動並證明路徑收斂,SSFMs 可在無需模擬的情況下訓練擴散模型的解映射。
深度分析
組合路徑規劃如 TSP、CVRP 受平面對稱影響。MViewRouter 以多視圖交替注意力與集合梯度內化 D4 對稱,讓決策具不變性。實驗證明在標準與實務基準上均達到競爭解品質與零樣本泛化,且較傳統測試時增強更穩定。預期此幾何等變性框架可擴展至 3D 約束路徑與其他車輛調度問題。
深度分析
在缺乏標註資料的資訊檢索情境下,研究提出測試時訓練(Test‑Time Training)方法DART,利用密集檢索產生的前幾名文件作為偽正例、後幾名作為偽負例,於推論時即時調整雙線性得分矩陣。實驗在六個BEIR基準上顯示,DART在保持每查詢低於10毫秒額外延遲的情況下,平均提升NDCG@10約2.1%。
深度分析
阿里巴巴本週推出Qwen3.7-Plus,具備百萬級上下文視窗與多模態輸入,支援文字、影像與影片,同時引入preserve_thinking參數保持推理連貫性。相較於前代僅文字的Qwen3.7-Max,成本降低約60%,在多模態與終端基準測試中超越多家美國商業模型。此授權模式引發開源與合規討論。
速報
多代理系統的溝通已受 Agent‑to‑Agent (A2A) 與 Model Context Protocol (MCP) 標準及去中心化身分驗證框架支援,但仍缺乏在組織信任邊界內,能在不解密負載的前提下進行語意路由的機制。
深度分析
Starlette為PythonAI服務常用框架,近期發現BadHost漏洞允許攻擊者在HTTPHost標頭注入字符,繞過路由授權。此缺陷波及FastAPI、vLLM、LiteLLM等上千套工具,導致憑證與敏感資料外洩風險升高。CVE-2026-48710編號,嚴重度7分。
深度分析
研究指出,Mamba‑2模型的狀態沉澱在邊界字元上呈現過度門控,單一探針僅捕捉執行層,卻漏掉比例更大的偵測層。兩層在表徵相似度上相近,但功能上差異顯著,刪除偵測頭會導致檢索表現崩潰。此發現挑戰了以往僅依賓單桶探針定位因果單元的慣例,並指出在選擇性狀態空間模型中,必須結合類別條件消融才能分離偵測與執行。
深度分析
隨著大型語言模型被廣泛用於人格化聊天機器人,傳統自陳問卷因訓練資料污染與社會期望偏差而失效。研究提出GenPT以全新生成的投射測驗取代問卷,三階段流程能在抗汙染與減少方向性偏差上表現更佳,且在長期諮詢情境中對抑鬱評估的變化更為顯著,此結果顯示投射測驗在AI心理測量領域的潛力。
速報
本研究探討在企業多代理系統中,是否應根據問題類別動態選擇協調策略(共識、辯論、合成或單一代理)而非全域固定。
深度分析
晶體管門氧化層變薄致量子穿隧位元翻轉,傳統電路可靠性受限。研究提出量子穿隧感知機器學習(QTAML)與穿隧感知補償(TAC),利用WKB推導錯誤分布,結合均值校正與層級位元保護。實驗於CNN與Transformer顯示,TAC在保持95%乾淨精度下,將ECC開銷降至原先3.4至33.6倍。
深度分析
WaveFilter以小波轉換改良擴散語言模型的KV快取,結合粗粒度語意概覽與多尺度遞迴篩選,顯著降低長序列計算成本,同時提升生成品質與效能,為長上下文任務提供更實用的解決方案。結合Fast‑dLLM後,WaveFilter在LongBench基準提升2%準確率,且吞吐量近,降低長上下文部署門檻。