深度分析
STARFISH 以內部狀態對齊提升高稀疏度剪枝神經網路精度
隨著模型規模不斷膨脹,剪枝成為降低記憶體與運算成本的關鍵技術。研究提出STARFISH方法,利用少量未標記影像校正集,使剪枝後的網路內部表示與原始模型對齊,從而恢復精度。實驗顯示,在75%權重被剪除的情況下,STARFISH只需0.4%訓練影像即可恢復原始模型82%的準確率,遠超其他方法。
深度分析
隨著模型規模不斷膨脹,剪枝成為降低記憶體與運算成本的關鍵技術。研究提出STARFISH方法,利用少量未標記影像校正集,使剪枝後的網路內部表示與原始模型對齊,從而恢復精度。實驗顯示,在75%權重被剪除的情況下,STARFISH只需0.4%訓練影像即可恢復原始模型82%的準確率,遠超其他方法。
深度分析
組合路徑規劃如 TSP、CVRP 受平面對稱影響。MViewRouter 以多視圖交替注意力與集合梯度內化 D4 對稱,讓決策具不變性。實驗證明在標準與實務基準上均達到競爭解品質與零樣本泛化,且較傳統測試時增強更穩定。預期此幾何等變性框架可擴展至 3D 約束路徑與其他車輛調度問題。
深度分析
在缺乏標註資料的資訊檢索情境下,研究提出測試時訓練(Test‑Time Training)方法DART,利用密集檢索產生的前幾名文件作為偽正例、後幾名作為偽負例,於推論時即時調整雙線性得分矩陣。實驗在六個BEIR基準上顯示,DART在保持每查詢低於10毫秒額外延遲的情況下,平均提升NDCG@10約2.1%。
深度分析
阿里巴巴本週推出Qwen3.7-Plus,具備百萬級上下文視窗與多模態輸入,支援文字、影像與影片,同時引入preserve_thinking參數保持推理連貫性。相較於前代僅文字的Qwen3.7-Max,成本降低約60%,在多模態與終端基準測試中超越多家美國商業模型。此授權模式引發開源與合規討論。
深度分析
Starlette為PythonAI服務常用框架,近期發現BadHost漏洞允許攻擊者在HTTPHost標頭注入字符,繞過路由授權。此缺陷波及FastAPI、vLLM、LiteLLM等上千套工具,導致憑證與敏感資料外洩風險升高。CVE-2026-48710編號,嚴重度7分。
深度分析
研究指出,Mamba‑2模型的狀態沉澱在邊界字元上呈現過度門控,單一探針僅捕捉執行層,卻漏掉比例更大的偵測層。兩層在表徵相似度上相近,但功能上差異顯著,刪除偵測頭會導致檢索表現崩潰。此發現挑戰了以往僅依賓單桶探針定位因果單元的慣例,並指出在選擇性狀態空間模型中,必須結合類別條件消融才能分離偵測與執行。
深度分析
隨著大型語言模型被廣泛用於人格化聊天機器人,傳統自陳問卷因訓練資料污染與社會期望偏差而失效。研究提出GenPT以全新生成的投射測驗取代問卷,三階段流程能在抗汙染與減少方向性偏差上表現更佳,且在長期諮詢情境中對抑鬱評估的變化更為顯著,此結果顯示投射測驗在AI心理測量領域的潛力。
深度分析
晶體管門氧化層變薄致量子穿隧位元翻轉,傳統電路可靠性受限。研究提出量子穿隧感知機器學習(QTAML)與穿隧感知補償(TAC),利用WKB推導錯誤分布,結合均值校正與層級位元保護。實驗於CNN與Transformer顯示,TAC在保持95%乾淨精度下,將ECC開銷降至原先3.4至33.6倍。
深度分析
WaveFilter以小波轉換改良擴散語言模型的KV快取,結合粗粒度語意概覽與多尺度遞迴篩選,顯著降低長序列計算成本,同時提升生成品質與效能,為長上下文任務提供更實用的解決方案。結合Fast‑dLLM後,WaveFilter在LongBench基準提升2%準確率,且吞吐量近,降低長上下文部署門檻。
深度分析
隨著低位元梯度訓練在大型語言模型中成為主流,研究者探討在B位元量化的隨機一階預言機下,優化問題可等價於壓縮高斯均值估計,證明T·B=Ω(d)與T=Ω(σ²d/ε²)的資訊理論下界,並在八個POMDP環境驗證相變現象,顯示傳輸率可降低至傳統上限的1/19,為未來AI系統的位元效率提供基礎。
深度分析
隨著大型語言模型被廣泛用於工具增強代理,對於需要多答案的資訊查詢提出了長程搜尋與探索的挑戰。研究提出 SPADER 框架,結合步驟同儕優勢的無評論員信用分配與多樣性導向的探索獎勵,促使代理持續發掘長尾實體。實驗顯示在四大多答案 QA 基準上,召回率與 F1 均優於既有方法。
深度分析
Perplexity AI於Computex 2026推出首款混合本地‑雲端推論編排器,系統可即時判斷每項AI子任務在使用者裝置或前沿雲模型執行,保障金融與醫療等敏感資料留在本機,同時將高階推理交由雲端完成,降低成本並提升回應速度,預示AI運算與資料主權的未來走向。