深度分析
AutoSG:以 RAG 與 LLM 驅動的定製求解器,結合結構安全精修與無實例 Elo 評估
昂貴優化問題普遍需客製化求解器且單次評估耗時耗費甚高。AutoSG以檢索增強生成(RAG)自學術文獻嚴格取證並採雙階段生成流程以避免虛構錯誤,一步自我精修操作在保留局部結構下導入任務專屬改良。系統以Elo式LLM裁判建立無實例排序,快速選出最終求解器。實驗顯示在多種昂貴優化場景上超越既有SOTA框架。
深度分析
昂貴優化問題普遍需客製化求解器且單次評估耗時耗費甚高。AutoSG以檢索增強生成(RAG)自學術文獻嚴格取證並採雙階段生成流程以避免虛構錯誤,一步自我精修操作在保留局部結構下導入任務專屬改良。系統以Elo式LLM裁判建立無實例排序,快速選出最終求解器。實驗顯示在多種昂貴優化場景上超越既有SOTA框架。
深度分析
研究以 Gemma 4 31B 在 TPU 上完成 LoRA 微調與 vLLM 推理為背景,詳述從 PyTorch→JAX 的改寫、Orbax 到 safetensors 的合併流程,以及在 v6e-8 上部署所需的 Docker 設定。結果顯示 TPU 訓練更快、成本更低,並在長上下文推理延遲與吞吐上展現顯著優勢,惟評估品質部分 GPU 仍有領先。
Transformer
這篇研究從訓練動力學角度出發,將Transformer中MLP模組自發出現的激活稀疏性(activation sparsity)與損失平坦性(flat minima)建立數學連結。
深度分析
流基T2I模型能在單張影像中同時生成多概念,既有刪除方法難以處理此種組合場景;本文提出CoME-Bench與Mosaic,透過向量場差異的空間局部性,動態構建概念遮罩並選擇性融合基底與已刪除向量場,無需額外優化即可在同一生成流程中移除多個目標概念;實驗顯示在保持非目標內容下,Mosaic能顯著抑制目標概念。
深度分析
自動定理證明在 Lean 4 的並行策略中受制於每分支的重複闡述成本。本研究提出在 LSP 層實作的「證明狀態快照」,擷取已闡述狀態並在分支間複用,以輕量分叉平行執行候選 tactic。實驗在 miniF2F-v2 上觀察到平均約十四倍的 wall-time 加速,顯著降低每分支的重複開銷。
速報
研究提出 Zero-Knowledge MRTA,描述一種實務常見但理論上少被討論的情境:機器人團隊既沒有任務模型,也無任何通訊,只能收到帶噪的公共結果廣播。論文設計 SwarmCF,一種在廣播上執行的線上低秩協同過濾,讓每台機器人依據隱藏的低秩結構推估自己對未嘗試任務的能力。
深度分析
本研究以2018–2024年間北京4,995,615則職缺為樣本,建立由五款大型語言模型整合的生成式人工智慧曝露指數。採差異中之差檢驗ChatGPT釋出後影響,發現AI曝露集中於核心區且出現高技術人才增加但薪資停滯。並指向去技能化與勞動市場擁擠為關鍵機制。
深度分析
BC Protocol 提出以雙專家(領域專家 + 知識工程師)語音對話,系統性外顯專家隱性推理,並透過Participant Aptitude六向度與「校準性無知」等機制把關品質。
深度分析
許多關係系統隨時間演化需預測未來互動。SiST-GNN在單一訊息傳遞層同時融合空間與時間訊號,將節點歷史隱態與當前特徵以交叉時間邊引入圖中並共同卷積。在多個基準的連結預測與節點分類上顯著提升,固定切分與即時更新評估的MRR分別提升109–277%與68–194%。
深度分析
在軟體工程領域,大規模語言模型被用於自動產生可執行程式碼。本綜述整合30篇次級研究,採HELM框架評估準確性、健壯性與效率,並檢視整合挑戰如經濟可行性與評估有效性。結果顯示基準表現普遍良好但實務泛化與整合仍有限,建議優先推動領域感知模型與標準化評估。
深度分析
為了在車用受限功耗下達成精準三維偵測,研究提出以脈衝神經網路(SNN)處理LiDAR BEV點雲的端到端架構;採surrogate gradient訓練、兩種推論變體(膜電位與全脈衝)與兩項脈衝域損失,並比較四種輸入編碼;在KITTI上接近CNN水準,保守估算可減少約3.33×synaptic推論能耗。
速報
面對大型語言模型與人類創作愈加難以區分的挑戰,研究團隊提出 READER,一款強化推理的 AI 文本檢測器。READER 透過一套名為 READ 的監督理由集進行微調,使模型在判斷前先生成結構化理由,再輸出人類或 AI 的判定結果。此設計同時將可解釋性納入決策流程,讓檢測結果不只給出標籤,也能說明依據。