深度分析
黎曼流形導引:GAGA 自編碼器與 Hellinger 拉回度量的無標籤模型操控
這篇研究將語言模型的「操控」(steering)重新框為黎曼幾何上的測地線問題,提出以幾何感知生成自編碼器(GAGA)學習一個輸出空間 Hellinger 距離的拉回度量,作為在激活空間上計算路徑的代理。
深度分析
這篇研究將語言模型的「操控」(steering)重新框為黎曼幾何上的測地線問題,提出以幾何感知生成自編碼器(GAGA)學習一個輸出空間 Hellinger 距離的拉回度量,作為在激活空間上計算路徑的代理。
深度分析
多模態檢索常用單一向量(single-vector)做全域比對,但會壓縮掉局部證據,影響細節敏感任務的準確度。
深度分析
臨床SOAP筆記自動化評估對具推理能力的大型語言模型進行來源感知測試,交叉比較推理模式與同源檢索(RAG)對產出影響。實驗涵蓋三個資料集、七項自動指標與兩位LLM評審,發現開啟原生推理並不穩定提升品質,反而在多數情況降低表現;同源RAG則帶來有限且具模型依賴性的改善。
速報
資安研究指出美國CISA自2025年11月起在公開GitHub倉儲暴露大量明文密碼、SSH私鑰與存取憑證。第三方測試者證實可用這些憑證以高權限存取多個AWSGovCloud帳號,涉案倉儲已下線並由承包商管理。此一事故突顯機構內部管理與代管倉儲設定風險。
深度分析
CrowdStrike、FBI與Verizon報告指出金融業遭遇以語音釣魚與OAuth裝置代碼濫用為主的新型入侵。攻擊者透過冒充IT客服要求MFA重設或誘導進行裝置代碼驗證,取得可長期使用的存取權。結果顯示傳統以密碼與單層MFA為主的防護面臨結構性失衡,防守重點須轉向令牌與會話層面的偵測與控管。
速報
研究提出「概念配置區(Concept Allocation Zone,CAZ)」,把概念看作在Transformer殘差流中跨層逐步形成的深度區間,而非僅找出單一最佳層的快照。作者以三項層級量測——分離度、概念一致性與概念速度——形式化CAZ,並衍生自動化邊界判定方法,避免人工掃層。
深度分析
在GoogleI/O上,Google宣布將多數GeminiCLI用戶轉移到封閉的AntigravityCLI。Antigravity主打代理人導向的開發平台,具備伺服端執行與終端整合,能在後台協調多代理人;但目前功能未完全對等,非開源且配額嚴苛,引發使用者反彈,企業與持有API金鑰者例外。
深度分析
研究指出既有次模目標僅優化被選子集而忽略剩餘資料的結構。本文提出補集次模資訊(CSI),透過同時最大化子集與其補集的結構資訊,衍生多種補集感知目標並在隱藏語義切片與去雜訊挑選上展現顯著改善。同時抑制孤立異常點並提升下游預測效能。對資料分割與基準建構具實務意義。
深度分析
研究以BiomedCLIP將大型視覺-語言模型作為弱標註,校準三個醫學影像基準的噪音標籤轉折位置。比較多種下游架構並提出可用十至二十個金標判定是否採用弱標註的決策規則。結果在三個資料集複現轉折現象,超過轉折後加入弱標註會降低AUC。研究亦比較結構性與隨機錯誤的差異,指出評估邊界需納入標籤空間投影。
深度分析
檢索增強生成常以單向量平均,但當相關集中於短子段時會被周遭噪聲稀釋。頻譜檢索以多尺度sinc在token軸做卷積平滑,跨尺度取最大相似度,介於meanpool與per-token MaxSim之間。實驗於合成與LIMIT-small顯示明顯召回與排序改善。
深度分析
網頁影像中的文本常因字形多樣、版面複雜與背景雜訊而難以直接翻譯,這類任務要求同時完成辨識與語意理解。本文介紹一個端對端框架 Visual-Aware(文中命名),以雙流視覺編碼配合雙向注意力的 Dual-Stream Attention Module(DSAM),將高階語義與低頻形態細節互相引導融合;
深度分析
面對有界時序邏輯(STL)監測的因果缺口,本文提出可在推論時硬化為三值邏輯電路的R-DTLGN。該模型以多項式代理在Kleene三值域訓練,並以軌跡蒸餾轉為精確門電路,能在感測或謂詞缺失時使輸出退回「未知」,同時維持預測能力。對安全監測具體應用具備價值