深度分析
LEC:以線性期望約束在有限樣本下控制錯誤發現率的選擇性預測與雙模型路由
大型語言模型常在關鍵應用產生錯誤回答,傳統不確定性量表無法提供明確風險上限。本文改寫自 arXiv 提案 LEC(Linear Expectation Constraints),將選擇性預測重新詮釋為受限決策問題,以「線性期望約束」針對選擇與錯誤兩個二元指標建立統計約束。
深度分析
大型語言模型常在關鍵應用產生錯誤回答,傳統不確定性量表無法提供明確風險上限。本文改寫自 arXiv 提案 LEC(Linear Expectation Constraints),將選擇性預測重新詮釋為受限決策問題,以「線性期望約束」針對選擇與錯誤兩個二元指標建立統計約束。
深度分析
DataGrail 在其《Privacy and AI Trends Report 2026》中,分析 2,400 家商用軟體供應商,指出多數標榜具備人工智慧功能的廠商,未於資料處理協議(DPA)披露第三方 AI 子處理者。
深度分析
一群來自DeepMind、Apple、OpenAI等研究者成立Trajectory,欲打造能從真實使用互動持續學習的平台。以開源模型為基礎、用產品交互資料定期後訓練,已在客服與程式碼工具展現成效,未來將改變企業部署與工程需求。創投投入與多位知名研究者參與提升關注度。
深度分析
行動通訊研發面臨繁複週期與跨供應商整合挑戰。Genesis以代理人、技能與掛鉤構成閉環框架,並以Synapse作為事實與成果的知識層,將規範或假設自動化為可OTA驗證的實作與測試回饋。實驗顯示其在多項案例能成功將新功能從規範推向實裝,對RAN開發流程具有實質加速與可觀測效果。
深度分析
在生成式模型逐步抹去低階偵測訊號的當下,研究提出「社交凝視一致性」作為一條高階語義偵測軸,聚焦多人人像中目光、頭眼對齊與瞳孔位置的互動一致性。作者透過配對編輯(只重繪眼周)、一套區塊式說明監督與跨架構驗證,證明此語義線索可跨生成器與不同骨幹遷移,於互動型子集上帶來可觀的平衡準確度提升,並指出這類語義線索將隨低階訊號消失而愈發重要。
深度分析
需求文件常以流程圖呈現,卻多為靜態影像,阻礙自動化處理。本文提出 EdgeFlow:以 Canny 邊緣圖作為結構先驗,輔助 VLM 生成 Mermaid 格式流程表示,無需標註訓練資料即可提升節點與連線的拓撲正確性,在工業資料集上觀察到顯著提升,有助於模型驅動測試與變更影響分析。
深度分析
面對現代入侵偵測系統每天成千上萬的警示與嚴重的警示疲乏,研究提出以次常態高斯模糊數(Subnormal Gaussian Fuzzy Numbers, SGFN)為核心的警示優先排序框架。每則警示以三參數描述:核心值代表威脅嚴重度、擴散代表影響不確定性、高度代表偵測可信度;
深度分析
背景:LLM可作為進化演算法中的突變器,卻受限於單一模型的偏差。核心作法:DEI在分散式Quality‑Diversity搜尋中指派異質大型語言模型為節點突變器,並以非同步冠軍分享引入跨模型對抗壓力以擴大行為多樣性。結果:在相同總呼叫預算下,異質合奏提升了合併檔案的QD‑Score與覆蓋率。
深度分析
開放式問答易出現幻覺,MiRD將整體未覆蓋風險拆為有限抽樣失敗與條件篩選失敗。先為抽樣失敗建立期望上界,再於抽樣成功時以全量校準集合校準篩選閾值,實驗顯示可同時控制兩類風險。對比傳統成功條件校準與PAC式界限,MiRD提供更緊的第一階段界限與更具適應性的預測集合。
深度分析
大型 C 程式驗證因狀態爆炸受限,ConVer 以自上而下分解系統斷言,利用大型語言模型自動合約合成,並在 CEGAR‑SMART ICE 迴圈中持續精煉,於四組基準測試中最高達九十六%驗證成功,展示了 AI 輔助形式驗證的可行性,此方法亦為未來 AI 驅動的軟體安全驗證鋪路。
深度分析
結構化資料常用GBDT,兩方垂直分割訓練時識別碼對齊為隱私風險。論文提出匿名訓練,利用雙向circuit-PSI與可編程不可知偽隨機函數實現隱匿ID的逐次聚合。透過將電路PSI輸出作為共享狀態並改良同態加密打包,將部分成本減半。同時實驗顯示效率接近有洩漏的方案。
深度分析
本研究在 Kalai & Vempala 的機率框架上,提出「innovation(創新)」作為衡量模型產生訓練資料外輸出傾向的簡單指標。作者證明創新既由校準條件與缺失質量所蘊含,亦能反向近乎刻畫幻覺現象;換言之,創新與幻覺在該框架下幾乎等價。