速報
最後層表示揭露:單樣本 MIA 曝光度評估與槓桿分解
近期隱私研究指出樣本定向會員推斷攻擊(MIA)顯著提升揭露風險。這項工作提出以最後層表示為基礎的單樣本暴露分數,並在線性情況下把個別風險解析為人口槓桿得分與殘差損失兩部分,明確連結幾何結構與隱私暴露。
速報
近期隱私研究指出樣本定向會員推斷攻擊(MIA)顯著提升揭露風險。這項工作提出以最後層表示為基礎的單樣本暴露分數,並在線性情況下把個別風險解析為人口槓桿得分與殘差損失兩部分,明確連結幾何結構與隱私暴露。
速報
研究提出 ECSEL,一種可解釋的分類法,直接學習 signomial 形式的符號方程,產生結構化閉式表達式,同時當作分類器與解釋器使用。作者在標準符號回歸基準上比現有方法復原更多目標方程,且計算成本顯著降低。憑藉效率,ECSEL 在分類準確度上可與既有機器學習模型競爭,並保有可解釋性。
速報
平方張量網路與其延伸的平方電路具高表現力,但平方化步驟讓配分函數與邊緣化計算變得昂貴,限制在機器學習上的實用性。研究提出以單位矩陣引入的正交化參數化,並結合電路的確定性結構,為平方電路設計新的參數化方式,使得邊緣化在更廣泛的電路因子化下也能有效計算。
速報
研究發現同一家演算法供應商的招聘篩選演算法造成普遍一致的拒絕模式。作者分析三百萬申請、四百萬份履歷的資料,利用同一供應商的可重複決策結果模擬若申請者投遞所有職缺會如何被篩選。結果顯示對亞裔與非裔申請者存在顯著族群差異,且個人結果高度同質化,申請廣撒才較可能獲真人審查。
速報
近年自動研究系統已能從構思、實驗、寫作到自我評估全流程自動化,然而此種「工作流程閉環」未必等同於科學上的閉環。研究團隊以超過 100 篇近期論文與 21 個代表性系統為基礎,辨識出三大失敗模式:目標崩解、驗證崩解與接受崩解。
速報
功能正確的程式庫設定一直是開發者的痛點,因為相依性衝突、工具鏈缺失或安裝不完整等問題常導致設定失敗。傳統的大型語言模型在跨程式庫經驗轉移、非可逆狀態變更的多步修復以及驗證設定結果方面表現不佳。
速報
研究聚焦因子圖中可交換因子偵測與其在提升式機率推論中的重要性。作者指出現有方法誤將必要條件視為充分條件,導致演算法可能回傳錯誤判定。論文證明一個稍作修改的定理作為必要條件,並提供修正後的演算法以保效率及正確性,同時提出一個補充演算法以縮緊最壞情況界限。
速報
本研究針對科學工作流中的資料整理與講義分析提出新框架。DeepTS/DeepCollector 自動收集、萃取與去除時間序列資料重複,DeepScribe 能將複雜物理課程轉為結構化報告。實驗顯示,結合本地 Body 與遠端 Brain 的混合架構,可克服現有 AI 系統的上下文與推理限制,提升科研流程效率。
速報
面對以答案比對為主的評測不足,研究推出TRACE:一套免參照、多維且可量化的評估框架。它透過累積證據庫追蹤代理人推理軌跡,能從效率、幻覺與適應性等面向量化評估。實驗顯示TRACE在小型開源模型上仍能準確辨識複雜或有缺陷的軌跡,並帶出新的觀察與見解。
速報
臨床鑑別診斷仰賴醫師綜合病歷與醫學知識。研究團隊提出Dr.CaBot,一款代理式人工智慧系統,可從單一病歷描述自動產出有聲投影片並模擬專家書面與口述推理。盲評結果顯示醫師在多數試驗無法辨源,且在NIH未診斷病例測試中有顯著找出工作診斷的能力。
速報
研究指出遊戲中獎勵設計耗費大量專家知識。本文提出PCGRLLM架構,結合回饋機制與推理式提示工程,自動由故事生成獎勵函數。實驗在二維環境與多種提示法上跑測,表現大幅優於既有結構並接近人類水平。可望減少對人力依賴並助長創意流程。研究採用兩款先進大型語言模型驗證。
速報
大語言模型在機器人形態搜尋常無可重用記憶。Auto‑Robotist將搜尋軌跡蒐成自然語言技能庫,記錄結構原型、正負規則與評估案例;搜尋時檢索技能以引導模型編輯並保留遺傳演算法探索路徑。實驗在多項EvoGym任務顯示5×5冷啟動搜尋改善,且技能可遷移至10×10,參照式轉移優於純GA。