深度分析
治理化元程式設計:以 machine forms 與物化效果控管 eval 權限
AI 系統日益在執行時產生可執行結構:大型語言模型會產生程式、代理會組裝工作流程、自我改進系統會修改自身行為。本文提出「治理化元程式設計」(governed metaprogramming):將程式表示視為第一級值、把表示層的操作維持為純運算,並把從表示到可執行機器的轉換(materialization)重新分類為需經治理仲裁的效果。
深度分析
AI 系統日益在執行時產生可執行結構:大型語言模型會產生程式、代理會組裝工作流程、自我改進系統會修改自身行為。本文提出「治理化元程式設計」(governed metaprogramming):將程式表示視為第一級值、把表示層的操作維持為純運算,並把從表示到可執行機器的轉換(materialization)重新分類為需經治理仲裁的效果。
深度分析
大型語言模型仍可能被對抗性攻擊繞過安全機制。本文揭示「拒絕軌跡」是一組分散於上游層與特定位置的時空激活模式,並提出SALO在推論時捕捉此類稀疏信號。SALO保留層與位置資訊,採多尺度投影與最大池化生成檢測向量,訓練僅用一般安全資料。實驗顯示SALO能在多種攻擊下大幅提升檢測率。
深度分析
本文報導一篇來自 arXiv 的研究,提出「認證純度」架構,將認知工作流程系統的治理從運行時習慣轉為結構化能力邊界。核心做法包括受限 WebAssembly 編譯目標(移除產生副作用的指令)、以密碼學簽章綁定的純度憑證、在執行前拒絕未經認證的執行器的運行時驗證閘,以及透過遠端見證實現跨組織可攜帶的治理憑證。
深度分析
Chat2Workflow 提出第一個以自然語言直接生成可執行視覺化工作流程的基準,資料集來自真實商業流程、覆蓋六大領域,並能轉換成 Dify、Coze 相容的 YAML 部署檔。研究發現現階段最先進的大型語言模型雖能掌握高階意圖,卻在節點選擇、控制流程與多回合變更下常產生不可執行或不穩定設計;
深度分析
託管LLM常被以低成本模型替代;論文提出以Merkle承諾的commit-open協議,事先提交SAE每位置信息,再隨機開放抽檢並以joint-z分數判定,能辨識跨家族與LoRA自適應替代,且在測試中對多數攻擊者均生效。承諾開放可閉合SVIP的平行提供漏洞,額外開銷小於特定批次延時上限。
深度分析
本文從代幣層級的歸因問題切入,檢視以可驗證報酬訓練(RLVR)時序列級獎勵如何被錯置到不重要的代幣,提出結合報酬極性與代幣熵的「四象限分解」診斷工具。作者用條件互信息形式化代幣與結果獎勵的依賴,證明代幣能承載的學習訊號上界受其熵限制;
深度分析
面對層級表頭、合併儲存格等複雜表格格式,ASTRA提出一套訓練-free的語意樹重構與雙模推理流程,以改善大型語言模型在表格序列化與數值推理上的盲點。系統由AdaSTR負責以LLM全域語意重建「邏輯語意樹」,保留顯性階層與隱性語義關係;DuTR則在該結構上執行雙模推理,結合基於樹的文本搜尋與符號化程式執行以做精準驗證。
深度分析
影像審查常以不透明標籤結論,SenBen 提出針對敏感內容的場景圖基準,使用電影影格與 Visual Genome 式標註,並以前沿 VLM 生成偽標籤再蒸餾成精簡模型;採用詞彙感知召回損失與解耦標籤頭改善生成失衡,實現空間定位的可解釋審查並提升本地推論效能。
速報
研究指出PDF前處理決定RAG問答表現。比較四種PDF→Markdown工具與21種管線,測試含清理、切分與metadata強化。以36份葡文行政文件和50題基準評估,Docling配合階層切分與圖像描述獲得最高94.1%準確率,metadata與層次切分對效能貢獻最大。
速報
近期隱私研究指出樣本定向會員推斷攻擊(MIA)顯著提升揭露風險。這項工作提出以最後層表示為基礎的單樣本暴露分數,並在線性情況下把個別風險解析為人口槓桿得分與殘差損失兩部分,明確連結幾何結構與隱私暴露。
深度分析
研究以不尋常動作影像為切入,檢視視覺語言模型在事件語意理解的盲點。研究採用VerbNet篩選動詞、以語言模型生成誤導性文本並用文字生成影像合成資料集。實驗比較多種VLM與對比學習模型,結果顯示現有模型難以區分語法正確與語意正確,表現明顯低於人類。
速報
研究提出 ECSEL,一種可解釋的分類法,直接學習 signomial 形式的符號方程,產生結構化閉式表達式,同時當作分類器與解釋器使用。作者在標準符號回歸基準上比現有方法復原更多目標方程,且計算成本顯著降低。憑藉效率,ECSEL 在分類準確度上可與既有機器學習模型競爭,並保有可解釋性。