速報
可達節點(relatives)排序還原因果順序:隨機DAG對因果發現評估的挑戰
以在隨機圖上施加順序生成的DAG為背景,研究發現節點的「可達節點」(relatives)數沿因果次序單調增加。作者以可達數排序回復因果順序,並示範在多數模擬中這是良好代理;當可達數嚴格遞增時,馬可夫等價類會簡化,建議考慮時間序列DAG作為替代。
速報
以在隨機圖上施加順序生成的DAG為背景,研究發現節點的「可達節點」(relatives)數沿因果次序單調增加。作者以可達數排序回復因果順序,並示範在多數模擬中這是良好代理;當可達數嚴格遞增時,馬可夫等價類會簡化,建議考慮時間序列DAG作為替代。
速報
大型語言模型在軟體開發中會為Python程式自動指定第三方函式庫版本。本研究以PinTrace對一千項StackOverflow任務測量十款模型的版本選擇、相容性與安全風險。發現模型頻繁選擇帶有已知CVE的版本且多為高嚴重度,版本選擇構成重要風險面。
速報
美國防務承包商L3Harris旗下負責先進間諜軟體與駭客工具的分部發生重大洩密。前任主管威廉斯被控竊取多項營業秘密,疑為可利用軟體漏洞的攻擊程式與監控技術,並出售給俄方經紀商Operation Zero。被告已認罪並入獄,法院最新判決要求他向前雇主支付1,000萬美元賠償,加上先前已命令支付的1.3百萬美元。
速報
美國國家公路交通安全管理局展開對Avride自駕Robotaxi的調查。Avride自駕系統在變換車道、同車道應對其他車輛及靜止物件時出現問題。事故發生時多由座內安全監控員在場但未介入。調查已識別十六起撞擊並造成一人輕傷。多起事故發生於德州達拉斯與奧斯汀。
速報
語音代理長期因上下文容量限制而帶來高成本與編排負擔,企業常需在系統加入會話重置、狀態壓縮與重建。OpenAI 推出三款即時語音模型:GPT-Realtime-2、Realtime-Translate 與 Realtime-Whisper,將對話推理、翻譯與轉寫拆成專責元件。
速報
回憶敘事以間接線索指涉實體。本研究提出IRC-Bench,用1994篇逐字稿與12337個維基連結實體評測非本地性實體識別,配對含實體與刪除實體版本,檢驗生成式大模型、密集檢索、RAG與微調等19種設定;開放世界由QLoRA調整的Llama3.1 8B表現最佳,閉環檢索則以微調DPR領先。
速報
評估大型語言模型常受調校與範例重用影響,導致選擇敏感性。論文提出SIREN:一套選擇感知的重複分割報告流程,固定搜尋後的候選榜單,分離分割內選擇與保留資料評估,並用項目層級的高斯乘子自助法估計不確定度。實驗顯示傳統以冠軍報告可能偏樂觀,SIREN更接近程序層級的有限樣本目標。
速報
Ubuntu與Canonical的網站與更新伺服器自週四起遭大規模DDoS攻擊而離線。攻擊方宣稱以Beam工具執行,屬booter類流量服務。事件發生在研究者公開可在多數Linux發行版取得root的利用程式碼後,官方通訊受限,更新則可由鏡像站取得。
速報
研究指出,檢索增強生成(RAG)讓大型語言模型引用外部知識,同時增加資料庫外洩風險。作者提出LeakDojo,可在可控環境下評估多種外洩攻擊與RAG系統脆弱性。測試涵蓋多款LLM與資料集,發現查詢生成與對抗性指令可獨立促成外洩,且指令遵從性較高的模型外洩風險更高。
速報
大型語言模型在惡意程式分析應用上常缺乏程式碼層證據與多樣指標支援。研究提出LCCD資料集與LCC-LLM框架,將約34K個PE樣本經反編譯和靜態逆向處理,使用反編譯C、組合語言、CFG/FCG、十六進位與PE欄位等程式碼中心表示。
速報
研究聚焦大型語言模型在組合優化中的自動啟發式設計。論文提出以知識為主的自上而下搜尋,將知識當作主要搜尋目標,再以程式實現驗證其效用。相比以程式為中心的做法,知識優先能提升發現效率與跨問題推廣性。並指出結合兩種策略可帶來額外提升,且重要在於構建可解釋且跨路徑保留價值的假說演化。
速報
代理式系統面臨預算與時限約束。提出蒙地卡羅組合規劃(MCPP),用模擬執行並在觀察後重規劃,估計並最大化受限下的工作流程完成機率。規劃涵蓋子任務的模型指派與平行採樣,同時管理剩餘預算與時間,以提升整體完成機率。在多種預算與時限條件下表現更佳。