速報
Transformer在布林函數上的泛化:傅立葉頻譜與PAC-Bayes的低銳利度路徑
研究從傅立葉頻譜角度切入transformer在布林任務的泛化,採用PAC-Bayes方法指出若目標函數頻譜稀疏且集中於低階成分,可構造低銳利度和平坦極小值,並對理想化學習者套用PAC-Bayes界獲得非虛無的泛化界;實驗與機械可解釋性分析支援此理論構想。
速報
研究從傅立葉頻譜角度切入transformer在布林任務的泛化,採用PAC-Bayes方法指出若目標函數頻譜稀疏且集中於低階成分,可構造低銳利度和平坦極小值,並對理想化學習者套用PAC-Bayes界獲得非虛無的泛化界;實驗與機械可解釋性分析支援此理論構想。
速報
社群貼文常附多張圖片,但影像與文字關聯薄弱或具誤導性,導致「始終啟用」的多模態融合浪費運算並放大錯誤視覺線索。研究提出SAVER,一套對命名實體辨識與關係抽取僅在必要時啟用視覺證據的框架。SAVER以Conformal Groundability Gate判定字串或實體對的視覺可依據性,並以一種校準程序設定觸發門檻;
速報
為改善程式碼生成在推論時的表現,DiffCodeGen提出以覆蓋率導向差異分析取代對現成測資或額外大型模型呼叫的依賴。系統先以多樣採樣生成候選,再用覆蓋率驅動的模糊測試合成執行輸入並記錄候選的動態行為,依行為相似性聚類後選出最大叢集的代表作為最終輸出。實驗顯示該方法在效能與資源使用上達到競爭或更佳的結果。
速報
TorchSight是一套以本地部署為核心的安全文件分類系統,採用微調後的Qwen 3.5 27B 模型作為分類核心。研究團隊以78,358筆來自13個開放授權來源的樣本,並加入由GPT‑4生成的合成資料,覆蓋七大安全類別與51個子類別進行訓練與驗證。
速報
研究指出可將預訓練文本→影像擴散模型,透過參數高效的FullFlow轉為雙向視覺語言生成器。作法只訓練LoRA適配器與輕量文字頭,保留影像在流空間的先驗,並為文字加入離散插入流程。實驗在Stable Diffusion 3上顯著提升雙向能力,並降低顯存與加速推理。
速報
人工智慧訓練界面臨速度與深度退化問題。研究把預測編碼重構為階層高斯過濾,恢復精準度加權訊息傳遞,使每層估算不確定性並同時學習權重與精準度;在FashionMNIST上,耗時與收斂逼近反向傳播,且在線學習、數據效率與概念漂移任務表現更佳,且推論不需迭代或全域誤差訊號。
速報
談判理論強調在同理與主張間取得平衡,但人類難以穩定控制這些張力。本文提出「個性工程」,以人工智慧代理人精準參數化並操控談判者個性,採用以暖度與主導性為核心的人際圓盤座標系。這方法更能在受控環境嚴謹檢驗經典理論並指導人工智慧談判代理人格設計。
速報
美國聯邦調查局與歐洲刑警組織等國際執法機構聯手,於本週四關閉了廣受勒索軟體團夥使用的 First VPN 服務,並逮捕其管理員。該 VPN 在 27 個國家部署伺服器,為超過 25 個勒索軟體組織提供匿名連線、匿名付款與隱蔽基礎建設,協助其執行惡意掃描、僵屍網路、DDoS 攻擊與詐騙行為。
速報
OpenAI 宣稱一款新一代通用推理模型提出原創數學證明,挑戰保羅·Erdős 在1946年提出的著名幾何猜想。這次成果附有數位數學家支持意見,OpenAI 表示模型能維持長距離且複雜的推理鏈,並跨領域串接概念。
速報
事件背景:Anthropic以大規模算力需求向xAI取得Colossus 1全量輸出。核心做法:透過長期租用與月費結構鎖定資料中心產能,xAI藉此把閒置運算對外商品化並採取折扣期配合擴能。主要影響:合約揭露後顯示產業正往可變現閒置算力的「neocloud」模式移動。
速報
英偉達公布截至4月26日的季度財報,營收創新高。公司指Blackwell架構已被各大超大規模雲端服務商及模型開發者採用,資料中心營收達到$75.2b,並授權$80b回購,私有持股由$22b增至$43b,公司預告下一季營收估$91b成長約12%。
速報
文字轉影片快速增長帶來安全風險。研究提出SceneSplit,將有害敘事拆成多個各自無害的場景,藉場景序列收窄生成空間並導向不安全結果。配合迭代場景操作與策略庫以繞過過濾器。評估在多款T2V模型上顯示攻擊成功率顯著提升。此結果提示現行安全機制需重新審視與改進。