速報
支援感知仲裁:可調解析度的反覆控制與壓縮策略
當系統對某一假設做出承諾時,原始證據的結構常因壓縮而遺失,影響後續的驗證與回復決策。本文提出一種反覆仲裁架構,透過主動約束場共同形成候選假設的幾何結構,並將該幾何壓縮為一個支援感知的控制狀態;此控制狀態的解析度由當前後果幾何、仲裁記憶與資源限制動態調節。
速報
當系統對某一假設做出承諾時,原始證據的結構常因壓縮而遺失,影響後續的驗證與回復決策。本文提出一種反覆仲裁架構,透過主動約束場共同形成候選假設的幾何結構,並將該幾何壓縮為一個支援感知的控制狀態;此控制狀態的解析度由當前後果幾何、仲裁記憶與資源限制動態調節。
速報
Anthropic 與 Amazon 達成新一輪協議,Amazon 注資50億美元。雙方以 AWS 雲端與 Trainium 系列晶片為核心,Anthropic 取得訓練與推理所需的大規模運算容量,並承諾十年內在 AWS 支出超過1000億美元。此舉強化雲端與晶片綁定的策略合作。
速報
週末駭客從KelpDAO竊取逾2.9億美元加密資產,攻擊透過LayerZero跨鏈橋並利用Kelp單一驗證設定發動,惡意交易獲准後資金被轉出。LayerZero指向疑似北韓駭客組織TraderTraitor,Kelp則回應。此案成今年最大加密失竊案之一。
速報
本報導介紹一項學術新構想:Neural Computers(NCs),目標是把傳統電腦的運算、記憶與輸入輸出整合成一個可學習的執行狀態,長期願景稱作完全神經電腦(CNC)。研究者先以影像模型作為 NC 的原型,從純粹的 I/O 追蹤資料學習介面行為──在命令列與圖形介面情境中,模型以指令、畫素與使用者操作為輸入,滾動並預測畫面。
速報
美國國家安全局據報使用Anthropic的Mythos預覽版。Mythos以資安檢測為訴求,廠商稱其能力可能衍生攻擊風險,僅授權數十機構測試。NSA據稱主要用於掃描可利用弱點,此一使用與五角大廈對該公司的質疑形成矛盾。此事引發外界對政府採購與風險控管的討論。
速報
研究指出草根行動與自動化影響操作界線正在消融。一種稱為「賽博格宣傳」的封閉回路架構結合經驗證的人類帳號與演算法自動化,可在大規模下產出個人化訊息。此種做法利用人類驗證來掩飾自動化協調,繞過現有人機二分治理框架。結果是政治論述從觀點競爭轉為演算法競選的對抗。
速報
在電話醫療、客服與智慧眼鏡等場景,常只能錄到對話一方。研究提出「一側對話問題」(1SC),定義在僅見一方話語時的推斷與學習目標,並聚焦兩項任務:即時重建缺席講者的輪次,以及從單邊逐字稿生成摘要。作者在MultiWOZ、DailyDialog與Candor等資料集上比較提示法與微調,發現取得一個未來回合與話語長度資訊能改善重建效果;
速報
社會科學研究開始利用大型語言模型生成「矽樣本」作為受訪者替代,但這類合成資料的生成牽涉多項分析選擇。作者透過兩項實驗檢視配置差異是否會實質改變與真實人類資料的對應性。第一項研究測試252種配置,評估排序、反應分布與量表間相關;第二項則以已發表案例重測66種替代配置。
速報
部署強化學習代理需維持觀察、動作與結果的閉環耦合。本研究提出「雙可預測性」(Bipredictability)與資訊數位孿生(IDT),用熵與互資訊衡量循環中不確定性的解析與方向性。實驗顯示IDT在多種擾動下比獎勵式監控更早檢測耦合退化,檢測率與延遲皆有優勢。
速報
本文從技術實作角度檢視人工智慧代理在面對多目標不可通約抉擇時的設計限制。作者主張,現行以多目標最佳化為核心的代理在結構上無法識別不可通約,進而引發阻塞、不可信與不可靠三種對齊問題;即便能識別,代理也難以非任意地解決難選,常見的人類參與機制在許多決策情境不足以緩解。
速報
LLMs在精神醫療有潛力但常缺臨床推理與情感溝通。WiseMind以多代理人設計:理性心負責循證判斷、情感心負責共情表達,並以DSM-5導向的結構化知識圖引導問診,顯著降低幻覺生成。系統在模擬與真人測試達到85.6%首位診斷準確率,優於單代理基線。
速報
研究指出現有個資偵測資源分散且標註互不相容。PIIBench整合十個公開資料集,將80多種來源標籤標準化為BIO格式並採頻率抑制與分層80/10/10切分。對八套既有系統評測顯示span-level F1均低於0.14,呈現明顯難度上升且資料更全面。