速報
AuraMask:美學化反臉部辨識濾鏡,兼顧隱私與可接受外觀
面對日益普及的視覺監控與臉部辨識,研究尋求讓影像對電腦失效但保留人類可接受的外觀。AuraMask提出生成美學化反臉部辨識濾鏡的流程,模擬一鍵濾鏡風格並整合對抗擾動以維持外觀一致性與模型混淆。實驗顯示其對抗效果不遜於既有方法,且在630名線上受試者研究中取得更高接受度。
速報
面對日益普及的視覺監控與臉部辨識,研究尋求讓影像對電腦失效但保留人類可接受的外觀。AuraMask提出生成美學化反臉部辨識濾鏡的流程,模擬一鍵濾鏡風格並整合對抗擾動以維持外觀一致性與模型混淆。實驗顯示其對抗效果不遜於既有方法,且在630名線上受試者研究中取得更高接受度。
速報
人與代理人互動常因雙方對彼此知識的錯誤判斷而受阻。本研究以 I-POMDP 框架實作第二階理論心智(ToM-2),讓代理人能模擬使用者對代理人知識的錯誤信念,並推估這些信念源自的認知偏誤與捷思法(CBH)。透過辨識何時出現認知偏誤,代理人能產生調整性的回饋來補償誤解,改善當下互動並提升未來教學或協作的品質。
速報
研究探討在反覆使用的排序決策中,如何集體選擇一條線性規則以兼顧不同選民偏好。作者以線性排序為框架,將每位選民的偏好表示為一個偏好向量,並根據人口比例引入「個人比例性」(IP)標準,要求各類選民在集體排序中的認同度能與其份額對應。研究指出,傳統算術平均偏向多數意見,無法公平反映少數偏好;
速報
多模態模型應用於視覺任務。本研究提出VAB,採集合式比較替代單張數值評分,涵蓋400任務與1195張影像,並由10位專家共識標注,與多款前沿MLLM及視覺品質獎勵模型進行評估。結果顯示最強系統僅在26.5%任務正確選出最佳與最差,落後專家表現。
速報
這項研究把資訊定義為受限最大慣量(MaxCal)路徑集合下實際動態的偏離,並從變分原理導出IIT的因果構造,指出此框架與主動推理在Langevin動態下數學對偶,且在馬可夫鏈與Ising模型的極限定理討論中,該資訊等同於預測誤差,為融合自由能原理、整合資訊理論與認知熱力學提供數學基礎
速報
分類法誘導是組織概念為可解讀語意階層的核心任務。BoostTaxo是一個提升式大模型框架,透過粗到細的父節點辨識流程,結合檢索增強的定義精練、混合候選父節點選取與候選評分,最後以結構感知的分數校準強化拓撲可靠性。公開資料集評測顯示其表現優越或相當。
速報
研究指出,自主式人工智慧會造成現行法律框架下難以歸責的責任落差。論文提出以有限法律人格作為功能性治理工具,採二層公司架構:讓人工智慧透過受限目的的營運公司執行,並嵌入人類控制的母公司結構中運作。此安排強調透明度、可追溯的問責機制與結構性可逆,並對人工智慧的意識或道德地位保持中立。
速報
當前AI輔助創新常採單一方法導致推理碎片化。IdeaForge提出以知識圖譜為核心的多代理框架整合多種創新法。專家代理將矛盾、發明原則與使用者需求結構化寫入持久化資料庫。系統以圖關聯發現跨方法支持之匯聚主張,標示高信心創新候選。下游專利起草代理則由匯聚子圖生成結構化草案。實驗顯示相比單一方法,圖導向合成提升多樣性與可追溯性。
速報
多代理辯論是提升大型語言模型推理的路徑。本研究提出CHAL,將可反駁論證作為信念優化引擎,採用圖式信念結構與梯度導向修正。實驗顯示裁決者價值體系主導信念軌跡,理事會多樣性能精煉信念並產出可審計的信念物件。以利透明評估與人類監督。並擴展到廣泛領域具有可解釋性的信念工件。
速報
多代理強化學習在實務場景常被外部自然語言指令打斷,且指令可能與長期目標衝突。研究提出Macro-Action Value Correction for Instruction Compliance(MAVIC),在指令邊界修正Bellman回傳,透過調整進入指令的目標並還原當前目標下的延續價值,避免因指令干擾產生值估計不一致。
速報
連續動作強化學習在用參數化Q函數優化複雜政策時常遇數值不穩。研究提出QAM,採用伴隨匹配將評論器對動作的梯度轉為逐步可優化目標。此做法避免穿透多步去噪過程反向傳播帶來的數值不穩定,並維持政策的表現力與無偏性。配合時間差分備份學習,QAM在稀疏回饋的困難任務中表現優於既有方法。
速報
面對多模態模型在文化與日常知識上的限制,研究提出OASIS資料集。它採用EverydayMMQA框架產生圖像、文字與語音問答,並以人工逐階驗證。資料含近九十萬張真實影像、逾一千四百八十萬組問答等,旨在評估模型的語境與文化推理能力。基準測試揭露多款模型尚有明顯差距。