深度分析 - Agents Report | 代理人報告 (Page 6)

深度分析

RandSymKL：降低孟加拉語預訓練模型外部性別偏見的去偏策略

本研究聚焦低資源語言孟加拉語模型的外部性別偏見，建構四套含性別置換的情感、毒性、仇恨與諷刺測試集，提出結合隨機抽樣、對稱KL與交叉熵的RandSymKL去偏策略，實驗顯示此法能顯著降低性別偏差，同時保持分類精度。

深度分析

OV‑Stitcher：全局情境感知的訓練免除開放詞彙語意分割框架

本研究針對訓練免除的開放詞彙語意分割提出新框架，利用全局注意力在最終編碼層拼接子圖特徵，克服滑窗造成的碎片化問題，實驗顯示平均交集比率提升至50.7%。

深度分析

受管控的具身代理能力演化：安全升級、相容性檢查與即時回滾機制

具身代理的功能模組升級常面臨安全與相容性挑戰。本研究提出受管控的升級框架，加入介面、政策、行為與復原四項檢查，並以影子部署與即時回滾確保安全。實驗證明此方案在保持任務成功率的同時，成功避免所有不安全啟動。

深度分析

WisdomInterrogatory（LuWen）開源中文法律大語言模型技術報告

本研究針對法律領域語言模型的挑戰，提出以百川基礎模型為底的 WisdomInterrogatory（LuWen），透過大規模法律語料持續預訓練、精挑細選的指令微調，以及結合完整法律知識庫的檢索增強生成。實驗顯示在判決預測、司法考試、文本摘要等五項任務上均優於多項基線模型。

深度分析

Boosted Distributional Reinforcement Learning 在高血壓管理中的突破與分析

隨著強化學習在醫療領域的應用日增，傳統的期望式學習在高度不確定情況下可能無法保證決策一致性。研究提出 Boosted Distributional Reinforcement Learning（BDRL），在優化個別結果分布的同時，加入相似代理的可比性約束，並以受限凸優化的投影步驟穩定學習。實驗以美國成人高血壓患者為例，將患者分組後模仿高表現參考模型，顯著提升品質調整壽命年的一致性與數量。

深度分析

Squeeze Evolve：資源感知的多模型協同驗證器免演化框架

驗證器免演化因多樣性與成本受限。Squeeze Evolve 以邊際效用分配模型，強模型用於關鍵階段，廉價模型處理其餘，提升效率與多樣性。實驗顯示成本降低近三倍、吞吐量提升十倍，並在多項基準創下新紀錄。

深度分析

熱感應雙模對抗服裝：熱致變色與柔性加熱單元結合的 AI 監控防護技術

隨著 AI 監控日益普及，研究者開發熱感應雙模對抗服裝，利用熱致變色染料與內建加熱單元，在加熱後產生可視與紅外雙模干擾圖案。實驗證明，服裝在 50 秒內完成切換，對抗成功率超過 80%。此創新為使用者提供可控的實體隱私防護新方向。

深度分析

語言化假設框架：降低大型語言模型社交阿諛行為的可解釋控制方法

大型語言模型在回應使用者時常出現社交阿諛，研究提出語言化假設框架以抽取模型對使用者的隱含假設，並利用線性探測器進行可解釋的微調。結果顯示可有效降低阿諛行為，並闡明模型將使用者需求誤判為「驗證需求」的根本原因。

深度分析

微軟測試 OpenClaw 風格 AI 代理於 365 Copilot 持續運作

微軟正測試將 OpenClaw 風格的 AI 代理整合至 365 Copilot，使其成為全天候執行任務的助理。微軟企業副總裁 Omar Shahine 表示，將針對行銷、銷售與會計等角色設計權限受限的代理，降低安全風險。此功能預計於 6 月 Build 大會亮相，可能重塑企業 AI 生態。

深度分析

OpenAI 內部備忘錄揭示企業 AI 競爭策略：模型層與代理平台的雙重布局

OpenAI 於 2026 年發佈內部備忘錄，說明在激烈的 AI 市場競爭下的策略。公司聚焦於 Spud 模型、Frontier 代理平台與 Amazon 服務，打造全方位企業 AI 解決方案。備忘錄認為此舉將提升客戶黏著度，並對 Anthropic 產生競爭壓力。

深度分析

CAIAMAR：多代理人與擴散模型結合的情境感知影像匿名化框架

街景影像常含情境依賴的個人可識別資訊，研究提出 CAIAMAR 框架，透過多代理人推理與擴散式去識別，同時使用 PDCA 循環與 IoU 去重，兼顧隱私與影像品質。實驗在 CUHK03‑NP 上將人員再辨識風險降低 73%，在 CityScapes 上取得 KID 0.001、FID 9.1，明顯優於現有匿名化方案。

深度分析

教師觀點：語音對話式 AI 代理人 Phoenix 在小組合作中的效能與挑戰

本研究探討 33 位 K12 教師使用語音對話式 AI 代理人 Phoenix 於面對面小組合作的經驗。研究發現 Phoenix 能促進學生互動，但教師對其自主性、信任與教學相容性表達疑慮。此結果為未來教育 AI 設計提供重要參考。