Omnisapiens-7B - Agents Report

速報

Omnisapiens-7B 2.0：異質行為資料感知的社交智能基礎模型

社交智能 AI 面臨行為資料異質性帶來的學習不平衡。研究者以 Heterogeneity-Aware Relative Policy Optimization 重新調整樣本貢獻，實現幾何中心化與慣性平滑的優勢調節。Omnisapiens-7B 2.0 在十項任務與五組保留基準上皆創下最佳表現，提升最高達十二點零二百分比，顯示其在真實社會行為應用上的可靠性。