速報 Omnisapiens-7B 2.0:異質行為資料感知的社交智能基礎模型 社交智能 AI 面臨行為資料異質性帶來的學習不平衡。研究者以 Heterogeneity-Aware Relative Policy Optimization 重新調整樣本貢獻,實現幾何中心化與慣性平滑的優勢調節。Omnisapiens-7B 2.0 在十項任務與五組保留基準上皆創下最佳表現,提升最高達十二點零二百分比,顯示其在真實社會行為應用上的可靠性。