深度分析 平滑切比雪夫標量化驅動的 STOMP 演算法:離線多目標強化學習在蛋白質優化的突破 研究聚焦於離線強化學習在多目標對齊的挑戰,提出平滑切比雪夫標量化方法,開發STOMP演算法,於蛋白質設計任務中超越基線,提升超體積指標。