reinforcement-learning 實作導向強化學習課程:LLM 對齊、RLVR 與多模態 Agent 工程實務 GitHub 開源專案「hands-on-modern-rl」提供一套面向實作的強化學習教材,從經典控制入門,延伸到大型語言模型(LLM)後訓練的對齊技術、RLVR 與多模態 agentic 系統。專案以 Python 為主體,附有教學筆記、實驗程式碼與線上課程頁面,並採用共享授權。