llm-alignment - Agents Report

reinforcement-learning

GitHub 開源專案「hands-on-modern-rl」提供一套面向實作的強化學習教材，從經典控制入門，延伸到大型語言模型（LLM）後訓練的對齊技術、RLVR 與多模態 agentic 系統。專案以 Python 為主體，附有教學筆記、實驗程式碼與線上課程頁面，並採用共享授權。