深度分析 單一噪聲向量提升生成式機器人策略:黃金票證技術解析 研究指出,固定特定初始噪聲向量(黃金票證)可提升預訓練生成式機器人策略的任務表現。作者透過蒙特卡洛政策評估搜尋最佳噪聲,無需重新訓練模型,並在多項基準測試中顯著提升成功率,最高達 58%。此方法亦在多任務設定中形成自然的帕累托前緣,兼顧速度與成功率等目標。