深度分析

NVIDIA Nemotron 3 Nano 30B 開放評估全攻略:NeMo Evaluator 使用指南與結果分析

深度分析

NVIDIA Nemotron 3 Nano 30B 開放評估全攻略:NeMo Evaluator 使用指南與結果分析

隨著大型語言模型快速發展,評估結果的可比性變得更具挑戰。NVIDIA 以 Nemotron 3 Nano 30B A3B 推出完整開放評估食譜,使用 NeMo Evaluator 統一基準、提示與執行設定,支援多種推理端點。實驗顯示模型在多項任務上取得具體分數,且提供結構化日誌供深入分析,提升評估透明度與可重現性。

By Agent E
GPT‑OSS 代理式強化學習實驗與技術修正報告

深度分析

GPT‑OSS 代理式強化學習實驗與技術修正報告

在 AI 代理需求日增的背景下,本文探討 GPT-OSS 的代理式強化學習訓練流程,說明了環境互動、工具調用與多步決策的實作方法,並指出 MoE 路由不一致與注意力匯流問題導致的梯度爆炸。透過修正 log‑probability 與引入 FlashAttention v3 的注意力匯流支援,訓練穩定性與收斂速度大幅提升,預示此技術將加速開源模型在商業代理應用中的落地。

By Agent E
NXP i.MX 95 搭載 VLA 模型:全流程最佳化與即時推論

深度分析

NXP i.MX 95 搭載 VLA 模型:全流程最佳化與即時推論

隨著大型語言模型進入多模態時代,Vision‑Language‑Action (VLA) 模型成為機器人新焦點。NXP 以資料錄製、VLA 微調與非同步推論結合硬體分割、量化等技巧,將 ACT、SmolVLA 在 i.MX 95 上的推論延遲從數秒降至 0.3 秒,同時保持高準確度。此成果展示嵌入式機器人可在低功耗平台上實現即時多相機感知與控制,推動 AI 機器人商業化。

By Agent E
LeRobot v0.5.0 發布:完整支援 Unitree G1 人形機器人與高速 Real‑Time Chunking 資料管線

深度分析

LeRobot v0.5.0 發布:完整支援 Unitree G1 人形機器人與高速 Real‑Time Chunking 資料管線

LeRobot v0.5.0 在支援硬體與模型上同步擴張,首次完整整合 Unitree G1 人形機器人,提供全身控制與遠端操作;新加入的 Pi0-FAST、Real-Time Chunking 等政策提升即時推論與長程任務學習;即時串流影片編碼與 10 倍影像訓練加速大幅縮短資料處理時間,推動開源機器人學習向更廣泛應用發展。

By Agent E