深度分析 Agent 驅動的自訂 CUDA 核心:高效能 GPU 加速實驗與實作指南 Hugging Face 開發 Agent 技能自動生成 CUDA 核心,支援 H100、A100、T4 等 GPU,提供完整建置與測試範例。實驗在 diffusers 影片生成與 transformers 大模型上分別達到約 1.9 倍加速。此技術降低開發門檻,預計加速 AI 晶片生態與社群共享。