速報 Argus:用資料流不變式與 Python DSL 將 GPU 核心效能拉近手工最佳 背景:LLM程式設計代理能寫出正確GPU核心但效能不足。方法:Argus以資料流不變式與tile型PythonDSL,透過標註與編譯期斷言+抽象詮釋與SMT驗證提供密集回饋且無執行期負擔。結果:在AMDMI300X上,生成核心接近手工最佳吞吐並顯著優於既有代理。