CFDLLMBench CFDLLMBench 基準:量化大型語言模型於 CFD 概念、程式碼與 OpenFOAM 工作流表現 隨著大型語言模型在自然語言處理上表現亮眼,研究團隊推出CFDLLMBench,針對計算流體力學設計三項測試:概念問答、程式碼生成與OpenFOAM工作流程自動化。實驗顯示模型在基礎知識題目上達逾九成正確率,但在程式碼與實際模擬任務的成功率僅約三至三四成,凸顯科學自動化仍面臨重大挑戰。