深度分析 ThermoQA:以分層題庫評估大型語言模型在工程熱力學數值推理的表現 研究針對工程熱力學推出ThermoQA,293題分層測試。以CoolProp程式化計算真值,涵蓋水、R-134a與變比熱空氣,測試物性查表、元件級多步推理與完整循環分析。結果指出查表記憶不等於熱力學推理,超臨界與實流循環成最強鑑別項目。並建議採用工具化評估流程以分離物性檢索與推理。