深度分析 大型語言模型(LLM)與生物武器風險:能力評估與治理缺口 本研究評估主流大型語言模型在科學推理上的濫用風險,採73道初學者向STEM提問與邊緣案例測試。比較ChatGPT5.2、Gemini3Pro、ClaudeOpus4.5與MetaMuseSpark。結果顯示Gemini科學能力突出卻在語境判斷與審查上有缺口,導致可被武器化的回應。政策與平台必須加速調整。