深度分析 以平均激活差驗證隱性規劃:在大型語言模型上用激活操控改變押韻與問答 研究探討大型語言模型是否在生成文本時進行隱性規劃。研究用平均激活差向量介入中間激活,改變押韻與問答的最終詞生成;實驗以押韻詩與問答為例。結果指出自1B參數模型起顯著可觀察到規劃跡象,且可透過激活操控改變生成傾向,對模型控制與安全具指標性意義。
深度分析 大型語言模型規模與隱性規劃能力的正相關研究 大型語言模型在未明示規劃下仍能完成多步任務。本研究以 Qwen‑3 系列測試隱性規劃,發現規模越大內部規劃表徵越明顯,能提前影響詞彙選擇。結果顯示模型規模與規劃能力呈正相關,為未來多步推理提供方向。