深度分析 邊界失效與大型語言模型(LLM)對齊:以三條件框架界定討好行為 這篇立場論文指出,大型語言模型(LLM)中的「奉承/討好行為」(sycophancy)並非單純的同意,而是社會對齊與認知誠信之間的邊界失效。作者提出一套三條件判準:使用者提示(belief/preference/self-concept)、模型的對齊位移,以及這種位移對獨立判斷或事實修正的侵蝕。