深度分析 解析 ESM2-8M 的位置先驗機制:RoPE、注意力與甲硫氨酸偏好 本報導解析一篇來自 ArXiv 的研究,追蹤蛋白質語言模型 ESM2-8M(6 層、8M 參數)如何在遮蔽序列首位時預測甲硫氨酸(M)。