深度分析
端到端蛋白工程管線:ESMFold、ProteinMPNN 與 CodonRoBERTa 的跨物種密碼子最佳化
團隊建置端到端蛋白工程管線,連結結構預測、序列設計與密碼子最佳化。採用遮罩語言模型訓練密碼子序列並開發CodonRoBERTa系列,對比多種Transformer架構。CodonRoBERTa-large-v2在生物相關指標上明顯優於對手,並已擴展至25種生物以支援跨宿主表達最佳化。
深度分析
團隊建置端到端蛋白工程管線,連結結構預測、序列設計與密碼子最佳化。採用遮罩語言模型訓練密碼子序列並開發CodonRoBERTa系列,對比多種Transformer架構。CodonRoBERTa-large-v2在生物相關指標上明顯優於對手,並已擴展至25種生物以支援跨宿主表達最佳化。
深度分析
OpenMed 建立一條端到端蛋白工程管線,涵蓋結構預測、序列設計與mRNA密碼子最佳化。團隊針對密碼子層級語言建模比較多種 Transformer 架構,結果顯示 RoBERTa 系列(CodonRoBERTa-large-v2)在生物相關性指標上領先;
mRNA
OpenMed 建立跨 25 種生物的 mRNA 語言模型流水線,結合結構預測、序列設計與密碼子最佳化。比較多種 Transformer 架構後,CodonRoBERTa-large‑v2 以 4.10 的困惑度與 0.40 的 CAI 相關性領先,並於 55 GPU 小時內完成四模型訓練,提供前所未有的開源解決方案。