clinical-trial-prediction 去汙染與季度動態基準:CT Open 評估大型語言模型與機器學習於臨床試驗預測的表現 本研究探討AI能否在臨床試驗結果公佈前做出可靠預測。核心做法為CT Open平台:季度舉辦公開挑戰,允許任意方法提交,並以自動化LLM驅動的網路搜尋實現去汙染,確保評估僅基於未公開結果。該平台釋出時間戳測試集並促進模型持續驗證與比較。有助於評估真實世界預測能力。