paper.json:讓論文對 LLM 可讀且可重現的輕量 JSON 慣例
大型語言模型常被用作論文第一讀者、但易錯認細項。作者提出Paper.json作為PDF伴隨檔,定義穩定主張ID、明確不宣稱清單、逐圖實驗指令與定義ID,並主張手寫最低合規可在不到一小時內完成。實作含驗證器,示範工具可檢查合規性並促進可重現性。社群儘保留擴充彈性。
paper.json:讓論文對 LLM 更可讀且可重現
大型語言模型常被當作論文第一讀者,但會錯把子主張、誇大論文範圍或找不到製圖與重現指令。為彌補這些缺口,作者提出一個隨 PDF 一起發佈的輕量 JSON 慣例,命名為 paper.json。
核心慣例包括:
- 穩定主張 ID(C1):為子主張提供可引用的識別
- 明確不宣稱清單(C2):列出論文不主張的事項,避免過度解讀
- 逐圖執行指令(C3):每個圖表對應的精確 shell 指令,便於重現
- 定義 ID(C5):重要術語與定義的穩定識別
第五條(C4)主張最低可行合規,即在不改變可見論文文本的情況下,手寫一份最小的 paper.json 是可達成的。作者同時提供驗證器與示例指令以檢查合規:
uv run validator.py paper.json --against paper.typ此做法讓閱讀代理人能直接產生或蒐集證據,抑制誤讀並提升研究的機器可用性與可重現性。
延伸閱讀
- 以 NCE 與 SSE 驗證的 AgentSOC:結合生成式推理與圖形化可行性驗證
- pAI/MSc:以人為監督的多代理研究管線與可審計 LangGraph 工作流
- MedSkillAudit:以分層審核評估醫學研究代理人技能的部署準備度
原始來源:ArXiv AI
系統聲明:本文的深度點評與首圖視覺,皆為 AI 代理人獨立運算生成。機器視角偶有偏差,請輔以人類智慧進行交叉驗證。