[LG]《The Denario project: Deep knowledge AI agents for scientific discovery》F Villaescusa-Navarro, B Bolliet, P Villanueva-Domingo, A E. Bayer... [Flatiron Institute & University of Cambridge & Universitat Autonoma de Barcelona] (2025)
Denario是一个基于多智能体的大型语言模型(LLM)科学研究助手,旨在加速科学发现。它具备从生成研究想法、查阅文献、制定研究计划,到编写与执行代码、绘制图表、撰写并审阅科学论文的多项功能。Denario采用模块化架构,可单独执行各任务或端到端完成科研流程。
【核心架构与技术】
- 采用多种LLM(如OpenAI的gpt系列、Google的Gemini、Anthropic的Claude)驱动不同智能体执行特定任务。
- 智能体通过AG2和LangGraph两个框架实现精细的任务分解与协作,支持规划与控制策略(Planning & Control),以保证复杂科研任务的系统化执行。
- 各模块包括:Idea(想法生成)、Literature(文献检索)、Methods(方法设计)、Analysis(数据分析)、Paper(论文写作)、Review(同行评审)。
【应用示例】
Denario已成功在多学科领域生成高质量科研论文草稿,涵盖数学物理、行星科学、医学、化学、天体物理、生物学、数字健康、生物物理、神经科学、材料科学、量子物理与宇宙学等。部分案例:
- 利用物理信息神经网络(PINNs)深度分析非线性偏微分方程的解空间结构。
- 行星科学中系统地绘制小行星带的尺寸及成分梯度。
- 医学领域评估美国辅助生殖技术诊所的成功率和波动。
- 通过分子动力学模拟揭示自组装肽的多尺度结构和聚集稳定性。
- 天体物理中分析多模型预测的高质量双黑洞合并事件。
- 生物学领域对疟疾单细胞RNA测序数据的深入解析。
【优势与局限】
优势:
- 快速生成多样化科研方案,助力探索广泛思路。
- 输出内容包括代码、数据和论文草稿,增强科研透明度和可复现性。
- 可跨学科融合方法,拓展创新边界。
局限:
- 论文深度及创新性相当于优秀本科或早期研究生水平。
- 存在代码执行失败、文献引用不精准、LaTeX格式错误等问题。
- 在纯数学等领域难以生成严谨逻辑和有效证明。
- 需要用户投入引导与校验,避免错误传播。
【伦理与科学哲学思考】
- Denario引发对科研质量、学术训练、作者身份与责任的伦理讨论。
- AI生成科研成果可能导致同质化,抑制范式转变与创新。
- AI作为新型“研究程序”的介入,挑战传统科学知识的定义与价值观。
- 需要平衡AI辅助与人类专家判断,确保科学研究的真实性和多样性。
【未来展望】
- 增强系统稳定性与多任务并行能力。
- 加强论文写作模块与文献检索的深度整合。
- 支持本地开源模型,降低使用门槛。
- 开发更完善的评估体系,推动科研助手质量提升。
- 探索AI与人类协同创新的新范式。
【使用方式】
- 提供Python API和图形化界面(本地及云端),用户通过输入数据描述文本即可调用。
- 支持从想法生成、文献检索,到分析执行、论文撰写、同行评审的全流程自动化操作。
Denario代表了深度学习与多智能体技术在科学研究领域的最新尝试,作为辅助工具,它可以极大提升科研效率,助力科学家聚焦更具创新性的深层次问题。完整文档、示例论文及代码均已开源,期待科研社区共同推动其发展。
详见论文:





