Back to Headlines

艾AI2发布Asta:重塑科学领域可信人工智能代理新标准

9 小时前

人工智能研究机构Ai2(艾伦人工智能研究所)近日正式推出Asta——一个全新的开放生态系统,旨在为科学领域的AI代理(AI agents)建立可信、透明和可复现的标准。该系统集成了AI研究助手、基准测试套件和开发者工具,致力于解决当前科学AI领域普遍存在的黑箱化、未经验证和缺乏可比性的问题。 Asta的核心是一款专为科学家设计的开源AI研究助手,能理解科研工作流,不仅检索信息,还能综述文献、分析数据并提供引用来源。目前已有194家机构如芝加哥大学、华盛顿大学的研究人员在使用。其目标是帮助科研人员从“灵光一现”快速推进到“科学洞察”,显著提升研究效率。 Asta生态系统包含三大支柱:Asta(AI研究助手)、AstaBench(科学AI代理基准测试套件)和Asta Resources(开发者工具包)。AstaBench是首个针对复杂多步骤科研任务的严格评估体系,涵盖2400多个问题,覆盖11个基准领域,包含16个排行榜,评估维度包括性能与成本效率。在初始测试中,Asta v0版本以52.5%的得分领先,远超其他系统。 Asta Resources则为开发者提供开源模型、API、科学语料库工具(基于2亿篇论文的Semantic Scholar扩展)等资源,支持构建和评估可信的科学AI工具。这种“构建-评估”闭环,推动整个生态持续进步。 Ai2首席科学家Dan Weld表示,Asta的诞生源于研究人员的真实痛点——需要能执行复杂任务、解释推理过程并基于证据工作的AI伙伴。Asta不是普通助手,而是一个真正“像科学家一样思考”的合作者。 与许多封闭、商业化AI系统不同,Asta坚持完全开源、开放获取,以科学价值观为基石。未来,Asta将拓展数据解析、实验复现、科学编程和长期研究规划等功能,逐步实现端到端科研支持。 Ai2强调,Asta是科学AI迈向可信化、系统化的重要一步。通过开放协作,推动AI真正成为科学进步的加速器。更多信息可访问allenai.org/asta。

Related Links