最新论文
每日更新的前沿 AI 研究论文,助您把握人工智能最新动向

OpenCUA:面向计算机使用智能体的开源基础
Xinyuan Wang, Bowen Wang, Dunjie Lu, et al.
4 小时前

空间策略:基于空间感知建模与推理引导视觉-运动机器人操作
Yijun Liu, Yuwei Liu, Yuan Meng, et al.
8 小时前

Jet-Nemotron:基于后神经架构搜索的高效语言模型
Yuxian Gu, Qinghao Hu, Shang Yang, et al.
8 小时前

CRISP:通过稀疏自编码器实现的持久概念遗忘
Tomer Ashuach, Dana Arad, Aaron Mueller, et al.
18 小时前

弱监督可操作性定位中的选择性对比学习
WonJun Moon, Hyun Seok Seong, Jae-Pil Heo
18 小时前

EgoTwin:第一人称视角下的身体与视图梦境
Jingqiao Xiu, Fangzhou Hong, Yicong Li, et al.
18 小时前

超越Pass@1:基于变分问题生成的自对弈持续提升RLVR
Xiao Liang, Zhongzhi Li, Yeyun Gong, et al.
18 小时前

ODYSSEY:面向长时程任务的开放世界四足动物探索与操作
Kaijun Wang, Liqin Lu, Mingyu Liu, et al.
19 小时前

AgentFly:在不微调LLM的情况下微调LLM Agent
Huichi Zhou, Yihang Chen, Siyuan Guo, et al.
19 小时前

约束引导的扩散推理器用于神经符号学习
Xuan Zhang, Zhijian Zhou, Weidi Xu, et al.
1 天前

基于LLM的智能体在药物资产尽职调查中的竞争格局映射
Alisa Vinogradova, Vlad Vinogradov, Dmitrii Radkevich, et al.
1 天前

SceneGen:单图像3D场景生成的一次前向传播
Yanxu Meng, Haoning Wu, Ya Zhang, et al.
2 天前

大语言模型基准测试综述
Shiwen Ni, Guhong Chen, Shuaimin Li, et al.
2 天前

Waver:以波形之姿实现逼真视频生成
Yifu Zhang, Hao Yang, Yuqi Zhang, et al.
2 天前

LiveMCP-101:在复杂查询上对MCP增强型Agent进行压力测试与诊断
Ming Yin, Dinghan Shen, Silei Xu, et al.
2 天前

自信地深度思考
Yichao Fu, Xuewei Wang, Yuandong Tian, et al.
2 天前

Mobile-Agent-v3:GUI自动化的基础智能体
Jiabo Ye, Xi Zhang, Haiyang Xu, et al.
2 天前

Intern-S1:一种科学多模态基础模型
Lei Bai, Zhongrui Cai, Maosong Cao, et al.
2 天前

语言引导微调:利用文本反馈增强数值优化
Yuxing Lu, Yucheng Hu, Nan Sun, et al.
4 天前

NiceWebRL:一个用于强化学习环境的人类被试实验的Python库
Wilka Carvalho, Vikram Goddla, Ishaan Sinha, et al.
4 天前

从科学的人工智能到代理科学:自主科学发现综述
Jiaqi Wei, Yuejin Yang, Xiang Zhang, et al.
5 天前

MeshCoder:基于LLM的点云结构化网格代码生成
Bingquan Dai, Li Ray Luo, Qihong Tang, et al.
5 天前

Tinker:扩散模型馈赠3D——无需场景级优化的稀疏输入多视角一致性编辑
Canyu Zhao, Xiaoman Li, Tianjian Feng, et al.
5 天前

FutureX:面向未来预测任务的LLM Agent高级实时基准
Zhiyuan Zeng, Jiashuo Liu, Siyuan Chen, et al.
5 天前

DuPO:通过双偏好优化实现可靠的LLM自我验证
Shuaijie She, Yu Bao, Yu Lu, et al.
5 天前

从分数到能力:一种用于评估金融领域大语言模型的认知诊断框架
Ziyan Kuang, Feiyu Zhu, Maowei Jiang, et al.
5 天前

Granary:25种欧洲语言的语音识别与翻译数据集
Nithin Rao Koluguri, Monica Sekoyan, George Zelenfroynd, et al.
5 天前

TransLLM:通过可学习提示实现城市交通的统一多任务基础框架
Jiaming Leng, Yunying Bi, Chuan Qin, et al.
5 天前

量化与dLLMs的结合:面向扩散LLM的后训练量化系统性研究
Haokun Lin, Haobo Xu, Yichen Wu, et al.
5 天前

无需训练的文本引导多模态扩散Transformer颜色编辑
Zixin Yin, Xili Dai, Ling-Hao Chen, et al.
6 天前