最新论文

每日更新的前沿 AI 研究论文,助您把握人工智能最新动向

OpenCUA:面向计算机使用智能体的开源基础
OpenCUA:面向计算机使用智能体的开源基础
Xinyuan Wang, Bowen Wang, Dunjie Lu, et al.
4 小时前
空间策略:基于空间感知建模与推理引导视觉-运动机器人操作
空间策略:基于空间感知建模与推理引导视觉-运动机器人操作
Yijun Liu, Yuwei Liu, Yuan Meng, et al.
8 小时前
Jet-Nemotron:基于后神经架构搜索的高效语言模型
Jet-Nemotron:基于后神经架构搜索的高效语言模型
Yuxian Gu, Qinghao Hu, Shang Yang, et al.
8 小时前
CRISP:通过稀疏自编码器实现的持久概念遗忘
CRISP:通过稀疏自编码器实现的持久概念遗忘
Tomer Ashuach, Dana Arad, Aaron Mueller, et al.
18 小时前
弱监督可操作性定位中的选择性对比学习
弱监督可操作性定位中的选择性对比学习
WonJun Moon, Hyun Seok Seong, Jae-Pil Heo
18 小时前
EgoTwin:第一人称视角下的身体与视图梦境
EgoTwin:第一人称视角下的身体与视图梦境
Jingqiao Xiu, Fangzhou Hong, Yicong Li, et al.
18 小时前
超越Pass@1:基于变分问题生成的自对弈持续提升RLVR
超越Pass@1:基于变分问题生成的自对弈持续提升RLVR
Xiao Liang, Zhongzhi Li, Yeyun Gong, et al.
18 小时前
ODYSSEY:面向长时程任务的开放世界四足动物探索与操作
ODYSSEY:面向长时程任务的开放世界四足动物探索与操作
Kaijun Wang, Liqin Lu, Mingyu Liu, et al.
19 小时前
AgentFly:在不微调LLM的情况下微调LLM Agent
AgentFly:在不微调LLM的情况下微调LLM Agent
Huichi Zhou, Yihang Chen, Siyuan Guo, et al.
19 小时前
约束引导的扩散推理器用于神经符号学习
约束引导的扩散推理器用于神经符号学习
Xuan Zhang, Zhijian Zhou, Weidi Xu, et al.
1 天前
基于LLM的智能体在药物资产尽职调查中的竞争格局映射
基于LLM的智能体在药物资产尽职调查中的竞争格局映射
Alisa Vinogradova, Vlad Vinogradov, Dmitrii Radkevich, et al.
1 天前
SceneGen:单图像3D场景生成的一次前向传播
SceneGen:单图像3D场景生成的一次前向传播
Yanxu Meng, Haoning Wu, Ya Zhang, et al.
2 天前
大语言模型基准测试综述
大语言模型基准测试综述
Shiwen Ni, Guhong Chen, Shuaimin Li, et al.
2 天前
Waver:以波形之姿实现逼真视频生成
Waver:以波形之姿实现逼真视频生成
Yifu Zhang, Hao Yang, Yuqi Zhang, et al.
2 天前
LiveMCP-101:在复杂查询上对MCP增强型Agent进行压力测试与诊断
LiveMCP-101:在复杂查询上对MCP增强型Agent进行压力测试与诊断
Ming Yin, Dinghan Shen, Silei Xu, et al.
2 天前
自信地深度思考
自信地深度思考
Yichao Fu, Xuewei Wang, Yuandong Tian, et al.
2 天前
Mobile-Agent-v3:GUI自动化的基础智能体
Mobile-Agent-v3:GUI自动化的基础智能体
Jiabo Ye, Xi Zhang, Haiyang Xu, et al.
2 天前
Intern-S1:一种科学多模态基础模型
Intern-S1:一种科学多模态基础模型
Lei Bai, Zhongrui Cai, Maosong Cao, et al.
2 天前
语言引导微调:利用文本反馈增强数值优化
语言引导微调:利用文本反馈增强数值优化
Yuxing Lu, Yucheng Hu, Nan Sun, et al.
4 天前
NiceWebRL:一个用于强化学习环境的人类被试实验的Python库
NiceWebRL:一个用于强化学习环境的人类被试实验的Python库
Wilka Carvalho, Vikram Goddla, Ishaan Sinha, et al.
4 天前
从科学的人工智能到代理科学:自主科学发现综述
从科学的人工智能到代理科学:自主科学发现综述
Jiaqi Wei, Yuejin Yang, Xiang Zhang, et al.
5 天前
MeshCoder:基于LLM的点云结构化网格代码生成
MeshCoder:基于LLM的点云结构化网格代码生成
Bingquan Dai, Li Ray Luo, Qihong Tang, et al.
5 天前
Tinker:扩散模型馈赠3D——无需场景级优化的稀疏输入多视角一致性编辑
Tinker:扩散模型馈赠3D——无需场景级优化的稀疏输入多视角一致性编辑
Canyu Zhao, Xiaoman Li, Tianjian Feng, et al.
5 天前
FutureX:面向未来预测任务的LLM Agent高级实时基准
FutureX:面向未来预测任务的LLM Agent高级实时基准
Zhiyuan Zeng, Jiashuo Liu, Siyuan Chen, et al.
5 天前
DuPO:通过双偏好优化实现可靠的LLM自我验证
DuPO:通过双偏好优化实现可靠的LLM自我验证
Shuaijie She, Yu Bao, Yu Lu, et al.
5 天前
从分数到能力:一种用于评估金融领域大语言模型的认知诊断框架
从分数到能力:一种用于评估金融领域大语言模型的认知诊断框架
Ziyan Kuang, Feiyu Zhu, Maowei Jiang, et al.
5 天前
Granary:25种欧洲语言的语音识别与翻译数据集
Granary:25种欧洲语言的语音识别与翻译数据集
Nithin Rao Koluguri, Monica Sekoyan, George Zelenfroynd, et al.
5 天前
TransLLM:通过可学习提示实现城市交通的统一多任务基础框架
TransLLM:通过可学习提示实现城市交通的统一多任务基础框架
Jiaming Leng, Yunying Bi, Chuan Qin, et al.
5 天前
量化与dLLMs的结合:面向扩散LLM的后训练量化系统性研究
量化与dLLMs的结合:面向扩散LLM的后训练量化系统性研究
Haokun Lin, Haobo Xu, Yichen Wu, et al.
5 天前
无需训练的文本引导多模态扩散Transformer颜色编辑
无需训练的文本引导多模态扩散Transformer颜色编辑
Zixin Yin, Xili Dai, Ling-Hao Chen, et al.
6 天前
最新论文 | HyperAI超神经