论文
每日更新的前沿 AI 研究论文,助您把握人工智能最新动向

UserBench:面向以用户为中心的Agent的交互式Gym环境
Cheng Qian, Zuxin Liu, Akshara Prabhakar, et al.
14 天前

UI-AGILE:通过有效的强化学习和精确的推理期对齐推进GUI代理
Shuquan Lian, Yuhang Wu, Jia Ma, et al.
1 个月前

ChemDFM-R:一种融合原子化化学知识的化学推理LLM
Zihan Zhao, Bo Chen, Ziping Wan, et al.
1 个月前

DualSG:一种双流显式语义引导的多变量时间序列预测框架
Kuiye Ding, Fanda Fan, Yao Wang, et al.
1 个月前

HunyuanWorld 1.0:从文本或像素生成沉浸式、可探索且可交互的3D世界
HunyuanWorld Team, Zhenwei Wang, Yuhao Liu, et al.
1 个月前

BANG:通过生成式爆炸动力学划分3D资产
Longwen Zhang, Qixuan Zhang, Haoran Jiang, et al.
1 个月前

Rep-MTL:释放表示层任务显著性在多任务学习中的潜力
Zedong Wang, Siyuan Li, Dan Xu
1 个月前

重建4D空间智能:一项综述
Yukang Cao, Jiahao Lu, Zhisheng Huang, et al.
1 个月前

SmallThinker:一个为本地部署原生训练的高效大型语言模型家族
Yixin Song, Zhenliang Xue, Dongliang Wei, et al.
1 个月前

基于弱监督的无人机影像未见域车辆检测器自适应方法
Xiao Fang, Minhyek Jeon, Zheyang Qin, et al.
1 个月前

ARC-Hunyuan-Video-7B:现实世界短视频的结构化视频理解
Yuying Ge, Yixiao Ge, Chen Li, et al.
1 个月前

SciToolAgent:一个基于知识图谱的科学Agent,用于多工具集成
Keyan Ding, Jing Yu, Junjie Huang, et al.
1 个月前

MIRepNet:一种基于EEG的运动想象分类的流水线与基础模型
Dingkun Liu, Zhu Chen, Jingwei Luo, et al.
1 个月前

当 Tokens 讲得太多:跨图像、视频和音频的多模态长上下文 Tokens 压缩综述
Kele Shao, Keda Tao, Kejia Zhang, et al.
1 个月前

Agent 强化策略优化
Guanting Dong, Hangyu Mao, Kai Ma, et al.
1 个月前

MMBench-GUI:面向GUI代理的分层多平台评估框架
Xuehui Wang, Zhenyu Wu, JingJing Xie, et al.
1 个月前

GS-Occ3D:基于高斯点阵的纯视觉占据重建扩展
Baijun Ye, Minghui Qin, Saining Zhang, et al.
22 天前

OS-MAP: 计算机使用代理在广度和深度上能走多远?
Xuetian Chen, Yinghao Chen, Xinfeng Yuan, et al.
1 个月前

MedIQA:一种可扩展的基于提示的医学图像质量评估基础模型
Siyi Xun, Yue Sun, Jingkun Chen, et al.
1 个月前

规范自校正:通过测试时优化缓解上下文奖励黑客行为
V\u00edctor Gallego
1 个月前

《电影导演:面向短片生成》
Junfei Xiao, Ceyuan Yang, Lvmin Zhang, et al.
1 个月前

SafeWork-R1: 在AI-45法则下的安全与智能协同进化
Yicheng Bao, Guanxu Chen, Mingkang Chen, et al.
1 个月前

LLM量化几何:GPTQ作为Babai的最近平面算法
Jiale Chen, Torsten Hoefler, Dan Alistarh
1 个月前

解耦大语言模型中的知识与推理:基于认知双系统理论的探索
Mutian Yang, Jiandong Gao, Ji Wu
1 个月前

组序列策略优化
Chujie Zheng, Shixuan Liu, Mingze Li, et al.
1 个月前

Yume:一个交互式世界生成模型
Xiaofeng Mao, Shaoheng Lin, Zhen Li, et al.
1 个月前

PRIX:从原始图像中学习规划用于端到端自动驾驶
Maciej K. Wozniak, Lianhang Liu, Yixi Cai, et al.
1 个月前

构建用于定位诊断协作的眼科多模态LLM通过临床认知链推理
Xinyao Liu, Diping Song
1 个月前

“一个领域能否帮助其他领域?”基于数据的多领域强化学习推理研究
Yu Li, Zhuoshi Pan, Honglin Lin, et al.
1 个月前

DesignLab:通过迭代检测与修正设计幻灯片
Jooyeol Yun, Heng Wang, Yotaro Shimose, et al.
1 个月前