论文
每日更新的前沿 AI 研究论文,助您把握人工智能最新动向

HySafe-AI:AI系统混合安全架构分析框架:案例研究
Mandar Pitale, Jelena Frtunikj, Abhinaw Priyadershi, et al.
1 个月前

像素、模式,但无诗意:像人类一样看世界
Hongcheng Gao, Zihao Huang, Lin Xu, et al.
1 个月前

基于视觉-语言慢思考的半离策略强化学习
Junhao Shen, Haiteng Zhao, Yuzhe Gu, et al.
1 个月前

《MegaScience:推动科学推理的训练后数据集前沿》
Run-Ze Fan, Zengzhi Wang, Pengfei Liu
1 个月前

具有不确定性感知的知识转换器在多智能体强化学习中的对等能源交易研究
Mian Ibad Ali Shah, Enda Barrett, Karl Mason
1 个月前

超越上下文限制:用于长时程推理的潜意识线索
Hongyin Luo, Nathaniel Morgan, Tina Li, et al.
1 个月前

斑马-CoT:一种交叉视觉语言推理数据集
Ang Li, Charles Wang, Kaiyu Yue, et al.
1 个月前

RAVine:现实对齐的代理搜索评估
Yilong Xu, Xiang Long, Zhi Zheng, et al.
1 个月前

Step-Audio 2 技术报告
Boyong Wu, Chao Yan, Chen Hu, et al.
1 个月前

前沿人工智能风险管理框架实践:风险分析技术报告
Xiaoyang Chen, Yunhao Chen, Zeren Chen, et al.
1 个月前

Re:Form -- 在LLMs中使用强化学习减少人类先验知识的可扩展形式化软件验证:关于Dafny的初步研究
Chuanhao Yan, Fengdi Che, Xuhan Huang, et al.
1 个月前

深度研究者与测试时扩散
Rujun Han, Yanfei Chen, Zoey CuiZhu, et al.
1 个月前

Document Haystack:一个长上下文多模态图像/文档理解视觉LLM基准
Goeric Huybrechts, Srikanth Ronanki, Sai Muralidhar Jayanthi, et al.
13 天前

GUI-G^2:用于 GUI 定位的高斯奖励建模
Fei Tang, Zhangxuan Gu, Zhengxi Lu, et al.
1 个月前

分层预算策略优化用于自适应推理
Shangke Lyu, Linjuan Wu, Yuchen Yan, et al.
1 个月前

LAPO:通过长度自适应策略优化内化推理效率
Xingyu Wu, Yuchen Yan, Shangke Lyu, et al.
1 个月前

WebShaper:通过信息寻求进行数据合成的Agent化形式化
Zhengwei Tao, Jialong Wu, Wenbiao Yin, et al.
1 个月前

MUR:基于动量不确定性的大语言模型推理
Hang Yan, Fangzhi Xu, Rongman Xu, et al.
1 个月前

无形的牵引:为何RLVR可能无法摆脱其起源
Fang Wu, Weihao Xuan, Ximing Lu, et al.
1 个月前

MiroMind-M1:通过上下文感知多阶段策略优化在数学推理领域的开源进展
Xingxuan Li, Yao Xiao, Dianwen Ng, et al.
1 个月前

弗兰卡:嵌套马特里欧什卡聚类用于可扩展的视觉表示学习
Shashanka Venkataramanan, Valentinos Pariza, Mohammadreza Salehi, et al.
1 个月前

无需人类参与:自主高质量图像编辑三元组挖掘
Maksim Kuprashevich, Grigorii Alekseenko, Irina Tolstykh, et al.
1 个月前

CUDA-L1:通过对比强化学习提升CUDA优化
Xiaoya Li, Xiaofei Sun, Albert Wang, et al.
1 个月前

CSD-VAR:视觉自回归模型中的内容-风格分解
Quang-Binh Nguyen, Minh Luu, Quang Nguyen, et al.
1 个月前

一种以数据为中心的框架,用于解决俄语语音生成模型中的音位和韵律挑战
Kirill Borodin, Nikita Vasiliev, Vasiliy Kudryavtsev, et al.
1 个月前

NABLA:邻域自适应块级注意力
Dmitrii Mikhailov, Aleksey Letunovskiy, Maria Kovaleva, et al.
1 个月前

PrefPalette:基于潜在属性的个性化偏好建模
Shuyue Stella Li, Melanie Sclar, Hunter Lang, et al.
1 个月前

COREVQA:一种众包观察与推理蕴含的视觉问答基准
Ishant Chintapatla, Kazuma Choji, Naaisha Agarwal, et al.
12 天前

VisionThink:通过强化学习实现智能高效的视觉语言模型
Senqiao Yang, Junyi Li, Xin Lai, et al.
1 个月前

π^3: 可扩展的置换等变视觉几何学习
Yifan Wang, Jianjun Zhou, Haoyi Zhu, et al.
1 个月前