论文
每日更新的前沿 AI 研究论文,助您把握人工智能最新动向

Seed Diffusion:一种具备高速推理能力的大规模扩散语言模型
\Yuxuan Song\, \ Zheng Zhang\, \ Cheng Luo\, et al.
20 天前

超越权衡:用于推理模型指令遵循的自监督强化学习
Qingyu Ren, Qianyu He, Bowei Zhang, et al.
21 天前

CRINN:用于近似最近邻搜索的对比强化学习
Xiaoya Li, Xiaofei Sun, Albert Wang, et al.
20 天前

Marco-Voice 技术报告
Fengping Tian, Chenyang Lyu, Xuanfan Ni, et al.
14 天前

SitEmb-v1.5:面向语义关联与长故事理解的改进型上下文感知密集检索
Junjie Wu, Jiangnan Li, Yuqing Li, et al.
21 天前

LLM 的思维链推理是一场幻觉吗?基于数据分布的视角
Chengshuai Zhao, Zhen Tan, Pingchuan Ma, et al.
19 天前

Llama-3.1-基础AI安全LLM-8B-指令 技术报告
Sajana Weerawardhena, Paul Kassianik, Blaine Nelson, et al.
21 天前

超越固定长度:用于扩散大语言模型的可变长度去噪
Jinsong Li, Xiaoyi Dong, Yuhang Zang, et al.
22 天前

认知内核-Pro:面向深度研究Agent与Agent基础模型训练的框架
Tianqing Fang, Zhisong Zhang, Xiaoyang Wang, et al.
23 天前

表示偏移:统一令牌压缩与FlashAttention
Joonmyung Choi, Sanghyeok Lee, Byungoh Ko, et al.
20 天前

多模态指代分割:一项综述
Henghui Ding, Song Tang, Shuting He, et al.
22 天前

RL-PLUS:基于混合策略优化的LLM强化学习能力边界坍塌对抗方法
Yihong Dong, Xue Jiang, Yongding Tao, et al.
22 天前

协同生成人工智能:迈向增强型、参与式的生命周期
Rashid Mushkani, Hugo Berard, Toumadher Ammar, et al.
23 天前

Phi-Ground 技术报告:推进GUI接地中的感知能力
Miaosen Zhang, Ziqiang Xu, Jialiang Zhu, et al.
23 天前

思维链自指导:为推理与非推理任务构建高质量的合成提示
Ping Yu, Jack Lanchantin, Tianlu Wang, et al.
1 个月前

Seed-Prover:自动化定理证明中的深度与广度推理
Luoxin Chen, Jinming Gu, Liankai Huang, et al.
23 天前

villa-X:提升视觉-语言-动作模型中的潜在动作建模
Xiaoyu Chen, Hangxing Wei, Pushi Zhang, et al.
23 天前

3D-R1:提升3D VLMs中的推理能力以实现统一场景理解
Ting Huang, Zeyu Zhang, Hao Tang
22 天前

SWE-Exp:基于经验的软件问题解决
Silin Chen, Shaoxin Lin, Xiaodong Gu, et al.
22 天前

SWE-Debate:用于软件问题解决的竞争性多Agent辩论
Han Li, Yuling Shi, Shaoxin Lin, et al.
22 天前

iLRM:一种迭代式大规模3D重建模型
Gyeongjin Kang, Seungtae Nam, Xiangyu Sun, et al.
23 天前

PixNerd:像素神经场扩散
Shuai Wang, Ziteng Gao, Chenhui Zhu, et al.
22 天前

基于方案感知与全局的ReLU选择:部分MILP在DNN验证中强势回归
Yuke Liao, Blaise Genest, Kuldeep Meel, et al.
1 个月前

C3:一个用于探索复杂对话中挑战的双语口语对话模型基准
Chengqian Ma, Wei Tao, Yiwen Guo
23 天前

指向性音视频分割中的全模态表达与推理
Kaining Ying, Henghui Ding, Guanquan Jie, et al.
1 个月前

RecGPT 技术报告
Chao Yi, Dian Chen, Gaoyang Guo, et al.
23 天前

ScreenCoder:通过模块化多模态Agent推进前端自动化中的视觉到代码生成
Yilei Jiang, Yaozhi Zheng, Yuxuan Wan, et al.
1 个月前

VL-Cogito:面向高级多模态推理的渐进式课程强化学习
Ruifeng Yuan, Chenghao Xiao, Sicong Leng, et al.
1 个月前

Falcon-H1:一类混合头语言模型,重新定义效率与性能
Jingwei Zuo, Maksim Velikanov, Ilyas Chahed, et al.
1 个月前

X-Omni:强化学习让离散自回归图像生成模型重放光彩
Zigang Geng, Yibing Wang, Yeyao Ma, et al.
1 个月前