最新论文

每日更新的前沿 AI 研究论文,助您把握人工智能最新动向

基于用户画像感知的LLM-as-a-Judge的播客推荐评估
基于用户画像感知的LLM-as-a-Judge的播客推荐评估
Francesco Fabbri, Gustavo Penha, Edoardo D&#39, et al.
6 天前
MultiRef:基于多个视觉参考的可控图像生成
MultiRef:基于多个视觉参考的可控图像生成
Ruoxi Chen, Dongping Chen, Siyuan Wu, et al.
6 天前
提示编排标记语言
提示编排标记语言
Yuge Zhang, Nan Chen, Jiahang Xu, et al.
6 天前
LongSplat:适用于随意长视频的鲁棒非对齐3D高斯点阵
LongSplat:适用于随意长视频的鲁棒非对齐3D高斯点阵
Chin-Yang Lin, Cheng Sun, Fu-En Yang, et al.
6 天前
多智能体链:通过多智能体蒸馏与智能体强化学习构建端到端智能体基础模型
多智能体链:通过多智能体蒸馏与智能体强化学习构建端到端智能体基础模型
Weizhen Li, Jianbo Lin, Zhuosong Jiang, et al.
6 天前
HPSv3:面向全谱人类偏好评分
HPSv3:面向全谱人类偏好评分
Yuhang Ma, Xiaoshi Wu, Keqiang Sun, et al.
6 天前
ComputerRL:面向计算机使用Agent的端到端在线强化学习扩展
ComputerRL:面向计算机使用Agent的端到端在线强化学习扩展
Hanyu Lai, Xiao Liu, Yanxiao Zhao, et al.
6 天前
说话人去标识系统中的身份泄露评估
说话人去标识系统中的身份泄露评估
Seungmin Seo, Oleg Aulov, Afzal Godil, et al.
6 天前
下一视觉粒度生成
下一视觉粒度生成
Yikai Wang, Zhouxia Wang, Zhonghua Wu, et al.
7 天前
4DNeX:轻松实现前馈式4D生成建模
4DNeX:轻松实现前馈式4D生成建模
Zhaoxi Chen, Tianqi Liu, Long Zhuo, et al.
7 天前
ComoRAG:一种面向有状态长篇叙述推理的认知启发式记忆组织RAG
ComoRAG:一种面向有状态长篇叙述推理的认知启发式记忆组织RAG
Juyuan Wang, Rongchen Zhao, Wei Wei, et al.
7 天前
Ovis2.5 技术报告
Ovis2.5 技术报告
Shiyin Lu, Yang Li, Yu Xia, et al.
7 天前
用于宽带计算与通信的集成微波神经网络
用于宽带计算与通信的集成微波神经网络
Bala Govind, Maxwell G. Anderson, Fan O. Wu, et al.
7 天前
GTool:基于大语言模型的图增强工具规划
GTool:基于大语言模型的图增强工具规划
Wenjie Chen, Wenbin Li, Di Yao, et al.
7 天前
基于机器学习增强的恒电位框架对锂金属-电解质界面枝晶形成的观测
基于机器学习增强的恒电位框架对锂金属-电解质界面枝晶形成的观测
Taiping Hu, Haichao Huang, Guobing Zhou, et al.
7 天前
XQuant:通过KV缓存重计算突破LLM推理的内存墙
XQuant:通过KV缓存重计算突破LLM推理的内存墙
Aditya Tomar, Coleman Hooper, Minjae Lee, et al.
8 天前
BeyondWeb:在万亿规模预训练中规模化合成数据的启示
BeyondWeb:在万亿规模预训练中规模化合成数据的启示
Pratyush Maini, Vineeth Dorna, Parth Doshi, et al.
8 天前
PaperRegister:通过分层注册索引提升细粒度论文检索
PaperRegister:通过分层注册索引提升细粒度论文检索
Zhuoqun Li, Xuanang Chen, Hongyu Lin, et al.
8 天前
DINOv3
DINOv3
Oriane Siméoni, Huy V. Vo, Maximilian Seitzer, et al.
8 天前
SSRL:自搜索强化学习
SSRL:自搜索强化学习
Yuchen Fan, Kaiyan Zhang, Heng Zhou, et al.
8 天前
Thyme:超越图像的思考
Thyme:超越图像的思考
Yi-Fan Zhang, Xingyu Lu, Shukang Yin, et al.
8 天前
用文化知识对多语言多模态LLM进行接地
用文化知识对多语言多模态LLM进行接地
Jean de Dieu Nyandwi, Yueqi Song, Simran Khanuja, et al.
8 天前
HiFiTTS-2:一个大规模高带宽语音数据集
HiFiTTS-2:一个大规模高带宽语音数据集
Ryan Langman, Xuesong Yang, Paarth Neekhara, et al.
8 天前
CryptoScope:利用大语言模型实现密码逻辑漏洞的自动化检测
CryptoScope:利用大语言模型实现密码逻辑漏洞的自动化检测
Zhihao Li, Zimo Ji, Tao Zheng, et al.
8 天前
医学图谱RAG:通过图谱检索增强生成实现安全的医学大语言模型
医学图谱RAG:通过图谱检索增强生成实现安全的医学大语言模型
Junde Wu, Jiayuan Zhu, Yunli Qi, et al.
8 天前
Puppeteer:为你的3D模型绑定并动画化
Puppeteer:为你的3D模型绑定并动画化
Chaoyue Song, Xiu Li, Fan Yang, et al.
9 天前
STream3R:基于因果Transformer的可扩展序列3D重建
STream3R:基于因果Transformer的可扩展序列3D重建
Yushi Lan, Yihang Luo, Fangzhou Hong, et al.
9 天前
PRELUDE:一个旨在要求对长上下文进行全局理解与推理的基准
PRELUDE:一个旨在要求对长上下文进行全局理解与推理的基准
Mo Yu, Tsz Ting Chung, Chulun Zhou, et al.
9 天前
ToonComposer:通过生成式后关键帧技术简化动画制作
ToonComposer:通过生成式后关键帧技术简化动画制作
Lingen Li, Guangzhi Wang, Zhaoyang Zhang, et al.
9 天前
NextStep-1:面向大规模连续Token的自回归图像生成
NextStep-1:面向大规模连续Token的自回归图像生成
NextStep Team, Chunrui Han, Guopeng Li, et al.
9 天前
最新论文 | HyperAI超神经