HyperAI
HyperAI
主区域
首页
GPU
控制台
文档
价格
Pulse
报道
资源
论文
教程
数据集
百科
基准测试
SOTA
大语言模型(LLM)
GPU 排行榜
社区
活动
开源
实用工具
搜索
关于
服务条款
隐私政策
中文
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
登录
HyperAI
论文
论文
每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势
HyperAI
HyperAI
主区域
首页
GPU
控制台
文档
价格
Pulse
报道
资源
论文
教程
数据集
百科
基准测试
SOTA
大语言模型(LLM)
GPU 排行榜
社区
活动
开源
实用工具
搜索
关于
服务条款
隐私政策
中文
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
登录
HyperAI
论文
论文
每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势
字节跳动:基于二进制标记的自回归生成模型扩展
图像生成
扩散模型
Yuang Ai, Jiaming Han, Shaobin Zhuang, et al.
REDSearcher:一种可扩展且成本高效的长时序搜索Agent框架
Agent
多模态
Zheng Chu, Xiao Wang, Jack Hong, et al.
Qute:面向量子原生数据库
AI 编译器
检索增强生成
Muzhi Chen, Xuanhe Zhou, Wei Zhou, et al.
InnoEval:将研究创意评估视为一种基于知识的多视角推理问题
检索增强生成
基准
Shuofei Qiao, Yunxiang Wei, Xuehai Wang, et al.
查询作为锚点:基于大语言模型的场景自适应用户表征
多模态表征
LLM
Jiahao Yuan, Yike Xu, Jinyong Wen, et al.
SemanticMoments:通过三阶矩特征实现无需训练的动作相似性计算
视频理解
多模态表征
Saar Huberman, Kfir Goldberg, Or Patashnik, et al.
RLinf-Co:基于强化学习的模拟-现实协同训练用于视觉-语言-动作模型
强化学习
监督式微调
Liangzhi Shi, Shuaihang Chen, Feng Gao, et al.
ABot-M0:基于动作流形学习的机器人操作视觉-语言-动作基础模型
多模态
Agent
Yandan Yang, Shuang Zeng, Tong Lin, et al.
强化学习如何提升视觉推理能力?一种“怪物合成式”的分析
监督式微调
多模态
Xirui Li, Ming Li, Tianyi Zhou
MedXIAOHE:构建医学领域MLLMs的完整方案
多模态
智能问答
Baorong Shi, Bo Cui, Boyuan Jiang, et al.
无需缩放的缩放:面向细粒度多模态感知的区域到图像知识蒸馏
多模态
视觉问答
Lai Wei, Liangbo He, Jun Lan, et al.
少即是足:在LLM的特征空间中合成多样化数据
LLM
监督式微调
Zhongzhi Li, Xuansheng Wu, Yijiang Li, et al.
GigaBrain-0.5M*:一种基于世界模型强化学习的VLA
多模态
统一多模态
GigaBrain Team, Boyuan Wang, Chaojun Ni, et al.
MOSS-Audio-Tokenizer:面向未来音频基础模型的音频分词器扩展
Transformer
音频和语音处理
Yitian Gong, Kuangwei Chen, Zhaoye Fei, et al.
超越教师的学习:基于奖励外推的广义在线策略蒸馏
强化学习
LLM
Wenkai Yang, Weijie Liu, Ruobing Xie, et al.
DeepGen 1.0:一种轻量级统一多模态模型,用于推进图像生成与编辑
多模态
扩散模型
Dianyi Wang, Ruihang Li, Feng Han, et al.
Composition-RL:为大语言模型强化学习构建可验证的提示词组合
强化学习
智能问答
Xin Xu, Clive Bai, Kai Yang, et al.
Moltbook背后的魔鬼:在自我演化的AI社会中,Anthropic安全始终在消逝
LLM
Agent
Chenxu Wang, Chaozhuo Li, Songyang Liu, et al.
迈向自主数学研究
数学
LLM
Tony Feng, Trieu H. Trinh, Garrett Bingham, et al.
何时记忆,何时停止:面向长上下文推理的门控循环记忆
LLM
智能问答
Leheng Sheng, Yongtao Zhang, Wenchang Ma, et al.
ASA:面向工具调用领域适应的激活控制
智能问答
LLM
Youjin Wang, Run Zhou, Rong Fu, et al.
PhyCritic:面向物理AI的多模态批评者模型
多模态
视觉问答
Tianyi Xiong, Shihao Wang, Guilin Liu, et al.
GENIUS:生成式流体智能评估套件
多模态
统一多模态
Ruichuan An, Sihan Yang, Ziyu Guo, et al.
步骤 3.5 快闪:以 11B 激活参数开启前沿级智能
Agent
模型训练
Ailin Huang, Ang Li, Aobo Kong, et al.
世界-VLA-环:视频世界模型与VLA策略的闭环学习
扩散模型
视频生成
Xiaokang Liu, Zechen Bai, Hai Ci, et al.
迈向自主数学研究
数学
检索增强生成
Tony Feng, Trieu H. Trinh, Garrett Bingham, et al.
Agent世界模型:用于智能体强化学习的无限合成环境
Agent
LLM
Zhaoyang Wang, Canwen Xu, Boyi Liu, et al.
P1-VL:连接视觉感知与物理奥赛中的科学推理
多模态
多模态表征
Yun Luo, Futing Wang, Qianjia Cheng, et al.
思维链:基于自适应认知模式的推理
Agent
推理
Tianyi Jiang, Arctanx An, Hengyi Feng, et al.
UI-Venus-1.5 技术报告
Agent
LLM
Veuns-Team, Changlong Gao, Zhangxuan Gu, et al.
Code2World:一种通过可渲染代码生成的GUI世界模型
代码生成
多模态
Yuhao Zheng, Li'an Zhong, Yi Wang, et al.
OPUS:面向大语言模型预训练中每轮迭代的高效且原则性数据选择
LLM
Transformer
Shaobo Wang, Xuan Ouyang, Tianyi Xu, et al.
1
2
3
4
50
字节跳动:基于二进制标记的自回归生成模型扩展
图像生成
扩散模型
Yuang Ai, Jiaming Han, Shaobin Zhuang, et al.
REDSearcher:一种可扩展且成本高效的长时序搜索Agent框架
Agent
多模态
Zheng Chu, Xiao Wang, Jack Hong, et al.
Qute:面向量子原生数据库
AI 编译器
检索增强生成
Muzhi Chen, Xuanhe Zhou, Wei Zhou, et al.
InnoEval:将研究创意评估视为一种基于知识的多视角推理问题
检索增强生成
基准
Shuofei Qiao, Yunxiang Wei, Xuehai Wang, et al.
查询作为锚点:基于大语言模型的场景自适应用户表征
多模态表征
LLM
Jiahao Yuan, Yike Xu, Jinyong Wen, et al.
SemanticMoments:通过三阶矩特征实现无需训练的动作相似性计算
视频理解
多模态表征
Saar Huberman, Kfir Goldberg, Or Patashnik, et al.
RLinf-Co:基于强化学习的模拟-现实协同训练用于视觉-语言-动作模型
强化学习
监督式微调
Liangzhi Shi, Shuaihang Chen, Feng Gao, et al.
ABot-M0:基于动作流形学习的机器人操作视觉-语言-动作基础模型
多模态
Agent
Yandan Yang, Shuang Zeng, Tong Lin, et al.
强化学习如何提升视觉推理能力?一种“怪物合成式”的分析
监督式微调
多模态
Xirui Li, Ming Li, Tianyi Zhou
MedXIAOHE:构建医学领域MLLMs的完整方案
多模态
智能问答
Baorong Shi, Bo Cui, Boyuan Jiang, et al.
无需缩放的缩放:面向细粒度多模态感知的区域到图像知识蒸馏
多模态
视觉问答
Lai Wei, Liangbo He, Jun Lan, et al.
少即是足:在LLM的特征空间中合成多样化数据
LLM
监督式微调
Zhongzhi Li, Xuansheng Wu, Yijiang Li, et al.
GigaBrain-0.5M*:一种基于世界模型强化学习的VLA
多模态
统一多模态
GigaBrain Team, Boyuan Wang, Chaojun Ni, et al.
MOSS-Audio-Tokenizer:面向未来音频基础模型的音频分词器扩展
Transformer
音频和语音处理
Yitian Gong, Kuangwei Chen, Zhaoye Fei, et al.
超越教师的学习:基于奖励外推的广义在线策略蒸馏
强化学习
LLM
Wenkai Yang, Weijie Liu, Ruobing Xie, et al.
DeepGen 1.0:一种轻量级统一多模态模型,用于推进图像生成与编辑
多模态
扩散模型
Dianyi Wang, Ruihang Li, Feng Han, et al.
Composition-RL:为大语言模型强化学习构建可验证的提示词组合
强化学习
智能问答
Xin Xu, Clive Bai, Kai Yang, et al.
Moltbook背后的魔鬼:在自我演化的AI社会中,Anthropic安全始终在消逝
LLM
Agent
Chenxu Wang, Chaozhuo Li, Songyang Liu, et al.
迈向自主数学研究
数学
LLM
Tony Feng, Trieu H. Trinh, Garrett Bingham, et al.
何时记忆,何时停止:面向长上下文推理的门控循环记忆
LLM
智能问答
Leheng Sheng, Yongtao Zhang, Wenchang Ma, et al.
ASA:面向工具调用领域适应的激活控制
智能问答
LLM
Youjin Wang, Run Zhou, Rong Fu, et al.
PhyCritic:面向物理AI的多模态批评者模型
多模态
视觉问答
Tianyi Xiong, Shihao Wang, Guilin Liu, et al.
GENIUS:生成式流体智能评估套件
多模态
统一多模态
Ruichuan An, Sihan Yang, Ziyu Guo, et al.
步骤 3.5 快闪:以 11B 激活参数开启前沿级智能
Agent
模型训练
Ailin Huang, Ang Li, Aobo Kong, et al.
世界-VLA-环:视频世界模型与VLA策略的闭环学习
扩散模型
视频生成
Xiaokang Liu, Zechen Bai, Hai Ci, et al.
迈向自主数学研究
数学
检索增强生成
Tony Feng, Trieu H. Trinh, Garrett Bingham, et al.
Agent世界模型:用于智能体强化学习的无限合成环境
Agent
LLM
Zhaoyang Wang, Canwen Xu, Boyi Liu, et al.
P1-VL:连接视觉感知与物理奥赛中的科学推理
多模态
多模态表征
Yun Luo, Futing Wang, Qianjia Cheng, et al.
思维链:基于自适应认知模式的推理
Agent
推理
Tianyi Jiang, Arctanx An, Hengyi Feng, et al.
UI-Venus-1.5 技术报告
Agent
LLM
Veuns-Team, Changlong Gao, Zhangxuan Gu, et al.
Code2World:一种通过可渲染代码生成的GUI世界模型
代码生成
多模态
Yuhao Zheng, Li'an Zhong, Yi Wang, et al.
OPUS:面向大语言模型预训练中每轮迭代的高效且原则性数据选择
LLM
Transformer
Shaobo Wang, Xuan Ouyang, Tianyi Xu, et al.
1
2
3
4
50