昆仑万维发布工业多模态推理模型

作者:

CBINEWS

责任编辑:

张琳

来源:

电脑商情在线

时间:

2025-03-18 16:50

关键字:

昆仑万维 工业 多模态 AI

昆仑万维公司正式发布了全球首个工业界多模态推理模型,名为 Skywork R1V(简称“R1V”)。该模型拥有38亿参数,其性能已接近著名的闭源模型DeepSeek-R1,并在多个基准测试中表现出色,超越了众多当前的最先进技术(SOTA)。昆仑万维决定开源 R1V,旨在推动技术共享和进步,为全球AI开源社区注入新的活力。

R1V 以其卓越的多模态推理能力而闻名,能够无缝整合文本和视觉信息,展现出强大的智能。具体而言,R1V 在视觉问答任务中与 Claude3.5Sonnet 和 GPT-4o 等闭源模型竞争,并保持了顶级的文本推理能力。在 MMMU 基准测试中,R1V 以69分的高分打破了同等规模模型的新纪录,而在 MathVista 测试中也取得了67.5分的优秀成绩,证明了其在复杂数学推理和逻辑分析方面的强大能力。

R1V 的成功归因于昆仑万维研究团队的多项创新技术。这些技术包括跨模态迁移学习,它有效地将大模型的文本推理能力迁移到视觉模态,显著减少了多模态推理数据的需求。此外,R1V 采用的混合训练策略通过迭代监督微调和强化学习的结合,动态调整思维链长度,从而提高了推理效率。值得一提的是,R1V 还引入了自适应长度思维链蒸馏框架,以避免推理过程中的“过度思考”,显著提升了推理的效率和质量。

随着 R1V 的发布,昆仑万维不仅成为了全球首家开源多模态推理模型的公司,更在推动 AGI(通用人工智能)梦想的实现上迈出了关键的一步。模型的权重、推理代码和技术报告均已公开,任何人都可以通过 GitHub 和 Hugging Face 获取这些资源。

ToB最前沿

ToB最前沿抖音号

CBI科技在线

地址:北京市朝阳区北三环东路三元桥曙光西里甲1号第三置业A座1508室 商务内容合作QQ:2291221 电话:13391790444或(010)62178877
版权所有:电脑商情信息服务集团 北京赢邦策略咨询有限责任公司
声明:本媒体部分图片、文章来源于网络,版权归原作者所有,我司致力于保护作者版权,如有侵权,请与我司联系删除
京ICP备:2022009079号-3
京公网安备:11010502051901号
ICP证:京B2-20230255