豆包1.5“出炉”,视觉理解能力显著提升

作者:

文少

责任编辑:

刘沙

来源:

电脑商情在线

时间:

2025-04-17 11:40

关键字:

字节跳动 火山引擎 豆包 视觉理解 谭待

  4月17日上午,字节跳动在火山引擎FORCE LINK AI创新巡展上正式发布了豆包1.5深度思考模型,并宣布该模型将面向企业提供服务。

  火山引擎总裁谭待介绍,豆包1.5深度思考模型在视觉理解方面有了显著提升,能够结合视觉信息提供更多实用功能。例如,该模型可以根据照片分析地貌特征,帮助用户在旅行时更智能地辅助点餐,还能协助完成企业项目管理流程图的绘制。

  此外,豆包1.5模型在视频搜索方面也表现出色。它能够根据用户的搜索问题,在视频内容中精准地找到相应的答案,大大提升了用户获取信息的效率。

  同时,豆包的文生图模型也迎来了3.0版本的升级。新版本在文字排版方面更加美观,图片生成能力更加精细,并且具备了直接输出2k高质量图片的能力,这将为用户提供更出色的视觉内容创作体验。

  豆包1.5深度思考模型的发布,是字节跳动在人工智能领域的进一步探索和创新。该模型不仅在技术上实现了突破,更在实际应用场景中展现了强大的实用性,为企业和用户带来了更多价值。

ToB最前沿

ToB最前沿抖音号

CBI科技在线

地址:北京市朝阳区北三环东路三元桥曙光西里甲1号第三置业A座1508室 商务内容合作QQ:2291221 电话:13391790444或(010)62178877
版权所有:电脑商情信息服务集团 北京赢邦策略咨询有限责任公司
声明:本媒体部分图片、文章来源于网络,版权归原作者所有,我司致力于保护作者版权,如有侵权,请与我司联系删除
京ICP备:2022009079号-3
京公网安备:11010502051901号
ICP证:京B2-20230255