豆包1.5“出炉”,视觉理解能力显著提升
作者:
文少
责任编辑:刘沙
来源:
电脑商情在线
时间:2025-04-17 11:40
关键字:
字节跳动 火山引擎 豆包 视觉理解 谭待
4月17日上午,字节跳动在火山引擎FORCE LINK AI创新巡展上正式发布了豆包1.5深度思考模型,并宣布该模型将面向企业提供服务。
火山引擎总裁谭待介绍,豆包1.5深度思考模型在视觉理解方面有了显著提升,能够结合视觉信息提供更多实用功能。例如,该模型可以根据照片分析地貌特征,帮助用户在旅行时更智能地辅助点餐,还能协助完成企业项目管理流程图的绘制。
此外,豆包1.5模型在视频搜索方面也表现出色。它能够根据用户的搜索问题,在视频内容中精准地找到相应的答案,大大提升了用户获取信息的效率。
同时,豆包的文生图模型也迎来了3.0版本的升级。新版本在文字排版方面更加美观,图片生成能力更加精细,并且具备了直接输出2k高质量图片的能力,这将为用户提供更出色的视觉内容创作体验。
豆包1.5深度思考模型的发布,是字节跳动在人工智能领域的进一步探索和创新。该模型不仅在技术上实现了突破,更在实际应用场景中展现了强大的实用性,为企业和用户带来了更多价值。