百度发布语音语言大模型,文小言全面升级,支持多地方言
作者:
文少
责任编辑:刘沙
来源:
电脑商情在线
时间:2025-04-01 15:31
关键字:
百度 语音语言大模型 文小言
3月31日下午,百度在AI DAY上正式发布了首个基于全新互相关注意力(Cross-Attention)技术的端到端语音语言大模型。该模型实现了超低时延和超低成本,在电话语音问答场景中,调用成本较行业均值下降约50%-90%。
目前文小言已完成品牌焕新,率先接入这一新模型。更新后的文小言不仅支持更拟真的语聊效果,还能支持重庆、广西、河南、广东、山东等地的方言。同时,语音大模型通过极低的训练和使用成本,以及极快的推理响应速度,将用户等待时长从行业常见的3-5秒缩短至1秒左右。
文小言还实现了“多模型融合调度”,整合了百度自研的文心X1、文心4.5等顶尖模型,并接入DeepSeek-R1等第三方优质模型。用户可以选择“自动模式”,一键调用最优模型组合,或根据需求灵活选择单一模型完成特定任务,提升任务处理效率。
此外,文小言的图片问答功能也得到了加强。用户拍摄照片或上传图片,以文字或语音提问,即可直接获取深度解析。例如,用户拍摄数学题可实时生成解题思路与视频解析;上传商品图片可对比参数和价格,辅助用户进行购物决策。