智谱推出GLM-4.5模型,在12项基准评测中名列前茅
作者:
文少
责任编辑:刘沙
来源:
电脑商情在线
时间:2025-07-29 11:16
关键字:
智谱 GLM-4.5 模型 基准评测
7月28日晚,智谱正式推出面向智能体场景的新一代基座模型 GLM-4.5,并同时在 Hugging Face 与 ModelScope 开源,模型权重采用 MIT 协议,商用零门槛。
官方数据显示,GLM-4.5 在推理、代码、智能体三大综合能力上拿下开源 SOTA;在真人参与的代码智能体横向评测中,成绩位居国内第一。MMLU Pro、AIME 24、MATH 500、SciCode、GPQA、HLE、LiveCodeBench 等 12 项权威基准测试结果显示:该模型取得了全球排名第三,国产模型排名第一,开源阵营排名第一。
需要强调的是,GLM-4.5 通过更高的参数效率,仅用 DeepSeek-R1 一半的参数量、Kimi-K2 三分之一的参数量,就在 SWE-bench Verified 榜单上占据性能/参数比帕累托前沿。
此外,模型还采用了混合专家(MoE)结构,包括:GLM-4.5:总参数量3550亿,推理时激活参数320亿;GLM-4.5-Air:总参数量1060亿,推理时激活参数120亿。可用于复杂推理与工具调用的思考模式,和即时响应的非思考模式。
在API调用价格方面,输入0.8元/百万tokens,输出2元/百万tokens;高速版最高可达100tokens/秒。