7月28日晚,清华系大模型明星企业智谱发布新一代旗舰模型GLM-4.5,据悉,这一基础模型专为智能体应用打造,已在Hugging Face与ModelScope平台同步开源。

技术人员介绍,GLM-4.5 参数量为 DeepSeek-R1的二分之一、Kimi-K2 的三分之一,但在多项标准基准测试中表现得更好,得益于模型更高的参数效率。在性能优化之外,GLM-4.5系列也在成本和效率上实现突破:API 调用价格低至输入价格为0.8元/百万tokens,输出价格2元/百万tokens,大幅低于目前主流的模型定价。

 “衡量AGI(通用人工智能)的第一性原理,是在不损失原有能力的前提下融合更多通用智能能力,GLM-4.5 是我们对此理念的首次完整呈现,并有幸取得技术突破。”智谱相关负责人介绍,GLM-4.5 首次在单个模型中实现将推理、编码和智能体能力原生融合,以满足智能体应用的复杂需求。

为综合衡量模型的通用能力,技术团队选择了最具有代表性的12个评测基准,综合平均分,GLM-4.5 取得了全球模型第三、国产模型第一,开源模型第一。

真实场景表现比榜单更为重要。实测结果显示,GLM-4.5 相对其他开源模型展现出竞争优势,特别在工具调用可靠性和任务完成度方面表现突出。

“编程和智能体能力以后就是大模型标配了。”一位业内人士表示。近来,编程能力正成为大模型的重要能力。然而过去,大模型编程也面临着长程逻辑链断裂、动态调试能力弱、交互与协作瓶颈等问题。智谱团队介绍,GLM-4.5擅长处理复杂代码,能够编写复杂的应用、游戏、交互网页。根据演示,基于GLM-4.5 ,使用者只需给出“做一个 google搜索网站”“开发一个B站风格的网页端Demo”这样的提示词,就能快速生成一个真正能搜索的网站或一个能发弹幕的类B站网页。“这主要得益于模型原生具备的在前端编写网站、在后端进行数据库管理,以及通过工具调用接口支持任意智能体应用的能力。”技术人员说。

据悉,GLM-4.5兼容Claude Code、Cline、Roo Code等主流代码智能体,海内外用户可以在智谱开放平台体验。

来源:北京日报客户端

记者:孙奇茹

如遇作品内容、版权等问题,请在相关文章刊发之日起30日内与本网联系。版权侵权联系电话:010-85202353