GLM-4 整体性能与智能体能力提升

GLM-4 的整体性能相比上一代大幅提升,逼近 GPT-4,GLM-4 大幅提升了智能体能力,GLM-4 All Tools 实现自主根据用户意图,自动理解、规划复杂指令,自由调用网页浏览器、Code Interpreter 代码解释器和多模态文生图大模型以完成复杂任务。GLMs 个性化智能体定制功能亦同时上线,用户用简单的提示词指令就能创建属于自己的 GLM 智能体。

初步体验与官方对比策略

体验了半个多小时,整体感觉比上一代还是有明显的进步,逻辑能力变强了一些。官方公布的数据以 GPT4 做参照系做对比,由于我没做更详尽的类比测试,暂不做评价,

就发布会看到的内容对比的维度来看,智谱官方对自己的模型能力还是做了较为详尽的比对,非常明确的要以 GPT4 为对标,可能是个好思路但不绝对,策略上没有错,以成熟领先的做对比,不过能力上待验证。

功能场景与智能体路线的思考