GLM 5.2 vs Kimi k2.7 vs Claude Opus 4.8
应朋友们的要求 GLM 5.2 一起测了吧 ,还是用的“AI合同审查”项目的PRD来构建
模型 构建时长 步数 5h额度 代码质量
GLM 5.2 106分钟 251 113% 83
Kimi k2.7 60分钟 429 120% 75
Opus 4.8 35分钟 164 50% 86
GLM 5.2 思考深度和时长怎么感觉和Qwen 3.7 、DeepSeek 一样 又深 又长
意图识别和指令遵循做的也不错
整体质量确实没有让人失望,但给到Opus 4.7有点过誉了 ,我体验在 4.6 和 4.7 之间
你通过数据也能看到,同样的任务 GLM 花了比Opus 4.8 3倍的时长 不管是算力的问题导致的 还是还是模型
这官方真的要好好优化
GLM 5.2 算是班级里的尖子生 开源现在排#
1# 确实
好了 就分享到这里 有新的惊喜发现再来分享