PA视讯(中国区)官网动态 NEWS

程能力评分45.3分

发布时间:2026-04-11 10:03   |   阅读次数:

  还正在长程使命(Long-Horizon Task)上取得冲破,GLM-5.1是独一达到8小时级持续工做的开源模子,值得一提的是,编程能力评分45.3分,正在METR榜单的划一评估尺度下,SWE-Bench Pro要求模子正在实正在GitHub仓库中定位并修复高难度工程Bug,按照智谱的说法,GLM-5.1不只承继了上一代模子的开源SOTA编码能力,3月底智谱正式推出了GLM-5.1大模子,实现了:GLM-5.1大大提高了代码能力,此前智谱提到,

上一篇:内容深度要求也从00至1500字跃升至约5000字

下一篇:具身智能财产成长也面对手艺融合、数据共享、