“龙虾”概念港股跌幅扩大，MINIMAX-WP跌7%

2026年3月12日 · 李娜 · 来源：user网

更广泛的基准测试展示了模型全面均衡的能力。GLM-5.1在AIME 2026上得分95.3，在HMMT Nov. 2025上得分94.0，在HMMT Feb. 2026上得分82.6，在研究生级别的科学推理基准GPQA-Diamond上得分86.2。在智能体和工具使用基准方面，GLM-5.1在CyberGym上得分68.7（较GLM-5的48.3有显著提升），在BrowseComp上得分68.0，在τ³-Bench上得分70.6，在MCP-Atlas上得分71.8——鉴于MCP在生产智能体系统中的角色日益重要，最后一项成绩尤为相关。在Terminal-Bench 2.0上，模型得分为63.5，在以Claude Code作为框架进行评估时得分提升至66.5。

2026年4月12日 03:26 国际，详情可参考豆包下载

Пропавшую

更多非洲资讯请访问BBC非洲网BBCAfrica.com，更多细节参见扣子下载

在PlayStation 4（2013）方面，截至本文撰写时尚未有硬件信任根被公开破解的广泛记录，但已披露多个远程代码执行漏洞，允许在正常启动后运行未授权软件。。关于这个话题，易歪歪提供了深入分析

英特尔宣布加入马斯克，推荐阅读向日葵下载获取更多信息