黑料网谷歌Gemini 3 Deep Think原地进化!在Codeforces比赛中拿下全球第七,击败了人类选手。短短三个月,全方位刷爆SOTA。今天,Gemini 3 Deep Think重磅升级,几乎刷爆全领域的SOTA,标志着AI推理能力进入了全新维度。 离职Anthropic入职谷歌的华人学者姚顺宇参与了Gemini 3 Deep Think这一次,在科学研究和硬核工程领域,Deep Think堪称一个「最强大脑」。它可以将草图渲染成一个高保真、实用的3D笔记本电脑支架图,并直接将其打印出来。 新版Deep Think的实力究竟有多恐怖?在编程界,它刷出了3455 Elo的惊人分数,达到世界冠军级的水准,冲入了Codeforces比赛人类TOP 10!也就是说,全球只有7人击败了Gemini 3 Deep Think,一年前,最强o3也仅拿下2727 Elo。 在人类最后考试(HLE)上,Gemini 3 Deep Think刷新SOTA,拿下了48.4%的成绩。甚至,它在一夜之间让最难的ARC-AGI-2基准直接饱和,以84.6%新SOTA一骑绝尘。与Gemini 3 Pro相比,Deep Think实现了全方位反超,并将Claude Opus 4.6、GTP-5.2直接踩在了脚下。原创社区
|