如何看待机器之心重测高考数学全卷，Gemini夺冠，豆包DeepSeek并列第二？

{dede:adminname/} 2025-06-23 08:35:16 {dede:type} 如何看待机器之心重测高考数学全卷，Gemini夺冠，豆包DeepSeek并列第二？_安徽省合肥市合肥高新技术产业开发区约太包钢加固股份有限公司{/dede:type} 

当务之急最该解决的问题是大众对于 AI大模型的正确认知以及最基本的AI用法。

你看这是前两天的测试结果，突出了一个政治正确，6款大模型，OpenAI的o3倒数第一，我当时看到的时候就觉得很奇怪，o3好歹也是曾经的一代王者，高考数学这种题它排名这么低怕不是有什么猫腻。

我们就拿单选题的第五题来测试下，因为这道题除了o3，其他的国产模型都答对了。

这是第五题的原题，正确答案是A. - 1/2。

这是之前的第三方的测试结果，6个模型…。

如何看待机器之心重测高考数学全卷，Gemini夺冠，豆包DeepSeek并列第二？

猜你喜欢

我是新手想养鱼，预算不超过200。有什么好的建议或者禁忌吗。？
真不用听鱼圈那些知其然不知其所以然的大聪明告诉你过滤不够ba
如何评价引入 Liquid Glass 设计的 iOS 26？
还是那句话Liquid glass设计缺少实用性，还存在喧宾
在NAS上安装了什么应用，让你的生活体验有了巨大的提升？
赞藏比马上 1 ：3 了，求多点点赞我在NAS上使用的应用
为什么剪映是剪辑软件鄙视链的最底层?
让我想起了一个笑话。客户：你用什么软件做的？我：PS

手机扫一扫添加微信

 

 