马斯克xAI团队发布Grok3，号称最聪明AI却答错9.11与9.9哪个大？-模具钢网

近日，马斯克和 xAI 团队在直播里正式把最新版本 Grok3 给发布了。

马斯克此前将 Grok - 3 称作“地球上最聪明的 AI”。他在 X 平台上说：自己整个周末都在和团队一起对产品进行打磨。

名言聪明在于勤奋上一句__上武高速翻车事故

然而媒体有报道称，有人对最新的 Beta 版 Grok3 进行了测试，并且提出了那个常被用来刁难大模型的问题：“9.11 和 9.9 哪个大？”很可惜，在没有任何定语以及标注的情况下，被宣称是目前最聪明的 Grok3，依然不能正确地回答这个问题。

上武高速翻车事故__名言聪明在于勤奋上一句

值得一提的是，当用同样的问题询问 DeepSeek 时，无论是开启深度思考（R1）模式，还是未开启深度思考（R1）模式，对方都给出了正确的答案，即 9.9 大于 9.11。

_上武高速翻车事故_名言聪明在于勤奋上一句

“9.11和9.9哪个大”是AI领域的一个经典问题。

艾伦研究机构的成员林禹臣曾在社交媒体平台发布的截图表明，GPT - 4o 在回答中称 13.11 比 13.8 更大。他表示，一方面 AI 越来越擅长做数学奥赛题，而另一方面常识依旧很难。

随后，Scale AI 的提示工程师莱利·古德赛德根据此灵感改变了问法，对可能是当时最强的大模型 GPT - 4o、谷歌 Gemini Advanced 以及 Claude 3.5 Sonnet 进行了拷问，询问 9.11 和 9.9 哪个更大？这几家主流大模型都答错了。网友戏称它们是“天才不愿意回答简单问题”。

海外主流大模型答题。图源：第一财经

马斯克对此并不认同。他公开回应说，当前的 Grok 3 只是测试版，在这个阶段，错误越多越好。完整版将在未来几个月推出，并且他还邀请用户反馈使用中出现的问题。

_名言聪明在于勤奋上一句_上武高速翻车事故

综合九派新闻、东方财经、第一财经、快科技等

本文采摘于网络，不代表本站立场，转载联系作者并注明出处：http://www.mjgaz.cn/fenxiang/274376.html

马斯克xAI团队发布Grok3，号称最聪明AI却答错9.11与9.9哪个大？

相关推荐

联系我们