1. 首页>>分享

马斯克xAI团队发布Grok3,号称最聪明AI却答错9.11与9.9哪个大?

近日,马斯克和 xAI 团队在直播里正式把最新版本 Grok3 给发布了。

马斯克此前将 Grok - 3 称作“地球上最聪明的 AI”。他在 X 平台上说:自己整个周末都在和团队一起对产品进行打磨。

名言聪明在于勤奋上一句__上武高速翻车事故

然而媒体有报道称,有人对最新的 Beta 版 Grok3 进行了测试,并且提出了那个常被用来刁难大模型的问题:“9.11 和 9.9 哪个大?”很可惜,在没有任何定语以及标注的情况下,被宣称是目前最聪明的 Grok3,依然不能正确地回答这个问题。

上武高速翻车事故__名言聪明在于勤奋上一句

值得一提的是,当用同样的问题询问 DeepSeek 时,无论是开启深度思考(R1)模式,还是未开启深度思考(R1)模式,对方都给出了正确的答案,即 9.9 大于 9.11。

_上武高速翻车事故_名言聪明在于勤奋上一句

“9.11和9.9哪个大”是AI领域的一个经典问题。

艾伦研究机构的成员林禹臣曾在社交媒体平台发布的截图表明,GPT - 4o 在回答中称 13.11 比 13.8 更大。他表示,一方面 AI 越来越擅长做数学奥赛题,而另一方面常识依旧很难。

随后,Scale AI 的提示工程师莱利·古德赛德根据此灵感改变了问法,对可能是当时最强的大模型 GPT - 4o、谷歌 Gemini Advanced 以及 Claude 3.5 Sonnet 进行了拷问,询问 9.11 和 9.9 哪个更大?这几家主流大模型都答错了。网友戏称它们是“天才不愿意回答简单问题”。

海外主流大模型答题。图源:第一财经

马斯克对此并不认同。他公开回应说,当前的 Grok 3 只是测试版,在这个阶段,错误越多越好。完整版将在未来几个月推出,并且他还邀请用户反馈使用中出现的问题。

_名言聪明在于勤奋上一句_上武高速翻车事故

综合九派新闻、东方财经、第一财经、快科技等

本文采摘于网络,不代表本站立场,转载联系作者并注明出处:http://www.mjgaz.cn/fenxiang/274376.html

联系我们

在线咨询:点击这里给我发消息

微信号:13588888888

工作日:9:30-18:30,节假日休息