大模型测不出9.11和9.9哪个大 AI常识困境暴露【今日】《56之窗网》
标王 热搜: 贷款  深圳    医院  用户体验  网站建设  机器人  贵金属  桂林市  五角大楼 
 
 
当前位置: 首页 » 资讯 » 行业资讯 » 社会新闻 » 正文

大模型测不出9.11和9.9哪个大 AI常识困境暴露【今日】

放大字体  缩小字体 发布日期:2024-07-17 14:28:45  来源:互联网  作者:56之窗网  浏览次数:23

大模型测不出9.11和9.9哪个大

近期,一些主流人工智能模型在处理看似简单的数学对比问题时,意外地出现了集体失误。问题聚焦于“9.11和9.9哪一个更大”,即便是强大的GPT-4o以及谷歌的Gemini Advanced付费版等先进模型,都坚持认为9.11大于9.9。更有甚者,新晋的人工智能Claude 3.5 Sonnet还提供了一套看似合理却错误的计算逻辑,通过将数字分解为小数部分进行比较,最终得出了不正确的结论。大模型测不出9.11和9.9哪个大!

大模型测不出9.11和9.9哪个大

这一现象最初由Riley Goodside发现,他作为提示词工程师,在与GPT-4o的交互中注意到了这一异常。在尝试变换提问方式,甚至明确指定比较实数后,多数模型仍未能纠正这一基本的数学判断。有趣的是,当提问的顺序被调整后,某些AI模型竟然能够正确作答,揭示了它们对于词序的高度敏感性。

大模型测不出9.11和9.9哪个大 AI常识困境暴露

针对这一现象,有观察者推测,AI在没有明确指令指示其进行算术比较时,可能会误解问题的意图,从而产生不合逻辑的答案。部分原因归咎于大模型处理文本的token化方法,其中9.11中的“11”被错误地赋予了比9更高的权重,导致整体比较失准。

大模型测不出9.11和9.9哪个大 AI常识困境暴露

实验还扩展到了国产大模型,结果显示类似的问题同样存在,尽管也有如腾讯的元宝和字节跳动的豆包等模型能够正确处理并给出合理的解释。深入分析揭示,当明确告知AI这是关于双精度浮点数的比较后,它们通常能够得出正确的答案,这凸显了在特定情境下引导AI注意力机制的重要性。

 

  以上就是【大模型测不出9.11和9.9哪个大 AI常识困境暴露【今日】】全部内容,更多资讯请关注56之窗网。
 

本文地址:http://hot1.ffsy56.com/newsdetail1825178.html


版权与免责声明:以上所展示的信息由网友自行发布,内容的真实性、准确性和合法性由发布者负责。56之窗网对此不承担任何直接责任及连带责任,56之窗网仅提供信息存储空间服务。任何单位或个人如对以上内容有权利主张(包括但不限于侵犯著作权、商业信誉等),请与我们联系并出示相关证据,我们将按国家相关法规即时移除。
 
推荐图文
最新新闻
点击排行

新闻投稿、广告联系客服QQ:3442875907点击这里给我发消息