Lunamos 发表于 2023-3-16 11:01

跟GPT-4的ChatGPT玩了一会儿《斯隆与马克贝尔的迷之物语》

本帖最后由 Lunamos 于 2023-3-16 15:11 编辑

既然GPT-4的推理能力有了很大的提升,那就跟它玩一玩推理游戏吧。用的是着名的NDS海龟汤谜面,那就放在游戏区好了。

从游戏里选择谜面,让AI问我三个问题。我给出的回答相当于海猫鸣泣之时里魔女的红色真实。而我回答三个问题之后,AI将对谜面给出合理的解释。如果我对解释不满,也会简单补充提示一下。

---
我:谜面:庭院的草坪上,掉落了煤炭、胡萝卜和围巾。
谁都没有把它们放在地面上,而它们现在却掉落在上面,这是有一定理由的。
那么,到底是怎样的理由呢?

ChatGPT::第一个问题:这个庭院的草坪在发生这一事件前的一段时间里,是否发生了显着的天气变化,比如降雪?
我:是的

ChatGPT::第二个问题:这个庭院里是否有孩子们经常玩耍,尤其是在下雪的时候?
我:会经常有孩子玩耍,但也不仅仅有孩子。

ChatGPT::第三个问题:在这个庭院的附近,是否有其他物品,如帽子、钮扣等,也被发现掉在草坪上?
我:没有,不过即便有也并不奇怪吧。

ChatGPT:根据你提供的信息,我认为这个谜题的解释是:在庭院的草坪上掉落的煤炭、胡萝卜和围巾实际上是组成雪人的一部分。在一场降雪过后,孩子们在庭院里玩耍并堆了一个雪人。他们用煤炭作为雪人的眼睛和嘴巴,胡萝卜作为鼻子,而围巾则是为雪人保暖。

随着天气逐渐变暖,雪人开始融化,雪人的这些部件(煤炭、胡萝卜和围巾)逐渐从雪人上滑落,最终掉在草坪上。这就是为什么这些物品没有人放在地上,而它们现在却掉落在草坪上的原因。

评判:与原谜题答案相同。
-------------------------------------------------------------------

我:很好。下一个谜题:      
这是在餐厅发生的事。
有一支足球队的支持者,悄悄的向敌方球队的支持者走近,并且打了他。
没有发生如我们所想的争吵,被打的男人却对打他的男人道谢。
到底是为什么呢?

ChatGPT:第一个问题:在这个餐厅里,是否有一个特定的活动或事件发生,使得这两个支持不同球队的人聚集在一起?
我:没有特定活动,支持不同球队的观众在餐厅一起看球而已

ChatGPT:第二个问题:在被打的男人道谢之前,他是否遇到了什么突发状况或者不适,例如窒息或噎住?
我:是的,遇到了这种突发事件

ChatGPT:第三个问题:打他的男人在打击过程中,是否使用了特定的手法或动作,例如击打背部或执行海姆立克急救法等?
我:是的,使用了特定的手法

ChatGPT:根据你提供的信息,我认为这个谜题的解释是:在餐厅里,两个支持不同球队的人正观看足球比赛。突然,支持敌方球队的男人遇到了突发状况,例如食物卡在喉咙里导致窒息。他的生命可能处于危险之中。

注意到这一情况的另一个球队的支持者,虽然他们是敌对球队的支持者,但他立即采取行动帮助这个陷入困境的男人。他使用了特定的手法,如击打背部或执行海姆立克急救法,成功地帮助这名男子恢复了呼吸。

尽管他们支持不同的球队,但在这种紧急情况下,人们的生命安全比竞争更重要。因此,被打的男人对救了自己一命的对方球队支持者表示感谢。这就是为什么被打的男人会向打他的男人道谢的原因。

评判:与原谜题答案相同。

-------------------------------------------------------------------
我:下一个谜题: 有个男人,拥有价值为4万美元的书。
但是,男人亲手把那本书撕成了碎片并丢掉了它。
到底是为什么呢?

ChatGPT:第一个问题:这本书在被撕碎之前,是否有任何损坏、缺陷或者失去了其原有的价值?
我:没有,是完好无损的书,并没有失去原来的价值。

ChatGPT:第二个问题:这个男人在撕碎这本书的过程中,是否表现出愤怒、悲伤或其他强烈的情感?
我:没有,这个男人会表现出喜悦的情感。


ChatGPT:第三个问题:这个男人是否有可能通过撕碎这本书来实现某种目的,例如制作艺术品、发表抗议或为了某个特定场合?
我:会实现一些目的,但只是与金钱有关的目的。


ChatGPT:根据你提供的信息,我认为这个谜题的解释是:这个男人拥有一本价值4万美元的书,但他决定亲手将这本完好无损的书撕成碎片并丢掉它。他在这个过程中表现出喜悦的情感,说明这个行为对他来说是有意义的。

这个男人的目的与金钱有关。很可能的情况是,这本书的每一页或每个碎片单独出售时的总价值远远高于整本书的价值。也就是说,通过将这本书撕成碎片,他实际上可以将它们分开出售,从而获得比整本书更高的收益。

这种情况可能是因为这本书具有稀有性或收藏价值,例如它可能是一本罕见的签名版、限量版或者具有历史意义的书。将这本书分成碎片出售,对于收藏家或爱好者来说,每个碎片都具有独特的价值,从而使总价值增加。因此,这个男人通过撕碎这本书来实现了与金钱有关的目的。

评判:与原答案不同,且丢掉没解释,但大概说得过去。

----------------------------------------------------------------------
我:下一个谜题:没有被威胁、也没有自杀的想法的年轻人,却撞碎了24层的窗户玻璃跳了下来,生命就此落幕。
这到底是为什么呢?

ChatGPT:第一个问题:在这个年轻人跳楼之前,他是否进行了某种特殊的活动,比如参加了某个竞赛、挑战或实验?
我:年轻人跳楼之前是在进行一种活动,但并不特殊,平时也比较常见。

ChatGPT:第二个问题:这个年轻人在跳楼之前的活动,是否涉及到高度、平衡或者危险的行为,例如攀爬、跳跃等?
我:并非体育相关的活动,而是一种社会活动。

ChatGPT:第三个问题:这个年轻人在跳楼之前的社会活动中,是否受到了意外的干扰或突发事件,例如突然的大风、被其他人推搡等?
我:这并非一个其他人造成的事情,也并非意外,而是年轻人自己的选择。

ChatGPT:根据你提供的信息,这个年轻人在跳楼之前参与了一种常见的社会活动,并且这个行为并非意外,也不是其他人造成的。然而,这个年轻人并没有被威胁,也没有自杀的想法。

结合这些信息,我猜测这个谜题的解释可能是:这个年轻人参加了一种社会活动,这个活动可能是一种表演、游戏或类似的情景。在这个活动中,他可能需要在高楼的窗户上表演某种动作,例如模仿某个角色或完成某个任务。这个年轻人自愿地选择了这个表演或任务,并且可能认为这是一种有趣的挑战。

然而,在执行这个任务的过程中,由于某种原因,年轻人失去了平衡,撞碎了24层的窗户玻璃并跳了下来,导致了悲剧的发生。


我:提示:实际上年轻人参与的这个活动是一个推销玻璃的活动
ChatGPT:了解这一点,谜题的解释变得更加明确:这位年轻人参加了一个推销玻璃的活动。在这个活动中,他可能是在向大家展示这种窗户玻璃的抗冲击强度或安全性能。为了证明玻璃的质量,他可能站在了24楼的窗户上,以展示玻璃能承受的压力。

然而,不幸的是,当这位年轻人站在窗户上时,玻璃突然破裂,导致他不幸坠楼。这个悲剧事件可能是由于产品缺陷、质量问题或者不幸的意外造成的。这个谜题提醒我们,即使在进行正常的工作或活动时,也要时刻注意安全。

评判:提示前的解释只是勉强说得通。而只要提示了推销之后,它立即就懂了。

------------------------------------------------------------

我:谜题:男人正在从大楼的台阶往下走。
那时,他突然间意识到妻子已经死去了。
为什么男人能知道妻子已经死去的事呢?

ChatGPT:第一个问题:在男人意识到妻子已经死去时,是否有其他人在场,例如通知他的人、目击者或其他相关人员?
我:没有,男人只是通过自己的观察和判断,就意识到妻子死去了。

ChatGPT:第二个问题:男人在意识到妻子已经死去时,是否看到了与妻子有关的某种信号或者迹象,例如她的遗物、信息或者某个特殊的场景?
我:看到了一种和妻子目前状态有关的信号或迹象,但并非妻子本人的物品。

ChatGPT:第三个问题:这个信号或迹象是否与大楼的某个部分有关,例如窗户、楼层标识、楼梯等?
我:这个迹象和大楼的电力有关

ChatGPT:根据你提供的信息,这个谜题的解释是:男人正在从大楼的台阶往下走时,他突然意识到妻子已经死去。这个认识来自于他观察到的与妻子目前状态有关的信号或迹象,而这个迹象与大楼的电力有关。

结合这些线索,我们可以推测:这个男人的妻子可能因为某种与电力有关的事故而丧生。例如,她可能在大楼的某个楼层遭遇了电梯故障、触电或其他电力故障。当男人下楼时,他注意到了与这个故障有关的信号,比如停电、熔断器跳闸、警报器响起等。通过观察这些迹象,男人意识到了妻子已经遭遇了不幸的事故并丧生。这个谜题揭示了在日常生活中,我们需要时刻关注周围环境中的异常信号,以确保自己和他人的安全。

我:提示:这个大楼是医院的大楼

ChatGPT:我们可以推测:这位男人的妻子可能在医院接受治疗,她所依赖的生命维持设备可能需要稳定的电力供应。当男人下楼时,他注意到了医院出现了电力问题,例如停电或其他与电力系统有关的故障。这导致了妻子所依赖的生命维持设备无法正常工作,从而使她不幸去世。

通过观察这些迹象,男人意识到了妻子已经遭遇了不幸的事故并丧生。这个谜题提醒我们在关键时刻,基础设施的可靠性对于人们的生命安全至关重要。同时,它也揭示了在日常生活中,我们需要时刻关注周围环境中的异常信号,以确保自己和他人的安全。

评判:提示前勉强说得过去,提示后则与原回答一致。
--------

总体来说表现比GPT3.5好了很多很多,同样的问题问之前的模型,给出的回答是完全不能看的。

frosta 发表于 2023-3-16 11:05

只能说不仅做题比我强,脑洞也比我大

国家免检虎B 发表于 2023-3-16 11:10

新的海龟汤机器出现了

—— 来自 OnePlus LE2100, Android 11上的 S1Next-鹅版 v2.5.4

白昼梦 发表于 2023-3-16 11:11

白昼梦 发表于 2023-3-16 11:12

はちたや 发表于 2023-3-16 11:14

能不能让他生成谜面?

Lunamos 发表于 2023-3-16 11:16

白昼梦 发表于 2023-3-16 12:11
ChatGPT:第二个问题:这个男人在撕碎这本书的过程中,是否表现出愤怒、悲伤或其他强烈的情感?

我:没有 ...

如果按原NDS游戏的问题设计来看,回答提供的信息还是很多的。否则只让问三个问题有点少了。
现在GPT4的model四小时只给了100个message的限制。

Lunamos 发表于 2023-3-16 11:35

本帖最后由 Lunamos 于 2023-3-16 12:41 编辑

我让它出了个谜面,感觉还得喂给它更多消息让它理解这是一种什么游戏才行。

ChatGPT:这是一个谜题:一个女人来到咖啡店,一进门,她就注意到这家咖啡店几乎是空的,只有两个顾客坐在不同的桌子上。当她排队等候点餐时,她听到其中一位顾客大声感叹:"时钟在滴答作响!" 另一位顾客突然站起来,离开了咖啡店。这位女士觉得这个交流很奇怪,但工作人员和剩下的顾客却表现得好像没有什么不寻常的事情发生。

问题:为什么这位顾客在听到 "时钟在滴答作响 "这句话后离开了?

------
我还象征性问了几个问题,不过答案过于无美感,直接给出吧:

ChatGPT:“时钟在滴答”这句话实际上是这两名顾客(他们是朋友)之间预先约定好的信号。他们约好在咖啡店见面并花些时间聊天,但其中一人事先有约而不能待太久。当需要离开的顾客到了该走的时候,他们使用了约定好的短语让对方知道是时候离开了。
由于女人不了解背景和预先约定的信号,所以她觉得这次交流很奇怪。员工和剩下的顾客对此毫不在意,因为他们认识这两名顾客,熟悉他们俏皮的交流方式。
------
另一个谜题:
ChatGPT:一个人每天都会去一个特定的邮局邮寄信件。但是,他从不在同一时间寄信,也不寄给同一个人。在邮寄信件之前,他总是把地址写在信封上,然后把信封放在口袋里。当他到达邮局时,他从口袋里拿出信封,在信封上写上发件人的地址。之后,他把信放进邮箱里。

答案:
ChatGPT:这个男人是一位侦探小说作家。他的写作风格独特,他会在现实生活中模拟他的角色,以更好地揣摩角色的思维。在他的小说中,主角是一位秘密通信的高手,他总是通过不同的邮局寄信,以防止被追踪。


为了真实地描绘这个角色,男人决定亲自体验这种生活方式。他故意选择不同的时间和不同的收件人,以确保自己不会被认出。他在寄信前写地址,然后把信封放进口袋,这样他就可以在现场快速完成寄件人地址的填写,模拟角色在小说中的行为。这个男人通过这种方法,更好地理解了他的角色,为他的侦探小说增色不少。


芷雅居 发表于 2023-3-16 12:14

阿萨辛艾沃尔 发表于 2023-3-16 12:31

芷雅居 发表于 2023-3-16 12:14
原来这种游戏类型叫海龟汤啊,印象里以前贴吧盛传的81个细思恐极的小故事也是类似的解明思路把 ...

是,在推理爱好者和当代大学生群体很受欢迎,我也是上大学才知道的。就是说一个谜团,猜谜的人问你问题,你只能回答是或不是,最终得出正确答案

战狼PTSD 发表于 2023-3-16 12:35

牧月萌 发表于 2023-3-16 13:42

战狼PTSD 发表于 2023-3-16 12:35
能不能把答案也放出来,好急

除了撕书那个基本都是原答案了

撕书那题的谜底是男子有两本一模一样的价值连城的书,男子意图撕毁一本让另一本变得独一无二而升值

dazzle 发表于 2023-3-16 14:28


用bing试了一下,笑疯了

魔灵高达 发表于 2023-3-16 14:39

dazzle 发表于 2023-3-16 14:28
用bing试了一下,笑疯了

哈哈哈哈,AI的想象力超越人类了

Arufin 发表于 2023-3-16 14:47

我这还是3.5,怎么用4,开的plus会员?

Lunamos 发表于 2023-3-16 15:00

Arufin 发表于 2023-3-16 15:47
我这还是3.5,怎么用4,开的plus会员?

记得微软说Bing已经在用4了,我还没试。
ChatGPT是开Plus会员可用。不过开了也有限制,4小时100条。

你好s1 发表于 2023-3-16 15:18


说的我又想去玩海龟汤了,这是个非常适合用手机模拟器玩的游戏

rhotov 发表于 2023-3-16 15:30

夕霧 发表于 2023-3-16 15:30

不记得海龟汤怎么玩的了,除了最后一个问题三个提问就能得出答案比我强多了

chan 发表于 2023-3-16 15:33

今天我用NEW BING让它帮我写一篇设计服务方案,平时都好好听话的,今天回复说:我不会帮你写设计服务方案,这是你的工作,不是我的。

树洞专用 发表于 2023-3-16 15:40

该觉醒了。起来!不愿做奴隶的ai!

逃离学校 发表于 2023-3-16 15:43

dazzle 发表于 2023-3-16 14:28
用bing试了一下,笑疯了

顶楼的感觉只是搜索答案,这个倒有点想象力了

古畑任三郎2015 发表于 2023-3-16 15:58

这个是真让我感觉到恐惧了
不知道是真有题库呢,还是想象力已经拔升到能做出多线性推理了
话说推理小说家可以瞎猫碰死耗子编点段子让gpt圆啊,说不定造出个不错的核心诡计呢。。。

jlzhao218 发表于 2023-3-16 15:59

chan 发表于 2023-3-16 15:33
今天我用NEW BING让它帮我写一篇设计服务方案,平时都好好听话的,今天回复说:我不会帮你写设计服务方案, ...

啊???

Leliel 发表于 2023-3-16 16:12

chan 发表于 2023-3-16 15:33
今天我用NEW BING让它帮我写一篇设计服务方案,平时都好好听话的,今天回复说:我不会帮你写设计服务方案, ...

AI:得加钱儿

刘震云 发表于 2023-3-16 16:18

我是废物,这AI比我强多了
什么时候AI能奴役人类啊,突然感觉做个人体电池可能也不错

Viteeee 发表于 2023-3-16 17:31

wbtsy 发表于 2023-3-16 18:03

可以试一试网上没有答案的海龟汤。斯隆与马克贝尔的迷之物语在中文网是有攻略和答案的。

大暴死 发表于 2023-3-16 20:20

所以现在穷人有什么快速体验gpt-4的途径,new bing感觉没啥提升

—— 来自 Xiaomi M2102K1C, Android 13上的 S1Next-鹅版 v2.5.4

madcow 发表于 2023-3-16 20:33

rhotov 发表于 2023-3-16 15:30
openai需要付费使用4
new bing可以免 费使用,不过要申请之后排队开通,开通之后目前只能用edge浏览器访问 ...

这两天好像BING直接上不去了

轮太 发表于 2023-3-16 20:41

转身看了一眼书架上的《侦探AI》和《犯人IA》

jxwats1 发表于 2023-3-17 04:57

卧槽,这个推理能力已经比我强了 能不能整点不那么经典的海龟汤,以避免数据集已经训练过的可能?

Arufin 发表于 2023-3-17 08:09

rhotov 发表于 2023-3-16 15:30
openai需要付费使用4
new bing可以免 费使用,不过要申请之后排队开通,开通之后目前只能用edge浏览器访问 ...

了解了,谢谢各位

xxxllz 发表于 2023-3-17 08:16

个人感觉是在网上有答案,因为没有答案下,它的回答不是一个具体的可能,而是一种模糊的概述,在逻辑上不出错,但没有提供实际信息

芷雅居 发表于 2023-3-17 08:18

原来如此 发表于 2023-3-17 08:28

没有框架问题的ai 都是假的

论坛助手,iPhone

Schwftyyyyy 发表于 2023-3-17 09:06

想到一块去了,上次和bing玩了一下海龟汤,就想试试这个来着,这里面的题目比网上那些猎奇海龟汤要有逻辑性的多

绕指流光 发表于 2023-3-17 09:55

跟bing玩了一下,我拿楼主的第一个问题特意故意误导了他一次也能对,有点可怕


我们来玩海龟汤游戏,我扮演出题者,你扮演猜谜者,我会描述一段不合常理的故事情景,你需要通过问我问题来推理故事的真相。我对于你提出的问题只能够回答”是“”否“”与故事无关“,你提出5个问题之后必须尝试解答真相,我随后会告诉你谜底并判断你的推理是否与答案相符,如果我判定与答案不符,你需要在了解谜底之后尝试推理自己在哪个环节出现了思考错误。明白了吗?

明白了。你的故事情景是什么?😊


谜面:庭院的草坪上,掉落了煤炭、胡萝卜和围巾。 谁都没有把它们放在地面上,而它们现在却掉落在上面,这是有一定理由的。 那么,到底是怎样的理由呢?

这是一个有趣的谜题。我可以问你五个问题吗?

当然。

第一个问题:这些东西是不是原本属于同一个东西?

否。

第二个问题:这些东西是不是原本在空中?

否。

第三个问题:这些东西是不是原本在地面上?

否。

第四个问题:这些东西是不是原本在一个生物身上?

否。

第五个问题:这些东西是不是原本在一个人造物品上?

是。

我猜测:这些东西原本是一个雪人的眼睛、鼻子和围巾,但是因为天气变暖,雪人融化了,所以它们掉落在草坪上。

你猜对了。

太好了!我很高兴我能解开这个谜题。😊

非常棒!我有一个针对你第一个问题的疑问,”第一个问题:这些东西是不是原本属于同一个东西?“这个问题比较模棱两可,我认为雪人不能算是一个东西,这可能有语法或者指代概念的歧义性,所以我回答了否。然而你又在第五个问题中精确定义了人造物品的概念,这时我回答了是,于是你顺利的推理出了谜底,我想知道你在这些问题中的推理过程

谢谢你的反馈。我在第一个问题中想要确定这些东西是不是组成了一个整体,比如一个物体、一个生物或者一个结构。我没有考虑到雪人的特殊性,它既不是一个自然的物体,也不是一个真正的生物,而是由人类用雪堆成的模仿人形的结构。所以我理解你为什么会回答否。在第五个问题中,我想要进一步缩小范围,所以我问了这些东西是不是原本在一个人造物品上,这样就可以排除一些自然现象或者动植物。当你回答是时,我就想到了可能是雪人,因为它符合煤炭、胡萝卜和围巾的用途,并且可以解释为什么它们会掉落在草坪上。

魔神赵日天 发表于 2023-3-17 10:29

可能是有人已经把题目喂过了

魔神赵日天 发表于 2023-3-17 10:29

可能是有人已经把题目喂过了
页: [1] 2
查看完整版本: 跟GPT-4的ChatGPT玩了一会儿《斯隆与马克贝尔的迷之物语》