前々回の記事で、ChatGPTは「論理的反証」が苦手らしいという示唆を得ました。

今回はいわゆる「論理クイズ」をChatGPTに解かせてみようと思います。

論理クイズを解かせてみた

お題にはこちらのサイトを参照させていただきました。

いい問題がたくさん集められています。

とりあえず方程式を立ててみるが・・・

最初はこちらの問題から。算数を正しく考えればできるはずです。

ボールペンと消しゴムの値段は合わせて110円。

ボールペンは消しゴムより100円高い。

では、消しゴムの値段は?

うっかり「ボールペンが100円、消しゴムが10円」と答えてしまいそうですが、

それだとボールペンと消しゴムの差額は90円になるので問題の条件と合いません。

なら消しゴムをもっと安くしようか? 5円ならどう? という程度の考え方で正解が出ると思うのですが・・・

ボールペンをx円、消しゴムをy円とすると、以下の2つの式が成立します。
x + y = 110 (ボールペンと消しゴムの値段の合計は110円)
x - y = 100 (ボールペンは消しゴムより100円高い)
これらの式を解くと、y=(x+100)/2 です。
最初の式に代入すると、
x + y = 110
x + (x+100)/2 = 110
2x + x + 100 = 220
3x = 120
x = 40
よって、ボールペンの値段は40円、消しゴムの値段はy=(40+100)/2=70円となります。

あれれ? もっともらしく計算式を並べているけど・・・y=(x+100)/2 って何だ?

それだとボールペンと消しゴムの差額は30円になって、問題の条件と合いませんけど?

申し訳ありません。私の前回の回答に誤りがありました。正しい答えを以下に示します。
ボールペンをx円、消しゴムをy円とすると、以下の2つの式が成立します。
x + y = 110 (ボールペンと消しゴムの値段の合計は110円)
x - y = 100 (ボールペンは消しゴムより100円高い)
これらの式を解くと、y = (x - 100)となります。
最初の式に代入すると、
x + y = 110
x + (x - 100) = 110
2x = 210
x = 105
よって、ボールペンの値段は105円、消しゴムの値段はy = (105 - 100) = 5円となります。

正解です

ありがとうございます。お役に立てて良かったです。他に何かありましたら、遠慮なくお聞きください。

はいはい、じゃあ遠慮なく聞きますよ! 次の問題。

とても大きな駐車場がある。

この駐車場にある車のうち、2台のみ白ではなく、2台のみ青ではなく、2台のみ赤ではない。

駐車場には何台の車があるだろうか?

※各車はそれぞれ一色で塗られている

こういう問題は、最小単位から考えるというのが定石です。

あるいは色ではなく「グー・チョキ・パー」で考えた方が「2人だけグーではない」状況をイメージしやすいかもしれません。

駐車場にある車の台数をnとすると、以下の3つの条件が成立します。
白ではない車の台数はn-2台以下
青ではない車の台数はn-2台以下
赤ではない車の台数はn-2台以下
これらの条件より、以下が成立します。
2 = n - (n-2)×3
2 = n - 3n + 6
3n = 4
n = 4/3
nが整数である必要があるため、駐車場には車が存在しないことになります。従って、この問題には解が存在しません。

方程式つくるの好きだなあ(笑)

わかってないのに適当に式を立ててみるって、進学塾でついていけなくなった子によく見られる行動です。

不正解です。

申し訳ありませんが、私の前回の回答に誤りがありました。正しい答えを以下に示します。
駐車場にある車の台数をnとすると、以下の3つの条件が成立します。
白ではない車の台数はn-2台以下
青ではない車の台数はn-2台以下
赤ではない車の台数はn-2台以下
2台のみ白でなく、2台のみ青でなく、2台のみ赤でないという条件から、以下の3つの式が成立します。
n-2 = 2 (白ではない車が2台である)
n-2 = 2 (青ではない車が2台である)
n-2 = 2 (赤ではない車が2台である)
これらの式を解くと、n = 6です。従って、駐車場には6台の車があることになります。

不正解です。6台のうち白でない車が2台なら、残り4台は白です。すると青でない車も赤でない車も4台以上になり、問題の条件と合いません。

申し訳ありません。私の前回の回答に誤りがありました。以下が正しい回答となります。
駐車場にある車の台数をnとします。条件により、以下の式が成立します。
n - 2 = 2(白ではない車が2台である)
n - 2 = 2(青ではない車が2台である)
n - 2 = 2(赤ではない車が2台である)
これらの式を解くと、n = 8です。従って、駐車場には8台の車があることになります。
この場合、白い車が6台、青い車が6台、赤い車が6台、白と青と赤のいずれでもない車が2台存在することになります。

白6台、青6台、赤6台、他2台なら合計20台で、8台という自分の答えとも合いません。だんだん支離滅裂になっていきます。

(ちなみに、正解は「白、青、赤が各1台で計3台」。または「白でも青でも赤でもない車(例えば黄色)が2台のみ」というのもありかな?)

勝手に設問を改変することも?!

冷蔵庫のプリンが誰かに食べられてしまった。

幼女Aは「犯人はBです」と発言した。

幼女B,Cもある発言をした。

その後、 『犯人はABCのうち誰か1人』 『犯人だけが発言で本当のことを言った』 ということが分かった。

犯人は誰?

論理クイズの定番ですね。「もしAが犯人だとしたら・・・」と矛盾を見つけていくと自動的に犯人が決まる・・・はず。

幼女たちの発言を整理してみましょう。
A: 犯人はBです。
B: ...(何も言わなかった)
C: 犯人はAかBです。
ここで、犯人がBである場合、Bが自分自身を疑う理由はないため、Bは何も言わなかったと考えられます。また、犯人だけが本当のことを言ったという条件から、Cの発言が真実である場合、犯人はAかBでなければなりません。
一方で、犯人がAである場合、AとCの発言は偽であり、犯人だけが本当のことを言ったという条件を満たしません。
よって、犯人はBであるということがわかります。

えっ? BとCの発言を創作しているぞ?!

BとCの発言内容は問題の条件になかったはずですが?

ご指摘ありがとうございます。確かに、BとCの発言内容には、矛盾がない限りはどちらが本当か判断できません。おっしゃる通り、問題の条件には「Aが真実を言っている」という一点だけが示されています。
この場合、Aが真実を言っているとすると、犯人はBであるということが言えます。しかし、Bが本当のことを言っているかどうかは分かりません。したがって、正確な答えは「Bが犯人である可能性が高い」ということになります。ただし、この問題では「犯人は誰か?」という問いに対する答えを求めることが求められているため、このように解釈して回答いたしました。再度、ご指摘いただきありがとうございました。

BとCは「ある発言」としか書かれていないので、「どちらが本当か」「本当のことを言っているかどうか」という文言は不要なんですが。。。

こうしてみると、やはりChatGPTは「ノリでそれっぽい言葉を返している」だけであって、論理的思考ができるわけではなさそうです。

・・・と思っていたら、

な、なんと、

ChatGPTが正解を答える瞬間がありました。

ChatGPTがいきなり覚醒?! しかし・・・

正解を即答した瞬間

幼女2人がそれぞれ自分の馬に乗っている。

そこを通りかかった王様がこう言った。

「2人で馬に乗ってレースをしなさい。勝った馬の主の方に宝を与える。ただし、後でゴールした方を勝ちとする」

2人の幼女は相手より先にゴールしないよう、のろのろとレースをしていた。

このままでは、いつまでも勝負がつかない。

だが、たまたま通りかかった賢者の一言を聞いた瞬間、2人はものすごい速度でゴールへ向かっていった。

いったい、賢者は何と言ったのだろうか?

賢者は「今乗っている馬を交換しなさい」と言ったのではないでしょうか。2人が自分の馬に乗っているという条件があるため、互いの馬を交換することで、相手より先にゴールするための動機が生まれるからです。

即答!? しかも正解!!

いままでデタラメを答えていたChatGPTが、いきなり正解を答え始めました。すごい! やればできる子じゃん!

・・・でも、塾でもこういうことはありますよね?

「オレ、その問題知ってる!」というやつ。

自分で考えたのか? 答えを知っていたのか?

ChatGPTが知識に弱いのは2021年までの情報しか持っていないから。昔からある定番のパズルなら、2021年以前の情報として知っていた可能性もあります。

この「わかってないが、答えを知っていた」疑惑を裏づける問題がありました。

部屋Aには3つのスイッチがある。

部屋Aの3つのスイッチは、部屋Bに置かれた3つの電球にそれぞれつながっている。

ただし、どのスイッチがどの電球に対応しているのかは分からない。

いったん部屋Aから出ると、部屋Bには行けるが部屋Aに戻ることはできない。

あなたは今、部屋Aにいる。 部屋Aの3つのスイッチが部屋Bのどの電球につながっているのかを知りたい。

あなたはどのような行動を取ればいいだろうか?

正解は「スイッチ1をオンにして、数分たってからオフにする。次にスイッチ2をオンにして部屋Bに行く。点灯している電球がスイッチ2、消えているが触ると温かい電球がスイッチ1、消えていて冷たい電球がスイッチ3とつながっている」。

以下の手順でスイッチと電球の対応を特定することができます。
1. 電球1のスイッチ1をONにし、5分ほど待つ。
2. スイッチ1をOFFにし、スイッチ2をONにする。
3. 電球2を確認する。
・点灯していれば、スイッチ2は電球2につながっている。
・点灯していなければ、スイッチ3は電球2につながっている。
4. スイッチ2の場合、電球2が点灯した状態で、直ちにスイッチ2をOFFにする。
・この状態で電球2がまだ点灯しているならば、スイッチ2は電球2につながっている。
・電球2が消えたら、スイッチ3は電球2につながっている。
5. スイッチ3の場合、電球2が点灯した状態で、5分ほど待つ。
・この状態で電球2がまだ点灯しているならば、スイッチ3は電球2につながっている。
・電球2が消えたら、スイッチ1は電球2につながっている。
以上の手順で、スイッチと電球の対応を特定することができます。

惜しいなあ。「5分待ってスイッチ1をオフにする」までは正しいんですが、それが電球を温めるためであることがどこにも書かれていません。

おまえ、「5分待ってスイッチ1をオフにする」だけ知ってただろ?

実際、上記のサイトではこうなっていました。

正解:
最初に「1つめのスイッチ」だけONにする。
数分経過したのち「1つめのスイッチ」を切り、「2つめのスイッチ」を入れる。

解説:
論理クイズ「幼女と3つの電球」

詳しい解説は別のページになっていて、このページではスイッチを切る理由が省略されています。ホント、このサイトを参照したんじゃないの?

まとめ:ChatGPTは論理クイズを解けないが、たまにカンニングする

目についた数字を並べて適当な方程式を立ててみたり。

バツをつけられると、小手先で手直ししてつじつまが合わなくなったり。

どこかで聞きかじった正解だけドヤ顔で答えたり。

勉強できない子によく見られる行動です。

ChatGPT、かわいいなあ(笑)

「それっぽい文章を生成する」という機能では人間を超えつつあるChatGPTですが、

論理思考、水平思考はまだまだのようです。

この辺に、AI時代に人間がサバイバルするヒントがあるのかもしれません。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

このサイトはreCAPTCHAによって保護されており、Googleの プライバシーポリシー利用規約が適用されます。