ChatGPTが世界中で話題になったことをきっかけに、人工知能(AI)を搭載したチャットボット(自動チャットソフトウェア)が続々と登場し、ユーザーにサービスを提供しています。
これらのチャットボットは、インターネットから収集されたデータを含む膨大なデータセットでトレーニングされており、ユーザーのさまざまな問題に対する解決策を提供するのに役立ちます。
AIチャットボットは、ユーザーが「量子コンピューターとは何か?」、「相対性理論とは何か?」といった非常に難しい概念について質問したり、要求に応じてプログラムコードを作成したりするのに役立ちます。
しかし、AIチャットボットは、一見単純で当たり前の問題に対して、時にはばかげた回答や間違った回答を返してしまうこともあります。
中国の多くのネットユーザーは、中国で開発されたAIチャットボットが、非常に単純な質問「9.9と9.11のどちらが大きいか?」に間違った回答をしたことを発見しました。
すべては、中国のテレビで放送されたリアリティ番組「Singer 2024」で始まりました。このコンテストでは、中国の歌手、スン・ナンがオンライン投票で13.8%の票を獲得し、13.11%の票を獲得したアメリカの歌手、シャンテ・ムーアを上回りました。
コンテスト終了後、一部のネットユーザーは、コンテスト主催者にミスがあったと主張しました。彼らによると、13.11%は13.8%よりも大きく、シャンテ・ムーアが勝者であるべきだと主張しました。
多くのネットユーザーは、中国で有名なAIチャットボットに助けを求め、13.11と13.8の2つの数字を比較しました。その結果、Moonshot AIのチャットボットKimiとBaichuanのチャットボットBaixiaoyingは、どちらも13.11が13.8よりも大きいという間違った結果を出しました。
一部のネットユーザーは、これらのAIチャットボットに「9.9と9.11のどちらが大きいか?」と確認しようとしました。すると、これらのチャットボットは「9.11の方が大きい」と回答しましたが、実際には9.9が正しい答えです。
しかし、アリババのQwenや百度のErnie Botなど、中国の他のAIチャットボットは、上記の数字比較の質問に対して正しい回答を出しました。
世界で最も賢いAIチャットボットも、小数点の比較問題に間違った回答をする
中国のAIチャットボットだけでなく、
Dân trí
の記者も、GoogleのGemini、OpenAIのChatGPT、AnthropicのClaudeAIなど、最も広く使用されているAIチャットボットに「9.9と9.11のどちらが大きいか」という質問をしてみました。
ChatGPTとGeminiはどちらも「9.9が9.11より大きい」という正しい回答を出しました。ChatGPTは簡潔な回答を出した一方で、Geminiは長文で複雑な回答を出しました。
驚くべきことに、現在最も賢いとされているAIチャットボットであるClaudeAIは、「9.11が9.9より大きい」という間違った回答を出しました。これは、このチャットボットが非常に説得力のある説明を出したにもかかわらずです。
「AIチャットボットは数学が非常に苦手です。これはよくあることです。」と、中国の浙江大学でコンピューターサイエンスの研究をしている呉義全教授は述べています。
呉教授によると、AIチャットボットは思考や計算能力を備えておらず、トレーニングされたデータに基づいて回答を予測するだけだということです。同教授は、AIチャットボットが数学のテスト問題に正答できたのは、「データの汚染」による可能性があると述べています。つまり、AIチャットボットは、トレーニングデータに含まれていた類似の質問に基づいて回答を記憶しているということです。
「AIの世界はコード化されており、数字、句読点、スペースなどはすべて同じように処理されます。そのため、質問のわずかな変更でも、結果に大きな影響を与える可能性があります。」と、呉教授は付け加えています。
この話は、AIチャットボットが、多くの人が考えているほど「神聖」ではなく、非常に賢いものではないことを示しています。
AIチャットボットが常にユーザーに正確な情報や回答を提供するとは限りません。そのため、ユーザーはAIチャットボットの活用方法を理解し、これらのツールが提供する情報を厳選して、合理的に使用することが重要です。AIチャットボットが提供する回答や情報をすべて鵜呑みにすることは避けるべきです。