前の記事では、
Dân trí
の記者は、2024年の高校卒業試験で数学の問題を解くためにAIを搭載したチャットボットに要求し、その知能をテストしました。しかし、最終的な結果は期待通りではありませんでした。
AIツールの最高得点はGemini 1.5 Proで、50問中31問を正答しました。ChatGPT-4oは50問中23問を正答し、2位にランクインしました。一方、Googleが無料で提供しているAIチャットボットGeminiは、数学の問題の50問中わずか11問しか正答できませんでした。
AIチャットボットが数学の問題で高得点を取れなかった理由の1つは、問題がベトナム語で出題されたため、AIチャットボットが問題の要求を正確に理解できず、誤った回答を導き出した可能性があることです。
そこで、
Dân trí
の記者は、AIチャットボットの知能をテストするために、2024年の高校卒業試験の英語の問題を解くようにAIチャットボットに要求しました。
問題と解答の両方が英語である場合、AIチャットボットは数学の問題よりも多くの正しい解答を導き出すことができるのでしょうか?
Dân trí
の記者は、コード番号415の英語の問題を使用し、順番にAIチャットボットツールに解答を求めます。記者は、問題と選択式の回答に集中した画像になるように、画像の品質を最適化し、不要な部分を切り取ります。
その後、記者はAIチャットボットツールが生成した解答を、教育訓練省が発表した公式解答と比較し、どのAIチャットボットが最も多くの正しい解答を導き出したかを判断します。
ChatGPT-4o
ChatGPT-4oは、OpenAIによって開発された、現在最も知能が高く、広く使用されているAIチャットボットの1つです。ChatGPT-4oは現在、ユーザーに無料で提供されています。
ChatGPT-4oは、高校卒業試験の英語の問題を解くという挑戦に最初に参加する「受験者」となります。
ChatGPT-4oは、問題を解くように要求されると、試験の最初のページで18問中16問を正答し、強い印象を与えました。しかし、試験の2ページ目では、ChatGPT-4oは選択式の問題で15問中6問しか正答できず、3ページ目では10問中6問しか正答できませんでした。
試験の4ページ目の最後の7つの選択式の問題では、ChatGPT-4oは4つの正しい解答を導き出しました。
このように、ChatGPT-4oは最終的に英語の問題の50問中32問を正答しました。
Gemini
前の
Dân trí
の記事では、Geminiは数学の問題の50問中わずか11問しか正答できず、多くの失望を生み出しました。では、英語の問題では、Googleが無料で提供しているAIチャットボットは、より良い結果を得ることができたのでしょうか?
試験の最初のページでは、Geminiは18問中7問を正答しました。試験の2ページ目でも、Geminiは7つの正しい解答を導き出し、試験の3ページ目の正しい解答の数も7でした。そして、試験の4ページ目の最後の7つの選択式の問題では、Geminiは4つの正しい解答を導き出しました。
要約すると、Googleが無料で提供しているAIチャットボットは、英語の問題の50問中25問を正答しました。
Gemini 1.5 Pro
Dân trí
の記者は、Googleが提供する有料のAIチャットボットであるGemini 1.5 Proを使用して、英語の問題を解くことに挑戦しました。これは、有料のツールが無料版よりも高い得点を得られるかどうかを調べるためです。
試験の最初のページでは、Gemini 1.5 Proは18問中13問を正答し、試験の2ページ目の正しい解答数は6でした。Gemini 1.5 Proの試験の3ページ目と4ページ目の正しい解答数は、それぞれ3と4でした。
このように、Gemini 1.5 Proは合計で英語の問題の50問中26問を正答しました。つまり、無料版のGeminiよりも1問多く正答しただけです。
Claude AI
Claude AIは、ベトナムではあまり知られていないAIを搭載したチャットボットですが、GeminiやChatGPTよりも知能が高いと評価されています。
前の記事では、Claude AIは数学の問題を解くという挑戦を拒否しました。AIを使って試験を受けることは不公平であり、学習の結果に影響を与えると説明しました。
Claude AIは、ユーザーが試験で良い結果を得るためのアドバイスも提供しました。
しかし、英語の問題では、このAIチャットボットは挑戦を拒否せず、むしろ非常に迅速に解答を提供しました。
上記のChatGPT-4oと同様に、Claude AIは試験の最初のページで18問中16問を正答し、すぐに印象的な結果を残しました。試験の2ページ目では、Claude AIは出題された15問中10問を正答しました。
注目すべきは、試験の3ページ目では、Claude AIは10問中9問を正答することができ、試験の最後のページでは7問すべてを正答しました。
まとめると、Claude AIは英語の問題の50問中42問を正答することができ、非常に印象的な結果となりました。