GPT-5に入力するプロンプトにおいて「絶対にやってはいけないこと」とは?(筆者がWhiskで生成)
(小林 啓倫:経営コンサルタント)
波乱のリリースとなったGPT-5
米国時間の2025年8月7日、ChatGPTでお馴染みのOpenAIから、最新AIモデル「GPT-5」がリリースされた。
同社はプレスリリースにおいて、これを「OpenAI 史上最も賢く、速く、有用なフラッグシップモデル」であると表現。CEOのサム・アルトマンも、新モデルを「博士号取得者(PhD)レベルの専門家のように賢い」と表現し、それがAGI(汎用人工知能)の実現に向けた「極めて重要な一歩」だと述べた。
実際、GPT-5は各種ベンチマークで優秀な成績を収めている。
公式発表を見ると、たとえばAIME(American Invitational Mathematics Examination、米国の高校生向け数学コンテスト)2025の問題において、GPT-5は補助ツールを使用しない状態で94.6%というスコアを記録している。これは競技レベルの数学問題でほぼ完璧に回答できることを示しており、これまでのモデルで最高だったGPT-o3の88.9%というスコアを上回った。
ところが、リリース直後からユーザーから「出力品質が低下した」「以前より頭が悪くなった」といった批判が相次いだ。それにはいくつかの理由が存在している。
最大の理由は、GPT-5の独自性にある。実はGPT-5は、ひとつの高度なモデルではなく、複数のモデルから構成されている。
簡単に言うと、単純な問いにさっと答える「高速(Fast)モデル」と、複雑な問いにじっくり考えて答えを出す「推論(Thinking)モデル」があり(さらに有料版ユーザーには「プロ(Pro)モデル」というより優秀なモデルが用意されている)、ユーザーの質問に応じてどちらを使うかを「ルーター」が自動で選ぶ仕組みになっている。
ところが、OpenAIの説明によれば、発表当初このルーターに深刻なバグがあった。そのためモデルの自動選択が行われず、深くじっくり考えるべき問いに、あっさりと答えてしまうという事態が頻発。結果として、アルトマンCEOの表現を借りれば「GPT-5が実態よりもずっと間抜けに見えた」のだという。
結果論でしかないが、アルトマンCEOがGPT-5を「博士のように賢い」や「AGIに向けた一歩」などと表現したのも逆効果だったのだろう。
それ以前から彼とOpenAIは、GPT-5というメジャーアップデートに向け、ユーザーの期待を煽るような言動を行ってきた。ところがふたを開けてみると、確かにベンチマーク上での性能には改善が見られたが、それはどちらかと言えばマイナーアップデートに近いものだった。そこに不具合が重なり、「言うほど優秀か?」という反発が起きてしまったと考えられる。
またOpenAIがGPT-5のリリース時に、以前のモデル、特にGPT-4oへのアクセスを停止したことも、ユーザーの不満を増大させる一因となった。