コンテンツにスキップ

OpenAI o3

出典: フリー百科事典『ウィキペディア(Wikipedia)』
OpenAI o3
開発元 OpenAI
初版 2024年12月20日 (2か月前) (2024-12-20)
前身 OpenAI o1
種別 大規模言語モデル
公式サイト openai.com/12-days/
テンプレートを表示

OpenAI o3は、OpenAIによってOpenAI o1モデルの後継として開発された論理的思考(reasoning)能力を強化した大規模言語モデルである[1][2]。段階的な論理的推論を必要とする質問に対処する際に、追加の熟考時間を割くように設計されている[1]。知識に基づいて応答を返すGPTシリーズと比べて、科学、数学、プログラミングなどの論理的思考能力を必要とする課題を強化している。

沿革

[編集]

OpenAI o3モデルは、2024年12月20日に発表された[1]。「o3」という名称は、O2という既存のイギリスの携帯電話会社との商標上の問題を回避するために採用された[1]。このモデルは、o3o3-miniの2つのバージョンで提供されている[1]。o3-miniはreasoning effort(どれだけ論理的思考を深く行うか)がlow, medium, highの3つの設定がある[3]。2025年1月10日までは、招待ベースのテストプログラムを通じて、安全性とセキュリティの研究者にアクセスが提供される[1]。OpenAIは、2025年1月31日にo3-miniを一般公開した[3][4]

機能

[編集]

o3は、コーディング数学科学などの複雑なタスクにおいて、o1モデルよりも優れたパフォーマンスを示す[1]。難解な数学的および論理的問題を処理するAIの能力を評価するARC-AGIベンチマークでは、o3はo1の3倍の精度を達成している[1]

New Scientistの報道によると、o3はGoogleのソフトウェアエンジニアであるFrançois Cholletによって開発された権威あるAI推論テストである抽象化と推論コーパス(ARC)で、過去最高の75.7%のスコアを獲得したが[5]、85%の精度を必要とする「グランドプライズ」(人間レベルの成績とされる)の要件はまだ満たしていない[5]。テストによって課せられる計算コストの要件がなければ、モデルは87.5%の新記録を達成し[5]、人間の平均スコア84%を超えた[5]

TechCrunchによると、強化学習を用いて、OpenAIがプライベートCoTと呼ぶものを使用して、応答する前に時間をかけて考えることをo3に教え込んだ[6]。伝えられるところによると、o3は事前に計画を立て、タスクを通して推論し、問題解決を支援するために長期間にわたって一連のアクションを実行できるが[6]、TechCrunchは、これにより応答のレイテンシが増加すると報告している[6]

脚注

[編集]
  1. ^ a b c d e f g h Knight, Will. “OpenAI Upgrades Its Smartest AI Model With Improved Reasoning Skills”. 2024年12月22日閲覧。
  2. ^ OpenAI Unveils New A.I. That Can ‘Reason’ Through Math and Science Problems”. nytimes.com. 2 February 2025閲覧。
  3. ^ a b OpenAI o3-mini”. openai.com. 2 February 2025閲覧。
  4. ^ OpenAI announces o3 and o3-mini, its next simulated reasoning models”. Ars Technica. 2 February 2025閲覧。
  5. ^ a b c d Hsu, Jeremy. “OpenAI's o3 model aced a test of AI reasoning – but it's still not AGI” (英語). New Scientist. 2024年12月22日閲覧。
  6. ^ a b c Wiggers, Maxwell Zeff, Kyle (2024年12月20日). “OpenAI announces new o3 models” (英語). TechCrunch. 2024年12月22日閲覧。