グーグル、次世代AIモデル「Gemini 1.5」を発表 最大100万トークンの処理が可能

Gemini 1.0 Ultraと同レベルのパフォーマンスだという

Googleは2024年2月15日(米国時間)、AIモデル「Gemini(ジェミニ)」の次世代版として「Gemini 1.5」を発表しました。

Geminiは、2023年12月に発表されたGoogleによるAIモデル。発表時は「Gemini 1.0」として、「nano」「Pro」「Ultra」の3モデルが展開されました。今回、Geminiのリリースから約3カ月で早くも次世代版が投入された形です。

Gemini 1.5において、初期テスト用として公開される最初のモデルは「Gemini 1.5 Pro」です。Gemini 1.5 Proは、中規模のマルチモーダルモデルで、幅広いタスクにわたるスケーリングに最適化されています。より少ないコンピューティングでGemini 1.0 Ultraと同レベルのパフォーマンスを発揮するといいます。

Gemini 1.5 Pro

Gemini 1.5 Proは最大100万トークンを処理可能

Gemini 1.5 Proのコンテキストウィンドウ(AIが回答を生成する際に参照できる情報量)は、標準で12万8000トークンで、最大100万トークンとなっています。コンテキストウィンドウが大きくなるほど、プロンプトに対してより多くの情報を取り込んで処理できるため、出力の一貫性や関連性、有用性が高まります。ChatGPT(GPT-4 Turbo)のコンテキストウィンドウは12万8000トークンであるため、Gemini 1.5 ProではChatGPTを大幅に超える情報量を処理できることが分かります。

Gemini 1.5 Proが一度に処理できる情報量は、1時間の動画、11時間の音声、3万行以上のコード、70万行以上のコードベースといったように膨大です。なおGoogleによると、研究において最大1000万個のトークンのテストにも成功しているとのことです。

膨大な情報量の処理能力に加え、Gemini 1.5 Proは「インコンテキスト学習」に対応します。インコンテキスト学習とは、追加の学習を必要とせず、長いプロンプトで提供される情報から新しいスキルを学習できる能力です。Googleによるテストで、話者200人未満の「カラマン語」の文法マニュアルをGemini 1.5 Proに与えたところ、同じ内容を学習している人と同様のレベルで英語をカラマン語に翻訳することを学習したといいます。

Gemini 1.5は、AI StudioとVertex AIから一部のデベロッパーと企業に早期プレビュー版が提供されます。AIモデルのより広範なリリース準備が整い次第、Gemini 1.5 Proも導入予定となっています。

また、モデルの向上にあわせて、標準の12万8000トークンから100万トークンまでのスケールアップに対応した価格帯も提供予定です。初期テスターは、テスト期間中に100万トークンのコンテキストウィンドウを無料で試せますが、試験運用機能ではレイテンシーが大きくなることが予想されるとしています。

EDITED BY
TOKIWA