Googleは、これまでで最も強力なAIモデルであるGemini1.5Proを発表し、すべての開発者が利用でき、複雑なタスクを処理できます。
概要
- Gemini1.5Proは、以前のモデルよりも複雑なタスクを処理します。
- 開発者はモバイルアプリやWeb経由で利用できます。
- テキストライブラリ全体や1日分の音声を含む広範なデータを分析できます。
- オープンソースモデルGemma227Bと一緒にリリースされました。
Googleは、先月のベータ版リリースの成功に続き、これまでで最も強力なAIモデルであるGemini1.5Proをリリースし、すべての開発者が利用できるようになりました。この強力なモデルは、以前のモデルよりも複雑なタスクを処理できるように設計されており、AI機能の新たなベンチマークを設定します。
強化された機能
Gemini1.5Proは、テキストライブラリ全体、ハリウッドの長編映画、ほぼ1日分の音声データなど、広範なデータセットを分析できます。これは、OpenAIのGPT-4の20倍のデータであり、AnthropicのClaude3.5Sonnetが管理できる情報のほぼ10倍です。
可用性とアクセシビリティ
開発者はモバイルアプリケーションやWeb経由でGemini1.5Proにアクセスできるため、さまざまなユースケースで広く利用できるようになります。Googleは以前5月にこのモデルを発表し、その機能を利用しているベータテスターのビデオを公開した。機械学習エンジニアのルーカス・アトキンス氏は、このモデルがPythonライブラリ全体を分析して特定の問題を解決する方法を実証し、その高度な問題解決能力を強調しました。
オープンソースモデルGemma227B
Gemini1.5Proと並んで、Googleはオープンソースの大規模言語モデルGemma227Bもリリースし、すぐにオープンソースモデルランキングでトップの座を獲得しました。Gemma2では無料のアクセスと再配布が可能ですが、MITやApacheなどの従来のオープンソースライセンスと同一ではありません。
主な機能とカスタマイズ
Gemma2は、27Bバージョンと小規模の9Bバージョンの両方で、アクセスしやすく予算に優しいAI導入向けに設計されています。モデルのカスタマイズ可能な性質により、ユーザーは特定のタスクに合わせてモデルを微調整し、モデルをローカルで実行することでデータを保護できます。この柔軟性は、数学の問題向けに微調整されたMicrosoftの小規模言語モデルPhi-3によって実証されており、その分野でより大きなモデルよりも優れたパフォーマンスを発揮します。
AIランドスケープへの影響
Gemini1.5ProとGemma2のリリースはAIテクノロジーの大幅な進歩を示し、複雑なデータ分析と問題解決のための強力なツールを開発者に提供します。アクセシビリティとカスタマイズに対するGoogleの取り組みにより、これらのモデルは幅広いアプリケーションに対応でき、AI環境におけるイノベーションを推進します。