Googleが新AI「Gemini Omni」発表
Introducing Gemini Omni

Googleが新しい高性能AI「Gemini Omni」を発表。テキスト、画像、音声、動画を理解するマルチモーダル(多様な形式を扱う)能力で、より自然な対話と創造的な作業を可能にするため重要です。
Googleは本日、次世代のマルチモーダルAIモデル「Gemini Omni」を発表しました。この革新的なモデルは、テキスト、画像、音声、動画など、あらゆる形式の情報をシームレスに理解し、推論し、生成する能力を備えています。Gemini Omniは、これまでのGeminiモデルの限界を大きく超え、より複雑なタスクやニュアンスの理解において飛躍的な進歩を遂げました。 このモデルは、特に長大なコンテキストウィンドウと、複数のモダリティにわたる高度なクロスモーダル推論能力が特徴です。これにより、ユーザーはより自然で直感的な方法でAIと対話できるようになります。例えば、動画の内容をリアルタイムで分析し、質問に答えたり、複雑な図表から洞察を抽出したりすることが可能です。 Googleは、Gemini Omniが様々なベンチマークで既存の最先端モデルを上回る性能を示したと報告しています。特に、MMLU、GPQA、HumanEvalなどの主要な評価セットにおいて、顕著な改善が見られました。このモデルは、Google CloudのVertex AIを通じて開発者や企業向けに提供され、また、Googleの様々な製品やサービスにも統合されていく予定です。 Gemini Omniのリリースは、AIの可能性をさらに広げ、クリエイティブな作業、情報アクセス、問題解決の方法に革命をもたらすことが期待されます。Googleは、このモデルが責任あるAI開発の原則に基づき、安全かつ倫理的に利用されるよう、継続的に取り組んでいくと述べています。