Google、マルチモーダルAI「Gemini Omni」発表 あらゆる入力から動画を生成する“世界モデル”

2 時間前 2
グーグルは5月19日(米国時間)、開発者会議「Google I/O」で新たなAIモデル「Gemini Omni」を発表した。テキストや画像、既存の動画など、ほぼあらゆる入力からリアルな動画を生成できるマルチモーダルAIだ。テキストから動画を作る既存モデル「Veo」と比べ、扱える入力の種類が大幅に広がっているのが特徴となる。
記事全体を読む