【日本語速報】Google Cloud Next2025レポート
はじめに
アメリカ・ラスベガスで開催されているGoogle Cloud Next 2025に参加しています!MBSからは私を含め、4人このイベントに参加しています。
今回は、1日目の様子や現地の様子、Keynoteの発表の中で私が特に気になったものを中心にお伝えできたらと思います。
Keynote
Google Cloud Next2025はOpening Keynoteから始まります。
会場はかなり大きく、足を踏み入れただけでもテンションがあがります。
私は以下の写真のようにアリーナ席に座れましたが、この辺りに座るには1時間ほど前を目安に会場に着く必要がありそうです。アリーナ席でない場合も15分ほど前には満席になっていたので、会場でテンションをあげてCloud Nextをスタートさせたいなら、待機列なども考慮して30分前には会場に着くことを目標に行動した方が良いと思います。
AI基盤モデルの進化
ここからは特に気になったものを紹介していきます。
AI技術の中核を成す基盤モデルにおいて、Googleは Gemini を中心に顕著な進歩を示しました。
Gemini 2.5:高度な推論能力の実装
今回のKeynoteではGemini 2.5が発表されました 。このモデルは、応答を生成する前に内部で複数の思考ステップを実行する、高度な 自己推論能力 を備えています。複雑な問題解決や分析タスクにおける性能向上が期待され、デモンストレーションではその能力の高さが示されました。こちらはすでに、Gemini 2.5 ProがGeminiアプリでexperimentalとして使用が可能になっていたので、使われた方も多いのではないでしょうか?
私も最近活用していますが、今までよりもさらに精度が向上しているので、コード実装などの業務でとても助かっています。
Gemini 2.5には今後Flash版も登場予定とのことです。
こちらはこれまで同様、リアルタイム性や費用対効果が重視されるアプリケーション向けで、低レイテンシでの応答と効率的な運用コスト を両立することを目的としており、チャットボットやAPIベースの機能実装など、広範な用途での活用が見込まれます。
マルチモーダルなAI
テキスト以外のデータ形式を扱うマルチモーダルAIも大幅に強化されていることが発表されました。
-
Veo2 (動画生成):
こちらは以前からプレビューとして使用できていました。テキスト指示に基づき、高品質な動画を生成する技術が向上しています。さらに本発表で、カメラアングルの制御や、生成ビデオの部分的な修正・編集(インペイント/アウトペイント)といった高度な編集機能も実装されたと紹介されました。 -
Imagen3 (画像生成):
テキストからの画像生成モデルも進化し、今までと大きく変わる部分は、Inpainting(修復)ができるようになっている点です。画像を生成するだけではなく、追加したい背景やエフェクト、逆に背景に映り込んでしまった人物などを消したりすることが可能なようです。消しゴムマジック!
実際にブースで手書きの絵から綺麗な絵と動画が生成されました。動画生成には、上記のVeo2を使用しているとのことでした。 -
Lyria (音楽生成):
新たに、テキストから音楽クリップを生成 する機能がGoogle Cloud上で提供開始されることが発表されました。プロンプトを元に最大30秒の音楽が生成されます。Keynoteの待ち時間には、これで生成されたであろう音楽が流れていました。 -
Chirp3(会話音声生成):
こちらは、会話音声の生成ができる新しいAIモデルです。プリトレーニングの定型音声を基本に、追加トレーニングとして人物の音声を10秒程度このAIに与えると、それを基に会話の音声を生成してくれます。
これらの最新モデルは、AI開発プラットフォームである Vertex AI を通じて利用可能となる予定です。我々エンタメ業界にも多く活用できそうなAIモデルが発表・進化していることが示されました。
詳細はGoogle Cloud Next25のOpening KeynoteのYoutubeなどで確認でしていただけます。
Google WorkspaceにおけるAI機能強化
多くの組織で利用されている Google Workspace においても、AIの統合が進み、業務効率化を支援する新機能が発表されました。
Help me analyze
スプレッドシート内のデータに対し、AIが分析作業を支援する機能です。利用者は自然言語で指示を与えることで、データの洞察抽出や可視化のサポートを受けることが可能になります。
Audio overviews on Docs
ドキュメントの内容をAIが要約し、高品質な 音声で提供 する機能です。長文ドキュメントの内容把握や、移動中など視覚的な確認が困難な状況での情報アクセスを効率化することが期待できます。
Google Workspace Flows
定型的な業務プロセスを自動化するための新機能です。GWSを全社導入している会社として、現在よりもさらにメールの生成・整理や市場の調査などの程度業務効率化が図れるのかとても気になります。
その他の関連技術動向
上記以外にも、インフラストラクチャ分野では、Googleのグローバルネットワークを活用した Cloud WAN や、第7世代のカスタムAIチップ Ironwood TPU などが発表されました。また、AIが自律的にタスクを実行する AIエージェント を構築・管理するための Agent Development Kit や Google AgentSpace といった新しいツールも登場し、将来的な業務プロセスのさらなる効率化を目指す姿勢が示唆されていました。
まとめ
その他にも3日間を通して、数百ものセッションが開催されています。私はWorkshopと呼ばれるハンズオン形式のセッションを中心に回っています。
1日目にして、英語力の必要性を強く強く、強く!感じていますが、学べること感じることがとても多いので残り2日間も全力でNext2025に挑みます!
あとお昼のサンドイッチは想像よりもでかいです!お腹いっぱい!!