はじめに

この記事では、Azure、AWS、Google Cloudの3大クラウドサービスのAIサービスの新規機能リリース履歴をまとめています。

主に以下のURLの情報をもとに新機能のキャッチアップを行っています。


Azure


AWS


Google Cloud

2025年05月02日: Vertex AIのグローバルエンドポイントがGA

Vertex AI v1でグローバルエンドポイントが一般提供(GA)となりました。

グローバルエンドポイントはAzure OpenAIのグローバルデプロイメントに該当する機能で、使用すると、全体的な可用性が向上し、リソース枯渇(429エラー)を減らすことができます。
どのリージョンで処理が行われるかを制御できず、把握することもできないため。

グローバルエンドポイントは以下のモデルで対応:

  • Gemini 2.0 Flash(Live API対応)
  • Gemini 2.5 Pro
  • Gemini 2.5 Flash
  • Gemini 2.0 Flash
  • Gemini 2.0 Flash-Lite

グローバルエンドポイントの使用方法は、リソースのロケーションを global に設定します。

https://aiplatform.googleapis.com/v1/projects/test-project/locations/global/publishers/google/models/gemini-2.0-flash-001:generateContent

Google Gen AI SDKで使用する場合は、次のようにクライアントを作成します。

client = genai.Client(
    vertexai=True, project='your-project-id', location='global'
)

グローバルエンドポイント使用時に利用できない機能は以下の通り。

2025年05月05日: Vertex AIでユーザー独自データを使ったGrounding機能がGA

Vertex AIの「Grounding」は、生成AIモデルの出力を信頼できる情報源に結びつけ、回答時に出典が明記したレスポンスを生成する機能です。

以下の2種類のGroundingが可能です。

ユーザー独自データでのGroundingについての以下の機能が一般提供(GA)となりました。