はじめに
この記事では、Azure、AWS、Google Cloudの3大クラウドサービスのAIサービスの新規機能リリース履歴をまとめています。
主に以下のURLの情報をもとに新機能のキャッチアップを行っています。
Azure
AWS
Google Cloud
2025年05月02日: Vertex AIのグローバルエンドポイントがGA
Vertex AI v1でグローバルエンドポイントが一般提供(GA)となりました。
グローバルエンドポイントはAzure OpenAIのグローバルデプロイメントに該当する機能で、使用すると、全体的な可用性が向上し、リソース枯渇(429エラー)を減らすことができます。
どのリージョンで処理が行われるかを制御できず、把握することもできないため。
グローバルエンドポイントは以下のモデルで対応:
- Gemini 2.0 Flash(Live API対応)
- Gemini 2.5 Pro
- Gemini 2.5 Flash
- Gemini 2.0 Flash
- Gemini 2.0 Flash-Lite
グローバルエンドポイントの使用方法は、リソースのロケーションを global
に設定します。
https://aiplatform.googleapis.com/v1/projects/test-project/locations/global/publishers/google/models/gemini-2.0-flash-001:generateContent
Google Gen AI SDKで使用する場合は、次のようにクライアントを作成します。
client = genai.Client(
vertexai=True, project='your-project-id', location='global'
)
グローバルエンドポイント使用時に利用できない機能は以下の通り。
-
チューニング(モデルの調整)
-
バッチ予測
-
コンテキストキャッシュ
-
RAG(検索拡張生成)のコーパス(ただしRAGリクエスト自体は可能)
-
プロビジョンド・スループット(固定リソース割当)
2025年05月05日: Vertex AIでユーザー独自データを使ったGrounding機能がGA
Vertex AIの「Grounding」は、生成AIモデルの出力を信頼できる情報源に結びつけ、回答時に出典が明記したレスポンスを生成する機能です。
以下の2種類のGroundingが可能です。
-
Google 検索によるGrounding
-
ユーザー独自データでのGrounding(プレビュー)
ユーザー独自データでのGroundingについての以下の機能が一般提供(GA)となりました。