はじめに
この記事では、Azure、AWS、Google Cloudの3大クラウドサービスのAIサービスの新規機能リリース履歴をまとめています。
主に以下のURLの情報をもとに新機能のキャッチアップを行っています。
Azure
AWS
2025年05月12日: AWS BedrockのカスタムモデルにQwen2, Qwen2.5, Qwen2-VL, Qwen2.5-VLが追加
AWS BedrockのカスタムモデルにQwen2, Qwen2.5, Qwen2-VL, Qwen2.5-VLが追加されました。
Amazon Bedrock では、Amazon Bedrock カスタムモデルインポート機能を使用して、Amazon SageMaker AI など他の環境でカスタマイズしたファウンデーションモデルをインポートすることで、カスタムモデルを作成できます。
2025年05月12日: AWS 管理ポリシーに新しい権限「AmazonBedrockFullAccess 」が追加
AmazonBedrockFullAccessがAWS 管理ポリシーの新しい権限として追加されました。
AWS公式: AWS managed policies for Amazon Bedrock
2025年5月13日: Amazon Bedrock Guardrails がクロスリージョン推論をサポート
Amazon Bedrock Guardrails がクロスリージョン推論をサポートするようになりました。
AWS公式: Guardrailsの推論をAWSリージョンに分散させる
Google Cloud
2025年05月02日: Vertex AIのグローバルエンドポイントがGA
Vertex AI v1でグローバルエンドポイントが一般提供(GA)となりました。
グローバルエンドポイントはAzure OpenAIのグローバルデプロイメントに該当する機能で、使用すると、全体的な可用性が向上し、リソース枯渇(429エラー)を減らすことができます。
どのリージョンで処理が行われるかを制御できず、把握することもできないため。
グローバルエンドポイントは以下のモデルで対応:
- Gemini 2.0 Flash(Live API対応)
- Gemini 2.5 Pro
- Gemini 2.5 Flash
- Gemini 2.0 Flash
- Gemini 2.0 Flash-Lite
グローバルエンドポイントの使用方法は、リソースのロケーションを global
に設定します。
https://aiplatform.googleapis.com/v1/projects/test-project/locations/global/publishers/google/models/gemini-2.0-flash-001:generateContent
Google Gen AI SDKで使用する場合は、次のようにクライアントを作成します。
client = genai.Client(
vertexai=True, project='your-project-id', location='global'
)
グローバルエンドポイント使用時に利用できない機能は以下の通り。
-
チューニング(モデルの調整)
-
バッチ予測
-
コンテキストキャッシュ
-
RAG(検索拡張生成)のコーパス(ただしRAGリクエスト自体は可能)
-
プロビジョンド・スループット(固定リソース割当)
2025年05月05日: Vertex AIでユーザー独自データを使ったGrounding機能がGA
Vertex AIの「Grounding」は、生成AIモデルの出力を信頼できる情報源に結びつけ、回答時に出典が明記したレスポンスを生成する機能です。
以下の2種類のGroundingが可能です。
-
Google 検索によるGrounding
-
ユーザー独自データでのGrounding(プレビュー)
ユーザー独自データでのGroundingについての以下の機能が一般提供(GA)となりました。