はじめに

この記事では、Azure、AWS、Google Cloudの3大クラウドサービスのAIサービスの新規機能リリース履歴をまとめています。

主に以下のURLの情報をもとに新機能のキャッチアップを行っています。


Azure


AWS

2025年05月12日: AWS BedrockのカスタムモデルにQwen2, Qwen2.5, Qwen2-VL, Qwen2.5-VLが追加

AWS BedrockのカスタムモデルにQwen2, Qwen2.5, Qwen2-VL, Qwen2.5-VLが追加されました。

Amazon Bedrock では、Amazon Bedrock カスタムモデルインポート機能を使用して、Amazon SageMaker AI など他の環境でカスタマイズしたファウンデーションモデルをインポートすることで、カスタムモデルを作成できます。

AWS公式: カスタムモデル

2025年05月12日: AWS 管理ポリシーに新しい権限「AmazonBedrockFullAccess 」が追加

AmazonBedrockFullAccessがAWS 管理ポリシーの新しい権限として追加されました。

AWS公式: AWS managed policies for Amazon Bedrock

2025年5月13日: Amazon Bedrock Guardrails がクロスリージョン推論をサポート

Amazon Bedrock Guardrails がクロスリージョン推論をサポートするようになりました。

AWS公式: Guardrailsの推論をAWSリージョンに分散させる


Google Cloud

2025年05月02日: Vertex AIのグローバルエンドポイントがGA

Vertex AI v1でグローバルエンドポイントが一般提供(GA)となりました。

グローバルエンドポイントはAzure OpenAIのグローバルデプロイメントに該当する機能で、使用すると、全体的な可用性が向上し、リソース枯渇(429エラー)を減らすことができます。
どのリージョンで処理が行われるかを制御できず、把握することもできないため。

グローバルエンドポイントは以下のモデルで対応:

  • Gemini 2.0 Flash(Live API対応)
  • Gemini 2.5 Pro
  • Gemini 2.5 Flash
  • Gemini 2.0 Flash
  • Gemini 2.0 Flash-Lite

グローバルエンドポイントの使用方法は、リソースのロケーションを global に設定します。

https://aiplatform.googleapis.com/v1/projects/test-project/locations/global/publishers/google/models/gemini-2.0-flash-001:generateContent

Google Gen AI SDKで使用する場合は、次のようにクライアントを作成します。

client = genai.Client(
    vertexai=True, project='your-project-id', location='global'
)

グローバルエンドポイント使用時に利用できない機能は以下の通り。

2025年05月05日: Vertex AIでユーザー独自データを使ったGrounding機能がGA

Vertex AIの「Grounding」は、生成AIモデルの出力を信頼できる情報源に結びつけ、回答時に出典が明記したレスポンスを生成する機能です。

以下の2種類のGroundingが可能です。

ユーザー独自データでのGroundingについての以下の機能が一般提供(GA)となりました。