はじめに

この記事では、Azure、AWS、Google Cloudの3大クラウドサービスのAIサービスの新規機能リリース履歴をまとめています。

主に以下のURLの情報をもとに新機能のキャッチアップを行っています。


Azure


AWS

2025年07月03日: Meta Llama 4 Scout 17B InstructおよびLlama 4 Maverick 17B Instructモデルでバッチ推論がサポート

Meta Llama 4 Scout 17B InstructおよびLlama 4 Maverick 17B Instructモデルでバッチ推論が利用可能になりました。

AWS公式ドキュメント: バッチ推論

2025年07月03日: AWS GovCloud(US-WestおよびUS-East)でIntelligent prompt routingがサポート

Intelligent prompt routingがAWS GovCloud(US-WestおよびUS-East)リージョンで利用可能になりました。

AWS GovCloud(US)は、米国政府機関向けに、厳格な規制を満たすために設計された、通常のAWSリージョンから隔離されたクラウド環境です。

Intelligent prompt routingは、AzureのModel Routerと同様に、 プロンプトの内容に応じて適切なモデルへルーティングしてくれる機能です。

AWS公式ドキュメント: Amazon Bedrock でのインテリジェントなプロンプトルーティングについて

2025年07月07日: Amazon Bedrock APIのAPI認証キーの作成が可能に

Amazon Bedrock APIへの呼び出しを簡単に認証できるAPIキーの作成が可能になりました。

以下の2種類のAPIキーの設定が可能。

  • 短期キー

    • キーを生成するために使用するロールと同じ権限を持つAPIキー
    • 有効期間はセッション中(最長12時間)
  • 長期キー

    • APIの実行に必要な基本的な権限を持つワンクリック生成のAPIキー

AWS公式ドキュメント: Amazon Bedrock API認証キー

2025年07月07日: Amazon Bedrock に新しいマネージドポリシー追加

  • AmazonBedrockLimitedAccess

Amazon Bedrockおよびそれに必要な関連サービスへの限定的なアクセスを提供します。

AWS公式ドキュメント: AmazonBedrockLimitedAccess

  • AmazonBedrockMarketplaceAccess

Amazon Bedrock Marketplaceへの限定的なアクセスと、それに必要な関連サービスを提供します。

AWS公式ドキュメント: AmazonBedrockMarketplaceAccess


Google Cloud

2025年07月02日: AnthropicのClaude Opus 4のグローバルエンドポイントが一般に利用可能

AnthropicのClaude Opus 4のグローバルエンドポイントが一般に利用可能になりました。

グローバルエンドポイントはAzure OpenAIのグローバルデプロイメントに該当する機能で使用すると、全体的な可用性が向上し、リソース枯渇(429エラー)を減らすことができます。

Google Cloud公式ドキュメント: グローバルエンドポイント

2025年07月08日: Vertex AI Agent EngineにMemory Bankが追加(プレビュー提供)

Vertex AI Agent EngineのMemory Bank機能がプレビュー版で利用可能になりました。
Vertex AI Agent Engine Memory Bankは、 ユーザーとの会話から「長期記憶」を自動生成・活用し、会話のパーソナライズとセッション間の一貫性を実現するChatGPTのメモリに相当する機能です。

Memory Blank

Google Cloud公式ドキュメント: Vertex AI Agent Engine Memory Bank

2025年07月11日: Dynamic Workload Schedulerを活用したFlex-start VMがプレビュー提供開始

推論ジョブのコスト削減のため、Dynamic Workload Schedulerを使用したFlex-start VMがプレビュー提供開始されました。
短時間のワークロード向けに大幅な割引が適用されます。

  • モデルを稼働させる指定ができ、終了時にモデルを自動アンデプロイすることが可能
  • 最大7日間の期間限定でモデルを稼働させることが可能
  • 実行時間分のみ課金
  • アイドルタイムやデプロイ時間では課金されない

Google Cloud公式: Dynamic Workload Scheduler紹介ブログ

Google Cloud公式: プレビュー提供について

Google Cloud公式: Flex-start VMの推論活用方法


おわりに

この記事が、AIサービスに関する最新リリース情報の把握に役立てば幸いです。
今後も主要なアップデートがあれば随時追記していきます。
ご意見や追加情報があれば、ぜひコメントやお問い合わせフォームからお知らせください。

本サイトへのご意見、お問い合わせなどありましたらこちらからご連絡下さい。 お問合せフォーム