はじめに
この記事では、Azure、AWS、Google Cloudの3大クラウドサービスのAIサービスの新規機能リリース履歴をまとめています。
主に以下のURLの情報をもとに新機能のキャッチアップを行っています。
Azure
AWS
2025年07月03日: Meta Llama 4 Scout 17B InstructおよびLlama 4 Maverick 17B Instructモデルでバッチ推論がサポート
Meta Llama 4 Scout 17B InstructおよびLlama 4 Maverick 17B Instructモデルでバッチ推論が利用可能になりました。
2025年07月03日: AWS GovCloud(US-WestおよびUS-East)でIntelligent prompt routingがサポート
Intelligent prompt routingがAWS GovCloud(US-WestおよびUS-East)リージョンで利用可能になりました。
AWS GovCloud(US)は、米国政府機関向けに、厳格な規制を満たすために設計された、通常のAWSリージョンから隔離されたクラウド環境です。
Intelligent prompt routingは、AzureのModel Routerと同様に、 プロンプトの内容に応じて適切なモデルへルーティングしてくれる機能です。
2025年07月07日: Amazon Bedrock APIのAPI認証キーの作成が可能に
Amazon Bedrock APIへの呼び出しを簡単に認証できるAPIキーの作成が可能になりました。
以下の2種類のAPIキーの設定が可能。
-
短期キー
- キーを生成するために使用するロールと同じ権限を持つAPIキー
- 有効期間はセッション中(最長12時間)
-
長期キー
- APIの実行に必要な基本的な権限を持つワンクリック生成のAPIキー
2025年07月07日: Amazon Bedrock に新しいマネージドポリシー追加
- AmazonBedrockLimitedAccess
Amazon Bedrockおよびそれに必要な関連サービスへの限定的なアクセスを提供します。
- AmazonBedrockMarketplaceAccess
Amazon Bedrock Marketplaceへの限定的なアクセスと、それに必要な関連サービスを提供します。
Google Cloud
2025年07月02日: AnthropicのClaude Opus 4のグローバルエンドポイントが一般に利用可能
AnthropicのClaude Opus 4のグローバルエンドポイントが一般に利用可能になりました。
グローバルエンドポイントはAzure OpenAIのグローバルデプロイメントに該当する機能で使用すると、全体的な可用性が向上し、リソース枯渇(429エラー)を減らすことができます。
2025年07月08日: Vertex AI Agent EngineにMemory Bankが追加(プレビュー提供)
Vertex AI Agent EngineのMemory Bank機能がプレビュー版で利用可能になりました。
Vertex AI Agent Engine Memory Bankは、
ユーザーとの会話から「長期記憶」を自動生成・活用し、会話のパーソナライズとセッション間の一貫性を実現するChatGPTのメモリに相当する機能です。
2025年07月11日: Dynamic Workload Schedulerを活用したFlex-start VMがプレビュー提供開始
推論ジョブのコスト削減のため、Dynamic Workload Schedulerを使用したFlex-start VMがプレビュー提供開始されました。
短時間のワークロード向けに大幅な割引が適用されます。
- モデルを稼働させる指定ができ、終了時にモデルを自動アンデプロイすることが可能
- 最大7日間の期間限定でモデルを稼働させることが可能
- 実行時間分のみ課金
- アイドルタイムやデプロイ時間では課金されない
おわりに
この記事が、AIサービスに関する最新リリース情報の把握に役立てば幸いです。
今後も主要なアップデートがあれば随時追記していきます。
ご意見や追加情報があれば、ぜひコメントやお問い合わせフォームからお知らせください。