【2025年07月】3大クラウド(Azure, AWS, Google Cloud)のAI系サービスリリースノート

はじめに

この記事では、Azure、AWS、Google Cloudの3大クラウドサービスのAIサービスの新規機能リリース履歴をまとめています。

主に以下のURLの情報をもとに新機能のキャッチアップを行っています。

Azure

2025年07月02日: GPT-image-1アップデート（プレビュー）

APIに「input_fidelity」パラメータが追加
- 元画像のスタイルや特徴をどの程度保持するかを調整可能に
- 以下のようなケースで有用
  - 顔の特徴を保持したまま写真を編集
  - 異なるスタイル間で元の人物に似せたアバター作成
  - 複数人物の顔を合成
  - マーケティングアセットや製品写真でブランドアイデンティティを維持
  - Eコマースやファッション分野でリアルさを損なわず商品画像を編集
画像生成・編集APIで部分的な画像ストリーミングに対応
- 生成途中の画像を逐次表示することでユーザーに進行状況をフィードバックできるようになった

Azure公式ドキュメント: Quickstart Guide
Azure公式ドキュメント: Azure OpenAI API Reference
Azure公式ドキュメント: Azure OpenAI Overview

AWS

2025年07月03日: Meta Llama 4 Scout 17B InstructおよびLlama 4 Maverick 17B Instructモデルでバッチ推論がサポート

Meta Llama 4 Scout 17B InstructおよびLlama 4 Maverick 17B Instructモデルでバッチ推論が利用可能になりました。

AWS公式ドキュメント: バッチ推論

2025年07月03日: AWS GovCloud（US-WestおよびUS-East）でIntelligent prompt routingがサポート

Intelligent prompt routingがAWS GovCloud（US-WestおよびUS-East）リージョンで利用可能になりました。

AWS GovCloud(US)は、米国政府機関向けに、厳格な規制を満たすために設計された、通常のAWSリージョンから隔離されたクラウド環境です。

Intelligent prompt routingは、AzureのModel Routerと同様に、プロンプトの内容に応じて適切なモデルへルーティングしてくれる機能です。

AWS公式ドキュメント: Amazon Bedrock でのインテリジェントなプロンプトルーティングについて

2025年07月07日: Amazon Bedrock APIのAPI認証キーの作成が可能に

Amazon Bedrock APIへの呼び出しを簡単に認証できるAPIキーの作成が可能になりました。

以下の2種類のAPIキーの設定が可能。

短期キー
- キーを生成するために使用するロールと同じ権限を持つAPIキー
- 有効期間はセッション中（最長12時間）
長期キー
- APIの実行に必要な基本的な権限を持つワンクリック生成のAPIキー

AWS公式ドキュメント: Amazon Bedrock API認証キー

2025年07月07日: Amazon Bedrock に新しいマネージドポリシー追加

AmazonBedrockLimitedAccess

Amazon Bedrockおよびそれに必要な関連サービスへの限定的なアクセスを提供します。

AWS公式ドキュメント: AmazonBedrockLimitedAccess

AmazonBedrockMarketplaceAccess

Amazon Bedrock Marketplaceへの限定的なアクセスと、それに必要な関連サービスを提供します。

AWS公式ドキュメント: AmazonBedrockMarketplaceAccess

2025年07月15日: TwelveLabs Pegasus 1.2とMarengo Embed 2.7がAmazon Bedrockで利用可能に

TwelveLabs(米)のTwelveLabs Pegasus 1.2とTwelveLabs Marengo Embed 2.7モデルがAmazon Bedrockで利用可能になりました。
TwelveLabsのモデルは「動画理解」に特化したマルチモーダルAIモデル。他の汎用LLMと比べて、映像情報の解析・検索に強いのが最大の特徴。

AWS公式ドキュメント: Foundation Models in Amazon Bedrock

2025年07月16日: Amazon BedrockでSageMaker AI学習済みのAmazon Novaモデルがカスタムモデルとしてインポート可能に

SageMakerでAI学習されたAmazon Novaモデルを、Amazon Bedrockにカスタムモデルとしてインポートできるようになりました。

AWS公式ドキュメント: Fine-tuning
AWS公式ドキュメント: Amazon Bedrock Features
AWS公式ドキュメント: Foundation Models in Amazon Bedrock

2025年07月16日: Amazon Bedrockでカスタムモデルのオンデマンド推論が可能に

Amazon Bedrockでカスタムモデルをオンデマンド推論としてデプロイ可能になり、プロビジョニングなしでトークン課金型の推論利用が可能になりました。

AWS公式ドキュメント: Amazon Bedrock Fine-tuning
AWS公式ドキュメント: Amazon Bedrock Runtime
AWS公式ドキュメント: Amazon Bedrock Features
AWS公式ドキュメント: Foundation Models

2025年07月28日: Amazon BedrockがUS West (N. California)リージョンで利用可能に

Amazon BedrockがUS West (N. California)リージョンで新たにサポートされました。

Amazon Bedrock Regions and Endpoints

2025年07月29日: Amazon Nova Premier推論プロファイルがBatch Inferenceで利用可能に

Batch InferenceがUS Amazon Nova Premier推論プロファイルをサポートしました。

Amazon Bedrock Runtime Amazon Bedrock Batch Foundation Models in Amazon Bedrock

Google Cloud

2025年07月02日: AnthropicのClaude Opus 4のグローバルエンドポイントが一般に利用可能

AnthropicのClaude Opus 4のグローバルエンドポイントが一般に利用可能になりました。

グローバルエンドポイントはAzure OpenAIのグローバルデプロイメントに該当する機能で使用すると、全体的な可用性が向上し、リソース枯渇（429エラー）を減らすことができます。

Google Cloud公式ドキュメント: グローバルエンドポイント

2025年07月08日: Vertex AI Agent EngineにMemory Bankが追加（プレビュー提供）

Vertex AI Agent EngineのMemory Bank機能がプレビュー版で利用可能になりました。
Vertex AI Agent Engine Memory Bankは、ユーザーとの会話から「長期記憶」を自動生成・活用し、会話のパーソナライズとセッション間の一貫性を実現するChatGPTのメモリに相当する機能です。

Memory Blank

Google Cloud公式ドキュメント: Vertex AI Agent Engine Memory Bank

2025年07月11日: Dynamic Workload Schedulerを活用したFlex-start VMがプレビュー提供開始

推論ジョブのコスト削減のため、Dynamic Workload Schedulerを使用したFlex-start VMがプレビュー提供開始されました。
短時間のワークロード向けに大幅な割引が適用されます。

モデルを稼働させる指定ができ、終了時にモデルを自動アンデプロイすることが可能
最大7日間の期間限定でモデルを稼働させることが可能
実行時間分のみ課金
アイドルタイムやデプロイ時間では課金されない

Google Cloud公式: Dynamic Workload Scheduler紹介ブログ
 Google Cloud公式: プレビュー提供について
 Google Cloud公式: Flex-start VMの推論活用方法

2025年07月14日: Multimodal MedGemma 27B IT、MedSigLIP、T5GemmaがModel Gardenで利用可能に

Vertex AI Model Gardenで新たにMultimodal MedGemma 27B IT、MedSigLIP、T5Gemmaモデルが利用可能になりました。

Multimodal MedGemma 27B IT：医療分野特化のマルチモーダル大規模モデル
MedSigLIP：医療画像理解とマルチモーダル検索特化モデル
T5Gemma：医療向けに調整された高性能テキスト生成モデル

Google Cloud公式ドキュメント: Multimodal MedGemma 27B IT
Google Cloud公式ドキュメント: MedSigLIP
Google Cloud公式ドキュメント: T5Gemma

2025年07月23日: Grounding with Google Mapsが一部地域を除き全リージョンでプレビュー提供開始

Grounding with Google Mapsが欧州経済領域（EEA）を除くすべてのリージョンでプレビュー（Pre-GA）機能として利用可能になりました。

Google Cloud公式ドキュメント: Grounding with Google Maps

2025年07月29日: Veo video generation Veo 3とVeo 3 Fastが一般提供開始

Veo video generationのVeo 3およびVeo 3 Fastが一般提供開始されました。

Google Cloud公式: Generate videos using text prompts

おわりに

この記事が、AIサービスに関する最新リリース情報の把握に役立てば幸いです。
今後も主要なアップデートがあれば随時追記していきます。
ご意見や追加情報があれば、ぜひコメントやお問い合わせフォームからお知らせください。

本サイトへのご意見、お問い合わせなどありましたらこちらからご連絡下さい。お問合せフォーム