はじめに

この記事では、Azure、AWS、Google Cloudの3大クラウドサービスのAIサービスの新規機能リリース履歴をまとめています。

主に以下のURLの情報をもとに新機能のキャッチアップを行っています。


Azure

2025年04月05日: Azure FunctionsがMCPトリガーに対応

Azure FunctionsがMCP(Model Context Protocol)に対応したMCPトリガーが利用可能になりました。

VS Code上のGitHub CopilotなどのMCPクライアントからMCPトリガーのFunctionsをコールすることができるようになっています。

https://techcommunity.microsoft.com/blog/appsonazureblog/build-ai-agent-tools-using-remote-mcp-with-azure-functions/4401059

Microsoft公式ブログ: Azure FunctionsがMCPトリガーに対応

Zenn: MCPトリガーで現在時刻を応答するコードの例

2025年04月14日: Azure OpenAIでGPT-4.1が利用可能に

OpenAIからリリースされたGPT-4.1がAzure OpenAIでも利用可能になりました。

  • 最大100万トークン対応:従来のGPT-4o(12.8万トークン)を大幅に超える
  • 3モデル展開:「GPT‑4.1」「GPT‑4.1 mini」「GPT‑4.1 nano」
  • mini:GPT-4o超えの知能、レイテンシ半減、コスト83%減
  • nano:1Mトークン対応、MMLU 80.1%、5秒以内応答
  • ナレッジカットオフは2024年06月
Model Reasoning & Accuracy Cost & Efficiency Context Length
gpt-4.1 Highest Higher Cost 1M
gpt-4.1-mini Balanced Balanced 1M
gpt-4.1-nano Lower Lowest Cost 1M
  • eastus2とswedencentralリージョンで利用可能
Model Input Version Input Cached Input Output
gpt-4.1 gpt-4.1-2025-04-14 $2.00 $0.50 $8.00
gpt-4.1-mini gpt-4.1-mini-2025-04-14 $0.40 $0.10 $1.60
gpt-4.1-nano gpt-4.1-nano-2025-04-14 $0.10 $0.025 $0.40
gpt-4.5-preview gpt-4.5-preview-2025-02-27 $75.00 $37.50 $150.00
gpt-4o gpt-4o-2024-08-06 $2.50 $1.25 $10.00
gpt-4o-mini gpt-4o-mini-2024-07-18 $0.15 $0.075 $0.60
o3-mini o3-mini-2025-01-31 $1.10 $0.55 $4.40

2025年04月16日: Azure OpenAIでo4-miniとo3

OpenAIから提供された最新の推論モデル(reasoning models)のo4-miniとo3がAzure OpenAIでも利用可能になりました。

  • より複雑な論理的思考を必要とするタスクで高い正答率
  • レイテンシが低減
  • コスト効率も改善(o4-miniは軽量モデル)
  • ナレッジカットオフは2024年06月
Model Input Version Input Cached Input Output
gpt-4.1 gpt-4.1-2025-04-14 $2.00 $0.50 $8.00
gpt-4.1-mini gpt-4.1-mini-2025-04-14 $0.40 $0.10 $1.60
gpt-4.1-nano gpt-4.1-nano-2025-04-14 $0.10 $0.025 $0.40
gpt-4.5-preview gpt-4.5-preview-2025-02-27 $75.00 $37.50 $150.00
gpt-4o gpt-4o-2024-08-06 $2.50 $1.25 $10.00
gpt-4o-mini gpt-4o-mini-2024-07-18 $0.15 $0.075 $0.60
o3 o3-mini-2025-04-16 $10.00 $2.50 $40.00
o3-mini o3-mini-2025-01-31 $1.10 $0.55 $4.40
o4-mini o4-mini-2025-04-16 $1.10 $0.275 $4.40

AWS

2025年04月02日: AWS Bedrockでバッチ推論可能なリージョンが追加

バッチ推論が以下のモデル・リージョンに対応:

  • Anthropic Claude 3.5 Sonnet V2 → アジア太平洋(ムンバイ、ハイデラバード、シンガポール、シドニー、ソウル、大阪)

  • Amazon Titan Text Embeddings V2 → 欧州(ストックホルム、ミラノ、スペイン)

  • AWS公式: バッチ推論

2025年04月02日: Amazon Novaの各モデルがプロビジョニングスループット対応モデルに追加

プロビジョニングスループットのモデルにAmazon Novaの各モデルが新たにサポート対象として追加されました。

プロビジョニングスループットは、通常の料金がモデルが処理した入力と出力の使用量に応じた従量課金であるのに対して、スループット(モデルの入力と出力の処理性能)を事前に購入することで、利用時間に応じて課金が発生するので、使用量によらず料金を固定コストにすることができます。

プロビジョンドスループットは1時間ごとに料金が発生し、金額は使うAIの種類や性能によって変わります。

Amazon Novaは2024年12月にAmazonが発表したAI基盤モデルで、Amazon Nova Canvaは、画像生成に対応したモデルです。
Amazon Nova(Lite/Micro/Pro)の各モデルにおける24kトークンのコンテキストウィンドウにも対応しています。

2025年04月04日: AWS GovCloud (US-West)でAmazon Nova Lite、Amazon Nova Pro、Amazon Nova Microのバッチ推論がサポート開始

AWS GovCloud (US-West)リージョンでバッチ推論がAmazon Nova Lite、Amazon Nova Pro、Amazon Nova Microをサポートするようになりました。

2025年04月07日: Amazon Bedrockで有害なコンテンツ検出に関する新しいオプションが追加

Amazon Bedrockで有害コンテンツ検出後の処理オプションが新たに提供されました。

2025年04月08日: Amazon BedrockでPixtral Large (25.02)モデルが利用可能に

Amazon BedrockでPixtral Large (25.02)モデルを使用できるようになりました。

2025年04月09日: ヨーロッパ(フランクフルト)でカスタムモデルインポートがサポート

ヨーロッパ(フランクフルト)リージョンでカスタムモデルインポートがサポートされるようになりました。


Google Cloud

2025年04月09日: Vertex AIのAgent Development Kit (ADK)がプレビュー版で利用可能に

2025年04月09日: Vertex AI Agent Engineの新機能

2025年04月09日: Gemini Live APIがパブリックプレビューで利用可能に

  • 8つの音声と31言語のChirp 3サポート

  • Vertex AI Studioでの更新されたUI

  • 会話セッションウィンドウの拡張

  • 画面共有機能

  • 音声入出力の文字起こし

  • Gemini 2.0 Flash Live API.

2025年04月09日: Agent Gardenがプレビュー版で利用可能に

2025年04月09日: Gemini 2.5 Proがパブリックプレビューで利用可能に

Google Cloud公式ドキュメント: Gemini 2.5 Pro

2025年04月09日: Groundingの新機能

2025年04月10日: Vertex AIでLlama 4の新機能

2025年4月16日: Vertex AI カスタムトレーニング向けの「Persistent resources」が正式リリース(GA)

Vertex AI カスタムトレーニング向けの「Persistent resources」が正式リリース(GA)されました。

Vertex AI「Persistent resources」は、直訳すると永続リソースで、カスタムトレーニング用の長時間実行クラスタで、ジョブ終了後も**手動で削除するまで残り続けます。

Persistent resourcesを使うべき場面は、以下の通りです。

  1. 重要なMLワークロードピーク時の容量確保が必要なとき
  2. 同じジョブを繰り返し実行してキャッシュを活用したいとき
  3. 短時間のトレーニングジョブを多数実行し、起動時間を短縮したいとき

2025年04月17日: Vertex AI「Gemini 2.5 Flash」がプレビュー版で提供開始

考力などのバランスの取れた機能を持つ軽量生成AIモデルGemini Flashの最新版「Gemini 2.5 Flash」がプレビュー提供開始されました。