はじめに
この記事では、Azure、AWS、Google Cloudの3大クラウドサービスのAIサービスの新規機能リリース履歴をまとめています。
主に以下のURLの情報をもとに新機能のキャッチアップを行っています。
Azure
2025年04月05日: Azure FunctionsがMCPトリガーに対応
Azure FunctionsがMCP(Model Context Protocol)に対応したMCPトリガーが利用可能になりました。
VS Code上のGitHub CopilotなどのMCPクライアントからMCPトリガーのFunctionsをコールすることができるようになっています。
Microsoft公式ブログ: Azure FunctionsがMCPトリガーに対応
2025年04月14日: Azure OpenAIでGPT-4.1が利用可能に
OpenAIからリリースされたGPT-4.1がAzure OpenAIでも利用可能になりました。
- 最大100万トークン対応:従来のGPT-4o(12.8万トークン)を大幅に超える
- 3モデル展開:「GPT‑4.1」「GPT‑4.1 mini」「GPT‑4.1 nano」
- mini:GPT-4o超えの知能、レイテンシ半減、コスト83%減
- nano:1Mトークン対応、MMLU 80.1%、5秒以内応答
- ナレッジカットオフは2024年06月
Model | Reasoning & Accuracy | Cost & Efficiency | Context Length |
---|---|---|---|
gpt-4.1 | Highest | Higher Cost | 1M |
gpt-4.1-mini | Balanced | Balanced | 1M |
gpt-4.1-nano | Lower | Lowest Cost | 1M |
- eastus2とswedencentralリージョンで利用可能
Model | Input Version | Input | Cached Input | Output |
---|---|---|---|---|
gpt-4.1 | gpt-4.1-2025-04-14 | $2.00 | $0.50 | $8.00 |
gpt-4.1-mini | gpt-4.1-mini-2025-04-14 | $0.40 | $0.10 | $1.60 |
gpt-4.1-nano | gpt-4.1-nano-2025-04-14 | $0.10 | $0.025 | $0.40 |
gpt-4.5-preview | gpt-4.5-preview-2025-02-27 | $75.00 | $37.50 | $150.00 |
gpt-4o | gpt-4o-2024-08-06 | $2.50 | $1.25 | $10.00 |
gpt-4o-mini | gpt-4o-mini-2024-07-18 | $0.15 | $0.075 | $0.60 |
o3-mini | o3-mini-2025-01-31 | $1.10 | $0.55 | $4.40 |
2025年04月16日: Azure OpenAIでo4-miniとo3
OpenAIから提供された最新の推論モデル(reasoning models)のo4-miniとo3がAzure OpenAIでも利用可能になりました。
- より複雑な論理的思考を必要とするタスクで高い正答率
- レイテンシが低減
- コスト効率も改善(o4-miniは軽量モデル)
- ナレッジカットオフは2024年06月
Model | Input Version | Input | Cached Input | Output |
---|---|---|---|---|
gpt-4.1 | gpt-4.1-2025-04-14 | $2.00 | $0.50 | $8.00 |
gpt-4.1-mini | gpt-4.1-mini-2025-04-14 | $0.40 | $0.10 | $1.60 |
gpt-4.1-nano | gpt-4.1-nano-2025-04-14 | $0.10 | $0.025 | $0.40 |
gpt-4.5-preview | gpt-4.5-preview-2025-02-27 | $75.00 | $37.50 | $150.00 |
gpt-4o | gpt-4o-2024-08-06 | $2.50 | $1.25 | $10.00 |
gpt-4o-mini | gpt-4o-mini-2024-07-18 | $0.15 | $0.075 | $0.60 |
o3 | o3-mini-2025-04-16 | $10.00 | $2.50 | $40.00 |
o3-mini | o3-mini-2025-01-31 | $1.10 | $0.55 | $4.40 |
o4-mini | o4-mini-2025-04-16 | $1.10 | $0.275 | $4.40 |
AWS
2025年04月02日: AWS Bedrockでバッチ推論可能なリージョンが追加
バッチ推論が以下のモデル・リージョンに対応:
-
Anthropic Claude 3.5 Sonnet V2 → アジア太平洋(ムンバイ、ハイデラバード、シンガポール、シドニー、ソウル、大阪)
-
Amazon Titan Text Embeddings V2 → 欧州(ストックホルム、ミラノ、スペイン)
2025年04月02日: Amazon Novaの各モデルがプロビジョニングスループット対応モデルに追加
プロビジョニングスループットのモデルにAmazon Novaの各モデルが新たにサポート対象として追加されました。
プロビジョニングスループットは、通常の料金がモデルが処理した入力と出力の使用量に応じた従量課金であるのに対して、スループット(モデルの入力と出力の処理性能)を事前に購入することで、利用時間に応じて課金が発生するので、使用量によらず料金を固定コストにすることができます。
プロビジョンドスループットは1時間ごとに料金が発生し、金額は使うAIの種類や性能によって変わります。
Amazon Novaは2024年12月にAmazonが発表したAI基盤モデルで、Amazon Nova Canvaは、画像生成に対応したモデルです。
Amazon Nova(Lite/Micro/Pro)の各モデルにおける24kトークンのコンテキストウィンドウにも対応しています。
2025年04月04日: AWS GovCloud (US-West)でAmazon Nova Lite、Amazon Nova Pro、Amazon Nova Microのバッチ推論がサポート開始
AWS GovCloud (US-West)リージョンでバッチ推論がAmazon Nova Lite、Amazon Nova Pro、Amazon Nova Microをサポートするようになりました。
2025年04月07日: Amazon Bedrockで有害なコンテンツ検出に関する新しいオプションが追加
Amazon Bedrockで有害コンテンツ検出後の処理オプションが新たに提供されました。
2025年04月08日: Amazon BedrockでPixtral Large (25.02)モデルが利用可能に
Amazon BedrockでPixtral Large (25.02)モデルを使用できるようになりました。
2025年04月09日: ヨーロッパ(フランクフルト)でカスタムモデルインポートがサポート
ヨーロッパ(フランクフルト)リージョンでカスタムモデルインポートがサポートされるようになりました。
Google Cloud
2025年04月09日: Vertex AIのAgent Development Kit (ADK)がプレビュー版で利用可能に
2025年04月09日: Vertex AI Agent Engineの新機能
2025年04月09日: Gemini Live APIがパブリックプレビューで利用可能に
-
8つの音声と31言語のChirp 3サポート
-
Vertex AI Studioでの更新されたUI
-
会話セッションウィンドウの拡張
-
画面共有機能
-
音声入出力の文字起こし
2025年04月09日: Agent Gardenがプレビュー版で利用可能に
2025年04月09日: Gemini 2.5 Proがパブリックプレビューで利用可能に
Google Cloud公式ドキュメント: Gemini 2.5 Pro
2025年04月09日: Groundingの新機能
-
Google Mapsとの連携(パブリック実験機能)
-
Web Grounding for Enterprise(一般提供開始)
-
Google Cloud公式ドキュメント: Grounding: Web Grounding for Enterprise
2025年04月10日: Vertex AIでLlama 4の新機能
-
Llama 4 MaverickとScoutのマネージドAPIがプレビュー版で利用可能に
2025年4月16日: Vertex AI カスタムトレーニング向けの「Persistent resources」が正式リリース(GA)
Vertex AI カスタムトレーニング向けの「Persistent resources」が正式リリース(GA)されました。
Vertex AI「Persistent resources」は、直訳すると永続リソースで、カスタムトレーニング用の長時間実行クラスタで、ジョブ終了後も**手動で削除するまで残り続けます。
Persistent resourcesを使うべき場面は、以下の通りです。
- 重要なMLワークロードやピーク時の容量確保が必要なとき
- 同じジョブを繰り返し実行してキャッシュを活用したいとき
- 短時間のトレーニングジョブを多数実行し、起動時間を短縮したいとき
2025年04月17日: Vertex AI「Gemini 2.5 Flash」がプレビュー版で提供開始
考力などのバランスの取れた機能を持つ軽量生成AIモデルGemini Flashの最新版「Gemini 2.5 Flash」がプレビュー提供開始されました。