はじめに
この記事では、Azure、AWS、Google Cloudの3大クラウドサービスのAIサービスの新規機能リリース履歴をまとめています。
主に以下のURLの情報をもとに新機能のキャッチアップを行っています。
Azure
2025年10月01日: Microsoftがエージェント型AIアプリ開発基盤「Microsoft Agent Framework」を発表
エージェント型AIアプリを開発するためのSDKとランタイム「Microsoft Agent Framework」を発表し、パブリックプレビューを開始されました。
-
概要:AutoGenとSemantic Kernelを統合し、エンタープライズ対応のマルチエージェント開発基盤として設計。
- AutoGen=Microsoft開発のA2A(Agent to Agent)連携用フレームワーク。
- Semantic Kernel=Microsoft開発のエージェント内部の機能・プラグイン・メモリ管理を担うフレームワーク。
-
今後の統合計画:
- Microsoft 365 Agents SDKやAzure AI Foundry Agent Serviceとのランタイム統合を予定。
-
実装:.NETおよびPython対応。MITライセンスでGitHubにてオープンソース公開。
Microsoft公式ブログ: Introducing Microsoft Agent Framework
GitHub: microsoft/agent-framework
2025年10月01日: Azure OpenAIにPII検出フィルターが追加
Azure OpenAIに個人情報(PII)検出機能が組み込まれたコンテンツフィルターが追加されました。
この機能により、LLM出力内の個人情報を自動検出・ブロックし、データプライバシーを強化できます。
2025年10月06日: Azure AI Foundryに「GPT-image-1-mini」「GPT-realtime-mini」「GPT-audio-mini」を追加
Azure AI Foundryで、画像生成・音声生成・リアルタイム音声対話に対応した軽量版モデルが導入されました。
miniシリーズは通常モデルと比べ、大幅なコスト削減が行われている。
GPT-image-1 シリーズ
| モデル名 | 入力テキスト[$/M] | 入力画像[$/M] | 出力 | ||
|---|---|---|---|---|---|
| GPT-image-1 | 5.00 | 10.00 | 40.00 | ||
| GPT-image-1-mini | 2.00 (※60%削減) | 2.50 (※75%削減) | 8.00 (※80%削減) |
GPT-realtime シリーズ
| モデル名 | 入力テキスト[$/M] | 出力テキスト[$/M] | 音声入力[$/M] | 音声出力[$/M] | 画像入力[$/M] | 画像出力[$/M] | | :—————- | —–: | —–: | | GPT-realtime | 4.00 | 16.00 | 32.00 | 64.00 | 5.00 | 0.500 | | GPT-realtime-mini | 0.60 | 2.40 | 10.00 | 20.00 | 0.80 | 0.08 |
GPT-audio シリーズ
| モデル名 | テキスト入力[$/M] | テキスト出力[$/M] | 音声入力 | 音声出力 |
|---|---|---|---|---|
| GPT-audio | 2.50 | 10 | 40.00 | 80.00 |
| GPT-audio-mini | 0.60 | 2.40 | 10.00 | 20.00 |
Unleash your creativity at scale: Azure AI Foundry’s multimodal revolution | Microsoft Azure Blog
Azure公式ドキュメント: Azure OpenAI価格表
Azure公式ドキュメント: Azure OpenAI Models Documentation
Azure公式ドキュメント: Whisper Speech-to-Text Quickstart
Azure公式ドキュメント: Real-time Audio Quickstart
Azure公式ドキュメント: image generation how-to guide
2025年10月06日: GPT-5-chat-latestの安全性の引き上げ
Azure AI Foundry の最新の GPT-5-chat-latest アップデートでは、より堅牢な安全ガードレールが導入され、GPT-5-chat-latest は精神的または感情的な苦痛につながる可能性のある対話をより効果的に認識できるようになりました。
Unleash your creativity at scale: Azure AI Foundry’s multimodal revolution | Microsoft Azure Blog
2025年10月06日: Azure AI FoundryにGPT-5-proモデルが追加
GPT-5-proはAzure AI Foundryにおけるトップクラスの推論/分析モデルです。
- 通常のGPT-5に比べて
- 入力コストが 約12倍
- 出力コストが 約60倍
- 研究・分析・大規模意思決定ワークロード向けに設計され、推論精度と安定性を最優先
- コストは高いが、Foundry上でのマルチパス推論(複数経路同時推論)により結果の信頼度が最大化される
| モデル名 | 提供状態 | 入力テキスト | 出力テキスト |
|---|---|---|---|
| GPT-5 | GA | 1.25 | 2.00 |
| GPT-5-pro | Global Standard | 15.00 | 120.00 |
Unleash your creativity at scale: Azure AI Foundry’s multimodal revolution | Microsoft Azure Blog
AWS
2025年10月02日: Cohere Embed v4がAmazon Bedrockで利用可能に
新しいモデル「Cohere Embed v4」がAmazon Bedrockで利用可能になった。
Cohereは カナダの人工知能開発の会社です。
2025年10月03日: Batch inferenceがDeepSeek V3などに対応
バッチ推論機能がDeepSeek V3.1、Qwen3 32B (dense)、Qwen3 235B A22B 2507、Qwen3-Coder-30B-A3B-Instruct、Qwen3 Coder 480B A35B Instructに対応。
2025年10月07日: 管理ポリシーの更新
Amazon BedrockのAmazonBedrockFullAccess管理ポリシーが更新され、デフォルトですべてのサーバーレス基盤モデルへのアクセスが有効になりました。
2025年10月09日: Amazon Bedrock Guardrailsのリージョン拡張
Amazon Bedrock Guardrailsが5つの追加リージョン(アジアパシフィック(バンコク)、アジアパシフィック(クアラルンプール)、アジアパシフィック(台北)、イスラエル(テルアビブ)、中東(ドバイ))で一般提供開始されました。
Amazon Bedrock Guardrails は、Azure のContents Filterに該当する機能で生成AIの入出力に対して、企業や開発者が定めたポリシーに基づいてフィルタリングや制御を行う機能です。
Amazon Bedrock Guardrails
Amazon Bedrock Runtime
Amazon Bedrock Regions and Endpoints
2025年10月15日: モデルアクセスのデフォルト有効化
モデルごとに手動でアクセス許可を有効化する必要がありましたが、適切なIAM権限があれば、すべてのAmazon Bedrock基盤モデルへのアクセスがデフォルトで有効になりました。
Amazon Bedrock Security and IAM
Amazon Bedrock Features
Foundation Models in Amazon Bedrock
2025年10月15日: Anthropic Claude Haiku 4.5の導入
Amazon BedrockでAnthropic Claude Haiku 4.5が利用可能になりました。
Claude Haiku 4.5は、Anthropicの高速・低コストモデルで、以下の特徴を持ちます。
- 最大20万トークンの長文処理と画像・PDF入力に対応。
- 上位モデルSonnet 4.5に近い性能を維持しつつ、約3分の1のコストで動作。
- 応答速度が速く、業務システムやエージェント用途に最適。
| モデル名 | Base Input Tokens | Output Tokens | Reliable knowledge cutoff | Training data cutoff |
|---|---|---|---|---|
| Claude Opus 4.1 | $15 / MTok | $75 / MTok | 2025/01 | 2025/03 |
| Claude Sonnet 4.5 | $3 / MTok | $15 / MTok | 2025/01 | 2025/07 |
| Claude Haiku 4.5 | $1 / MTok | $5 / MTok | 2025/02 | 2025/07 |
| Claude Haiku 3.5 | $0.80 / MTok | $4 / MTok | - | - |
Reliable knowledge cutoffは、モデルの知識が最も広範かつ信頼性が高いとされる日付を示します。
Training data cutoffは、モデルの学習に使用されたデータのより広範な期間を指します。
Anthropic公式ドキュメント: モデル概要 Anthorpic公式ドキュメント: モデル価格表
Anthropic公式ドキュメント: Haiku 4.5
Anthropic Claude Models
Foundation Models in Amazon Bedrock
2025年10月16日: カスタマイズモデルの再利用
ファインチューニングまたは蒸留でカスタマイズ済みのモデルを、さらなるカスタマイズモデルのベースモデルとして使用できるようになりました。
Google Cloud
2025年10月01日: Vertex AI WorkbenchでWorkforce Identity Federationが一般提供(GA)
Vertex AI WorkbenchインスタンスでWorkforce Identity Federationの利用が一般提供(GA)となりました。
外部IdPによる認証情報を使用してインスタンスを作成・管理が可能になりました。
2025年10月03日: Vertex AIにPrompt management機能を追加
Vertex AIにプロンプトとそのバージョンを管理するための機能が追加されました。
Vertex AI Studio内の機能に加え、Vertex AI SDKを通じてプロンプトの保存・バージョン管理が可能。
2025年10月06日: Vertex AI Agent Engineの価格改定(2025年11月6日より適用)
Vertex AI Agent Engine Runtimeが2025年11月6日から以下のリージョンが課金対象となります。
Singapore、Melbourne、London、Frankfurt、Netherlands
2025年10月06日: Vertex AI Agent EngineにAccess Transparencyが追加
Vertex AI Agent EngineでAccess Transparencyが利用可能になりました。
アクセスの透明性により、Google 担当者がコンテンツにアクセスするときに実行するアクションをキャプチャするログが提供されます。
これにより、Googleがシステムアクセスを行った際の可視化・監査が可能。
2025年10月07日: Colab EnterpriseでPost-startup scripts(プレビュー版)を追加
Colab Enterpriseランタイム起動後に自動実行する「Post-startup scripts」機能がプレビュー提供開始。
この機能を使うことでパッケージの追加インストールやVM設定変更などが可能。
2025年10月09日: Vertex AI Workbench M134リリース
Vertex AI Workbench v1のM134リリースで以下の更新が行われました。
- カスタムノートブックメトリクス(例: jupyterlab_kernels, docker_status)の報告不具合を修正
- Dataproc JupyterLabプラグインをv0.1.92へ更新
- Google Cloud CLIコマンド実行時、プロジェクトおよびリージョン設定が自動プリセット化
2025年10月09日: Imagen Try Onモデルが精度向上
Vertex AIのImagen仮想試着モデル「virtual-try-on-preview-08-04」が更新され、人物の体型や衣服の特徴をより正確に保持できるようになりました。
Virtual Try-On(略称: VTO)は、バーチャル試着と呼ばれ、自分の写真をもとに別の服を試着した画像を生成することで、バーチャルで服の試着ができる技術のことです。
2025年10月14日: Imagen 4プレビューモデルの廃止予定
2025年11月30日にImagen 4プレビューモデル(imagen-4.0-generate-preview-06-06、imagen-4.0-ultra-generate-preview-06-06、imagen-4.0-fast-generate-preview-06-06)が削除されます。
サービス中断を避けるため、一般提供モデル(imagen-4.0-generate-001、imagen-4.0-ultra-generate-001、imagen-4.0-fast-generate-001)への移行が必要です。
2025年10月14日: SQLセルのプレビュー機能
Colab EnterpriseノートブックでSQLクエリを直接記述、編集、実行できるSQLセル機能がプレビューで利用可能になりました。
2025年10月15日: Veo動画生成 Veo 3.1
Veo 3.1がプレビューで利用可能になり、Veo 3.1 previewとVeo 3.1 Fast previewモデルが導入されました。
テキストプロンプト、画像、最初と最後のフレーム、参照画像を使用した動画生成が可能です。
Veo 3.1 preview
Veo 3.1 Fast preview
Generate videos with Veo on Vertex AI
Generate Veo videos from text prompts
Generate Veo videos from an image
Generate Veo videos using first and last frames
Direct Veo using a reference image
Veo video generation API
2025年10月15日: Anthropic Claude Haiku 4.5が利用可能に
Model GardenでAnthropic Claude Haiku 4.5が利用可能になりました。
Claude Haiku 4.5は、Anthropicの高速・低コストモデルで、以下の特徴を持ちます。
- 最大20万トークンの長文処理と画像・PDF入力に対応。
- 上位モデルSonnet 4.5に近い性能を維持しつつ、約3分の1のコストで動作。
- 応答速度が速く、業務システムやエージェント用途に最適。
| モデル名 | Base Input Tokens | Output Tokens | Reliable knowledge cutoff | Training data cutoff |
|---|---|---|---|---|
| Claude Opus 4.1 | $15 / MTok | $75 / MTok | 2025/01 | 2025/03 |
| Claude Sonnet 4.5 | $3 / MTok | $15 / MTok | 2025/01 | 2025/07 |
| Claude Haiku 4.5 | $1 / MTok | $5 / MTok | 2025/02 | 2025/07 |
| Claude Haiku 3.5 | $0.80 / MTok | $4 / MTok | - | - |
Reliable knowledge cutoffは、モデルの知識が最も広範かつ信頼性が高いとされる日付を示します。
Training data cutoffは、モデルの学習に使用されたデータのより広範な期間を指します。
Anthropic公式ドキュメント: モデル概要 Anthorpic公式ドキュメント: モデル価格表
Anthropic公式ドキュメント: Haiku 4.5
Google Cloud公式ドキュメント: Claude Haiku 4.5
2025年10月16日: vLLM TPU
Cloud TPUハードウェア向けに最適化された大規模言語モデル用の高効率サービングフレームワークvLLM TPUがModel Gardenで利用可能になりました。
TPUは、Googleが開発した**AI専用のプロセッサ(半導体チップ)です。
機械学習やディープラーニングの処理を高速化するために設計されており、GPUよりも効率的に動作することがあります。
サービングフレームワークは学習済みモデルを実際のアプリケーションから呼び出して実行する仕組みで、 vLLM TPUはこの「サービング層」をTPUハードウェア向けに最適化したもので、より効率的にLLMを使用できるようになっている。