はじめに
この記事では、Azure、AWS、Google Cloudの3大クラウドサービスのAIサービスの新規機能リリース履歴をまとめています。
主に以下のURLの情報をもとに新機能のキャッチアップを行っています。
Azure
2025年03月05日: リクエストレベルでコンテンツフィルタリングを指定できる機能がプレビュー提供開始
デプロイメントレベルのコンテンツフィルタリング構成に加えて、APIコールごとにリクエストヘッダー(x-policy-id
)を使用してカスタム構成を指定できる機能が追加されました。
curl --request POST \
--url 'URL' \
--header 'Content-Type: application/json' \
--header 'api-key: API_KEY' \
--header 'x-policy-id: CUSTOM_CONTENT_FILTER_NAME' \
--data '{
"messages": [
{
"role": "system",
"content": "You are a creative assistant."
},
{
"role": "user",
"content": "Write a poem about the beauty of nature."
}
]
}'
リクエスト レベルのコンテンツ フィルタリング構成は、特定の API 呼び出しのデプロイメント レベルの構成を上書きします。
2025年03月05日: Provisioned spillover(プレビュー)
Provisioned spilloverはトラフィックの変動を管理する機能で、デプロイメントタイプがProvisionedのモデルのトラフィック変動を管理し、容量を超えるトラフィックを指定さたStanderd Deploymentにルーティングすることができます。
オプションとして設定可能で、全リクエストに適用することも、リクエストごとに管理することもできる。
https://learn.microsoft.com/en-us/azure/ai-services/openai/how-to/spillover-traffic-management
2025年03月25日: Responses API & computer-use-preview モデルの提供
Responses APIは、Chat Completion APIとAssistanat APIの機能を統合した新しいStateful APIです。
AIが人間のように直接コンピュータのインターフェースを操作できるようににする「computer-use-preview」モデルのサポートも追加されています。
APIサポートと利用可能なリージョン
このAPIは2025-03-01-preview
以降のバージョンでサポートされ、以下のリージョンで利用可能。
- australiaeast
- eastus
- eastus2
- francecentral
- japaneast
- norwayeast
- southindia
- swedencentral
- uaenorth
- uksouth
- westus
- westus3
サポートされるモデル
gpt-4o
(バージョン:2024-11-20
,2024-08-06
,2024-05-13
)gpt-4o-mini
(バージョン:2024-07-18
)computer-use-preview
制限事項
項目 | Chat Completion API | Responses API(プレビュー) |
---|---|---|
✅ API名称 | chat.completions.create() |
responses.create() |
🔄 セッション保持(状態管理) | なし(自分で履歴保持が必要) | あり(サーバー側でセッション管理) |
💻 対応モデル | gpt-3.5 , gpt-4 , gpt-4o 等 |
gpt-4o , gpt-4o-mini , computer-use |
🧠 computer-use-preview |
非対応 | 対応(必須) |
🔧 Structured output | サポート | 非対応(今後対応予定) |
🌐 Web検索 / image_url | 一部可能(tool 利用) |
未対応 |
📌 使用バージョン | APIバージョンに依存(2023-05-15 など) |
2025-03-01-preview 限定 |
コード例:
import os
from openai import AzureOpenAI
client = AzureOpenAI(
api_key=os.getenv("AZURE_OPENAI_API_KEY"),
api_version="2025-03-01-preview",
azure_endpoint=os.getenv("AZURE_OPENAI_ENDPOINT")
)
# ChatCompletionの場合はclient.chat.completions.create()
# Responnse APIはclient.responses.create()を使用する
response = client.responses.create(
model="gpt-4o", # デプロイメント名に置き換え
input="This is a test."
# `computer-use-preview`モデルを使用する場合、truncation="auto"が必要
)
- 「computer-use-preview」モデルへのアクセスを希望する場合、登録申請が必要
- 「computer-user-preview」モデルのユースケースについてPlaywright統合デモコードのGIFも公開されている。
AWS
2025年03月10日: Amazon Bedrock AgentでComputer use toolsの設定が可能に
Amazon Bedrock AgentでComputer use toolsでタスクを完了できるようになりました。
https://docs.aws.amazon.com/bedrock/latest/userguide/agents-computer-use.html
2025年03月10日: Amazon BedrockでDeepSeek-R1が使用可能に
DeepSeek-R1をAmazon Bedrockで使用できるようになりました。
https://docs.aws.amazon.com/bedrock/latest/userguide/models-supported.html
2025年03月14日: Amazon Bedrockがヨーロッパ(ミラノ)およびヨーロッパ(スペイン)でサポート
Amazon Bedrockがヨーロッパ(ミラノ)およびヨーロッパ(スペイン)でサポートされるようになりました。
https://docs.aws.amazon.com/general/latest/gr/bedrock.html#bedrock_region
以下は、日付順に時系列で並べた翻訳リスト:
2025年3月18日: Amazon Bedrockで特定のガードレールを強制できる新しいIAM条件キーが利用可能に
IAM ポリシーに bedrock:GuardrailIdentifier条件キーを含めることで、モデル推論API使用時に特定のガードレールの使用を強制することができます。
AWS公式: コンテンツフィルタリングにガードレールを使用するためのアクセス許可を設定する
2025年3月25日: Amazon Bedrock Studio -> Amazon Bedrock in SageMaker Unified Studioに名称変更
Amazon Bedrock Studioは「Amazon Bedrock in SageMaker Unified Studio」に名称変更され、SageMaker Unified Studio内で利用可能になりました。
AWS公式: Amazon Bedrock in SageMaker Unified Studio
2025年3月27日: Amazon Bedrock Flowsで、フローテンプレートが利用できるように
Amazon Bedrock Flowsでフローテンプレートが利用できるようになりました。
Amazon Bedrockリポジトリには、次のテンプレートが用意されています。
- ナレッジベースフロー: RAG (取得拡張生成) やナレッジベースの検索と取得など、ナレッジベースを統合してクエリするフロー。
- マルチターン会話エージェントフロー: インタラクティブルな会話を実行するフロー。
- 条件フロー: フロー内で条件ロジックと分岐を実行するフロー。
- ガードレールフローを使用したプロンプトノード: ガードレールを使用してプロンプトノードを保護するフロー。
- イテレーターとコレクターフロー: 複数の入力を処理し、レスポンスを集約するフロー。
- マルチエージェントフロー: マルチエージェントコラボレーションやタスク委任など、さまざまなエージェントベースのワークフロー。
AWS公式: テンプレートを使用して Amazon Bedrock フローを作成する
Google Cloud
2025年03月04日: Vertex AI Agent Engineが一般提供(GA)開始
Vertex AI Agent EngineがLangChain on Vertex AIからVertex AI Agent Engineに名称変更する形で、一般提供開始されました。
Vertex AI Agent Engineは、Google Cloudが提供する完全管理型のサービスで、開発者がAIエージェントを本番環境でデプロイ、管理、スケールを可能にするサービスです。
https://cloud.google.com/vertex-ai/generative-ai/docs/agent-engine/overview
2025年03月07日: gemini-embedding-exp-03-07の公開プレビュー
実験的なGeminiベースの埋め込みモデルgemini-embedding-exp-03-07が公開プレビューとしてリリースされました。
https://ai.google.dev/gemini-api/docs/models/experimental-models
2025年03月11日: Gemini 2.0 Flash fine-tuningがGA
Gemini 2.0 Flash fine-tuningが一般提供(GA)されるようになりました。
Function Callingの呼び出し精度をファインチューニングする機能が追加されています。
ファインチューニング用のデータセットは以下のようにユーザーの質問に対して、呼び出す関数を明示的に指定します。
{
"system_instruction": {
"role": "system",
"parts": [
{
"text": "あなたは、ユーザーが最適な製品を見つけるのを手助けするアシスタントです。"
}
]
},
"contents": [
{
"role": "user",
"parts": [
{
"text": "アメリカでホワイトのPixel 8 Pro 128GBは在庫がありますか?"
}
]
},
{
"role": "model",
"parts": [
{
"functionCall": {
"name": "get_product_sku",
"args": {
"product_name": "Pixel 8 Pro 128GB"
}
}
}
]
}
],
"tools": [
{
"functionDeclarations": [
{
"name": "get_product_sku",
"description": "Google製品の在庫状況を取得します。例: Pixelスマートフォン、Pixel Watch、Google Homeなど",
"parameters": {
"type": "OBJECT",
"properties": {
"product_name": {
"type": "STRING",
"description": "製品名",
"enum": [
"Pixel 8 Pro 128GB",
"Pixel 8 Pro 256GB",
"Pixel 8 Pro 512GB",
"Pixel 8 Pro 1TB"
]
}
}
}
},
{
"name": "get_store_location",
"description": "最寄りの店舗の位置を取得します",
"parameters": {
"type": "OBJECT",
"properties": {
"location": {
"type": "STRING",
"description": "場所"
}
}
}
}
]
}
]
}
https://cloud.google.com/vertex-ai/generative-ai/docs/models/tune-function-calling
2025年03月11日: Google Gen AI SDKの公開プレビュー
TypeScriptおよびJavaScript向けのGoogle Gen AI SDKが公開プレビューとしてリリースされました。
https://googleapis.github.io/js-genai
2025年03月12日: Gemini 2.0 Flashモデルの発表
画像生成および編集が可能な実験的Gemini 2.0 Flashモデルが発表されました。
https://ai.google.dev/gemini-api/docs/image-generation#gemini
2025年03月12日: Gemma 3モデルの発表
Gemma 3の一環としてAI StudioおよびGemini APIで利用可能なgemma-3-27b-itがリリースされました。
https://ai.google.dev/gemma/docs/core
2025年03月12日: APIのアップデート
YouTube URLをメディアソースとしてサポート
20MB未満のインラインビデオを含めることが可能に
https://ai.google.dev/gemini-api/docs/vision#youtube
2025年03月13日: Vertex AIでGeminiのコンテキストキャッシングが一般利用可能に
Vertex AI上でGeminiのコンテキストキャッシングが一般利用可能(GA)になりました。
https://cloud.google.com/vertex-ai/generative-ai/docs/context-cache/context-cache-overview
2025年03月14日: Vertex AIでGen AI評価サービスのJudgeモデルツールがプレビュー提供開始
Gen AI評価サービスにおいて、Judgeモデル評価とカスタマイズツールがプレビュー版で利用可能になりました。
https://cloud.google.com/vertex-ai/generative-ai/docs/models/evaluate-judge-model
2025年03月17日: Vertex AIでMistral Small 3.1 (25.03)が利用可能に
Mistral Small 3.1 (25.03)がVertex AIで利用可能となり、マルチモーダル機能と最大128,000トークンのコンテキストを提供します。
https://console.cloud.google.com/vertex-ai/publishers/mistralai/model-garden/mistral-small-2503
2025年03月20日: Vertex AIでAnthropic Claude Sonnet 3.7が一般利用可能に
AnthropicのClaude Sonnet 3.7がVertex AIで一般利用可能(GA)となり、Provision Throughputをサポートします。
https://console.cloud.google.com/vertex-ai/publishers/anthropic/model-garden/claude-3-7-sonnet
https://cloud.google.com/vertex-ai/generative-ai/docs/supported-models#partner-models
2025年03月20日: Vertex AI WorkbenchでConfidential Computingがプレビュー提供開始
Vertex AI Workbenchインスタンス作成時にConfidential VMサービスを有効化することで、データ使用中の暗号化を行うConfidential Computing機能がプレビュー版として利用可能になりました。
https://cloud.google.com/confidential-computing/docs/confidential-computing-overview
https://cloud.google.com/vertex-ai/docs/workbench/instances/create-confidential-computing
2025年03月26日: Compute Engineリソース予約がトレーニングと予測ジョブで利用可能に
GPUを搭載したVMの予約をカスタムトレーニングジョブや予測ジョブで利用可能になりました。Compute Engineゾーンリソースの予約は、必要なリソースの確保を高いレベルで保証します。
https://cloud.google.com/vertex-ai/docs/training/use-reservations
https://cloud.google.com/vertex-ai/docs/predictions/use-reservations
2025年03月26日: Vertex AI Workbenchでデータのバックアップと復元が一般利用可能に
Vertex AI Workbenchインスタンスでデータのバックアップと復元を行う機能が一般利用可能(GA)となりました。
https://cloud.google.com/vertex-ai/docs/workbench/instances/restore
2025年3月31日: Clab EnterpriseでGPU付きのデフォルトランタイムに切り替えできる機能がプレビュー提供開始
Colab Enterpriseノートブック内のボタンを使って、GPU付きのデフォルトランタイムに切り替え可能となる機能がプレビュー提供開始。
https://cloud.google.com/colab/docs/default-runtimes-with-gpus