はじめに

この記事では、Azure、AWS、Google Cloudの3大クラウドサービスのAIサービスの新規機能リリース履歴をまとめています。

主に以下のURLの情報をもとに新機能のキャッチアップを行っています。


Azure

2025年03月05日: リクエストレベルでコンテンツフィルタリングを指定できる機能がプレビュー提供開始

デプロイメントレベルのコンテンツフィルタリング構成に加えて、APIコールごとにリクエストヘッダー(x-policy-id)を使用してカスタム構成を指定できる機能が追加されました。

curl --request POST \ 
    --url 'URL' \ 
    --header 'Content-Type: application/json' \ 
    --header 'api-key: API_KEY' \ 
    --header 'x-policy-id: CUSTOM_CONTENT_FILTER_NAME' \ 
    --data '{ 
        "messages": [ 
            { 
                "role": "system", 
                "content": "You are a creative assistant." 
            }, 
            { 
                "role": "user", 
                "content": "Write a poem about the beauty of nature." 
            } 
        ] 
    }'

リクエスト レベルのコンテンツ フィルタリング構成は、特定の API 呼び出しのデプロイメント レベルの構成を上書きします。

https://learn.microsoft.com/en-us/azure/ai-services/openai/how-to/content-filters#specify-a-content-filtering-configuration-at-request-time-preview

2025年03月05日: Provisioned spillover(プレビュー)

Provisioned spilloverはトラフィックの変動を管理する機能で、デプロイメントタイプがProvisionedのモデルのトラフィック変動を管理し、容量を超えるトラフィックを指定さたStanderd Deploymentにルーティングすることができます。

オプションとして設定可能で、全リクエストに適用することも、リクエストごとに管理することもできる。

https://learn.microsoft.com/en-us/azure/ai-services/openai/how-to/spillover-traffic-management

2025年03月25日: Responses API & computer-use-preview モデルの提供

Responses APIは、Chat Completion APIとAssistanat APIの機能を統合した新しいStateful APIです。
AIが人間のように直接コンピュータのインターフェースを操作できるようににする「computer-use-preview」モデルのサポートも追加されています。

APIサポートと利用可能なリージョン

このAPIは2025-03-01-preview以降のバージョンでサポートされ、以下のリージョンで利用可能。

  • australiaeast
  • eastus
  • eastus2
  • francecentral
  • japaneast
  • norwayeast
  • southindia
  • swedencentral
  • uaenorth
  • uksouth
  • westus
  • westus3

サポートされるモデル

  • gpt-4o(バージョン: 2024-11-20, 2024-08-06, 2024-05-13
  • gpt-4o-mini(バージョン: 2024-07-18
  • computer-use-preview

制限事項

項目 Chat Completion API Responses API(プレビュー)
✅ API名称 chat.completions.create() responses.create()
🔄 セッション保持(状態管理) なし(自分で履歴保持が必要) あり(サーバー側でセッション管理)
💻 対応モデル gpt-3.5, gpt-4, gpt-4o gpt-4o, gpt-4o-mini, computer-use
🧠 computer-use-preview 非対応 対応(必須)
🔧 Structured output サポート 非対応(今後対応予定)
🌐 Web検索 / image_url 一部可能(tool利用) 未対応
📌 使用バージョン APIバージョンに依存(2023-05-15など) 2025-03-01-preview限定

コード例:

import os
from openai import AzureOpenAI

client = AzureOpenAI(
    api_key=os.getenv("AZURE_OPENAI_API_KEY"),
    api_version="2025-03-01-preview",
    azure_endpoint=os.getenv("AZURE_OPENAI_ENDPOINT")
)

# ChatCompletionの場合はclient.chat.completions.create()
# Responnse APIはclient.responses.create()を使用する
response = client.responses.create(
    model="gpt-4o",  # デプロイメント名に置き換え
    input="This is a test."
    # `computer-use-preview`モデルを使用する場合、truncation="auto"が必要
)
  • 「computer-use-preview」モデルへのアクセスを希望する場合、登録申請が必要
  • 「computer-user-preview」モデルのユースケースについてPlaywright統合デモコードのGIFも公開されている。

Azure公式: Response API

Azure公式: Computer-user

computer-use-preview登録申請


AWS

2025年03月10日: Amazon Bedrock AgentでComputer use toolsの設定が可能に

Amazon Bedrock AgentでComputer use toolsでタスクを完了できるようになりました。

https://docs.aws.amazon.com/bedrock/latest/userguide/agents-computer-use.html

2025年03月10日: Amazon BedrockでDeepSeek-R1が使用可能に

DeepSeek-R1をAmazon Bedrockで使用できるようになりました。

https://docs.aws.amazon.com/bedrock/latest/userguide/models-supported.html

2025年03月14日: Amazon Bedrockがヨーロッパ(ミラノ)およびヨーロッパ(スペイン)でサポート

Amazon Bedrockがヨーロッパ(ミラノ)およびヨーロッパ(スペイン)でサポートされるようになりました。

https://docs.aws.amazon.com/general/latest/gr/bedrock.html#bedrock_region

以下は、日付順に時系列で並べた翻訳リスト:

2025年3月18日: Amazon Bedrockで特定のガードレールを強制できる新しいIAM条件キーが利用可能に

IAM ポリシーに bedrock:GuardrailIdentifier条件キーを含めることで、モデル推論API使用時に特定のガードレールの使用を強制することができます。

AWS公式: コンテンツフィルタリングにガードレールを使用するためのアクセス許可を設定する

2025年3月25日: Amazon Bedrock Studio -> Amazon Bedrock in SageMaker Unified Studioに名称変更

Amazon Bedrock Studioは「Amazon Bedrock in SageMaker Unified Studio」に名称変更され、SageMaker Unified Studio内で利用可能になりました。

AWS公式: Amazon Bedrock in SageMaker Unified Studio

2025年3月27日: Amazon Bedrock Flowsで、フローテンプレートが利用できるように

Amazon Bedrock Flowsでフローテンプレートが利用できるようになりました。
Amazon Bedrockリポジトリには、次のテンプレートが用意されています。

  • ナレッジベースフロー: RAG (取得拡張生成) やナレッジベースの検索と取得など、ナレッジベースを統合してクエリするフロー。
  • マルチターン会話エージェントフロー: インタラクティブルな会話を実行するフロー。
  • 条件フロー: フロー内で条件ロジックと分岐を実行するフロー。
  • ガードレールフローを使用したプロンプトノード: ガードレールを使用してプロンプトノードを保護するフロー。
  • イテレーターとコレクターフロー: 複数の入力を処理し、レスポンスを集約するフロー。
  • マルチエージェントフロー: マルチエージェントコラボレーションやタスク委任など、さまざまなエージェントベースのワークフロー。

AWS公式: テンプレートを使用して Amazon Bedrock フローを作成する


Google Cloud

2025年03月04日: Vertex AI Agent Engineが一般提供(GA)開始

Vertex AI Agent EngineがLangChain on Vertex AIからVertex AI Agent Engineに名称変更する形で、一般提供開始されました。

Vertex AI Agent Engineは、Google Cloudが提供する完全管理型のサービスで、開発者がAIエージェントを本番環境でデプロイ、管理、スケールを可能にするサービスです。

https://cloud.google.com/vertex-ai/generative-ai/docs/agent-engine/overview

2025年03月07日: gemini-embedding-exp-03-07の公開プレビュー

実験的なGeminiベースの埋め込みモデルgemini-embedding-exp-03-07が公開プレビューとしてリリースされました。

https://ai.google.dev/gemini-api/docs/models/experimental-models

2025年03月11日: Gemini 2.0 Flash fine-tuningがGA

Gemini 2.0 Flash fine-tuningが一般提供(GA)されるようになりました。

Function Callingの呼び出し精度をファインチューニングする機能が追加されています。

ファインチューニング用のデータセットは以下のようにユーザーの質問に対して、呼び出す関数を明示的に指定します。

{
  "system_instruction": {
    "role": "system",
    "parts": [
      {
        "text": "あなたは、ユーザーが最適な製品を見つけるのを手助けするアシスタントです。"
      }
    ]
  },
  "contents": [
    {
      "role": "user",
      "parts": [
        {
          "text": "アメリカでホワイトのPixel 8 Pro 128GBは在庫がありますか?"
        }
      ]
    },
    {
      "role": "model",
      "parts": [
        {
          "functionCall": {
            "name": "get_product_sku",
            "args": {
              "product_name": "Pixel 8 Pro 128GB"
            }
          }
        }
      ]
    }
  ],
  "tools": [
    {
      "functionDeclarations": [
        {
          "name": "get_product_sku",
          "description": "Google製品の在庫状況を取得します。例: Pixelスマートフォン、Pixel Watch、Google Homeなど",
          "parameters": {
            "type": "OBJECT",
            "properties": {
              "product_name": {
                "type": "STRING",
                "description": "製品名",
                "enum": [
                  "Pixel 8 Pro 128GB",
                  "Pixel 8 Pro 256GB",
                  "Pixel 8 Pro 512GB",
                  "Pixel 8 Pro 1TB"
                ]
              }
            }
          }
        },
        {
          "name": "get_store_location",
          "description": "最寄りの店舗の位置を取得します",
          "parameters": {
            "type": "OBJECT",
            "properties": {
              "location": {
                "type": "STRING",
                "description": "場所"
              }
            }
          }
        }
      ]
    }
  ]
}

https://cloud.google.com/vertex-ai/generative-ai/docs/models/tune-function-calling

2025年03月11日: Google Gen AI SDKの公開プレビュー

TypeScriptおよびJavaScript向けのGoogle Gen AI SDKが公開プレビューとしてリリースされました。

https://googleapis.github.io/js-genai

2025年03月12日: Gemini 2.0 Flashモデルの発表

画像生成および編集が可能な実験的Gemini 2.0 Flashモデルが発表されました。

https://ai.google.dev/gemini-api/docs/image-generation#gemini

2025年03月12日: Gemma 3モデルの発表

Gemma 3の一環としてAI StudioおよびGemini APIで利用可能なgemma-3-27b-itがリリースされました。

https://ai.google.dev/gemma/docs/core

2025年03月12日: APIのアップデート

YouTube URLをメディアソースとしてサポート

20MB未満のインラインビデオを含めることが可能に

https://ai.google.dev/gemini-api/docs/vision#youtube

2025年03月13日: Vertex AIでGeminiのコンテキストキャッシングが一般利用可能に

Vertex AI上でGeminiのコンテキストキャッシングが一般利用可能(GA)になりました。

https://cloud.google.com/vertex-ai/generative-ai/docs/context-cache/context-cache-overview

2025年03月14日: Vertex AIでGen AI評価サービスのJudgeモデルツールがプレビュー提供開始

Gen AI評価サービスにおいて、Judgeモデル評価とカスタマイズツールがプレビュー版で利用可能になりました。

https://cloud.google.com/vertex-ai/generative-ai/docs/models/evaluate-judge-model

2025年03月17日: Vertex AIでMistral Small 3.1 (25.03)が利用可能に

Mistral Small 3.1 (25.03)がVertex AIで利用可能となり、マルチモーダル機能と最大128,000トークンのコンテキストを提供します。

https://console.cloud.google.com/vertex-ai/publishers/mistralai/model-garden/mistral-small-2503

2025年03月20日: Vertex AIでAnthropic Claude Sonnet 3.7が一般利用可能に

AnthropicのClaude Sonnet 3.7がVertex AIで一般利用可能(GA)となり、Provision Throughputをサポートします。

https://console.cloud.google.com/vertex-ai/publishers/anthropic/model-garden/claude-3-7-sonnet

https://cloud.google.com/vertex-ai/generative-ai/docs/supported-models#partner-models

2025年03月20日: Vertex AI WorkbenchでConfidential Computingがプレビュー提供開始

Vertex AI Workbenchインスタンス作成時にConfidential VMサービスを有効化することで、データ使用中の暗号化を行うConfidential Computing機能がプレビュー版として利用可能になりました。

https://cloud.google.com/confidential-computing/docs/confidential-computing-overview

https://cloud.google.com/vertex-ai/docs/workbench/instances/create-confidential-computing

2025年03月26日: Compute Engineリソース予約がトレーニングと予測ジョブで利用可能に

GPUを搭載したVMの予約をカスタムトレーニングジョブや予測ジョブで利用可能になりました。Compute Engineゾーンリソースの予約は、必要なリソースの確保を高いレベルで保証します。

https://cloud.google.com/vertex-ai/docs/training/use-reservations

https://cloud.google.com/vertex-ai/docs/predictions/use-reservations

2025年03月26日: Vertex AI Workbenchでデータのバックアップと復元が一般利用可能に

Vertex AI Workbenchインスタンスでデータのバックアップと復元を行う機能が一般利用可能(GA)となりました。

https://cloud.google.com/vertex-ai/docs/workbench/instances/restore

2025年3月31日: Clab EnterpriseでGPU付きのデフォルトランタイムに切り替えできる機能がプレビュー提供開始

Colab Enterpriseノートブック内のボタンを使って、GPU付きのデフォルトランタイムに切り替え可能となる機能がプレビュー提供開始。

https://cloud.google.com/colab/docs/default-runtimes-with-gpus