はじめに
Azure SRE Agent は、Azure 環境における運用業務を効率化・自動化するために登場した AI エージェントです。 従来の監視ツールやオペレーション自動化ツールとは異なり、インシデントの検知だけでなく、その原因調査や対応支援、さらにはリソース操作までを一貫して実行できる点が大きな特徴です。 本記事では、Azure SRE Agent の基本機能や料金体系、活用方法について整理し、実運用でどのように活かせるのかを解説します。
Azure SRE Agentとは
Azure SRE Agent は、Azure 上のリソースに対して継続的なヘルスチェック、インシデント調査、復旧支援を行うことができるAI エージェント。
- 様々な種類のトリガーで起動できる (チャットベース、Webhook通知、cronによる定期実行)
- azコマンドを内部で実行できるのでAzure上のリソースに対する操作が可能
- ハーネス機能が実装されている (Skills, サブエージェント作成、 MCP連携)
メリット
-
多様なトリガーに対応
- チャットベース
- Webhook通知
- cronによる定期実行
-
Azure操作が可能
- 内部で
azコマンドを実行できるため、Azureリソースの直接操作が可能
- 内部で
-
拡張性(ハーネス機能)
- Skills
- サブエージェント作成
- MCP連携
公式情報
- Microsoft公式ドキュメント
- Microsoft公式YouTube
- GitHub SREエージェント
- Microsoft公式ドキュメント: Azure Advisor Optimization workbook
料金体系
料金は Azure Agent Units(AAU) を基準に算出されます。
構成
- 常時稼働フロー(固定費)
- アクティブフロー(従量課金)
常時稼働フロー(Always-on flow)
- エージェントの稼働時間に応じて発生する固定のコスト。
- AAU単価:0.10ドル
- 1エージェント:4 AAU / 時間 = 0.4ドル / 時間
日本円(1ドル150円)換算:
-
約60円 / 時間
-
約1,440円 / 日
-
約43,200円 / 月
-
24時間 * 365日分の課金を避けるには、監視が不要な時間帯はSREリソースを削除し、使用する際に再作成するといったフローが必要になる。
アクティブフロー(Active flow)
- エージェントがタスクを実行している時間に発生するコスト。AAU当たり0.10ドル。消費されるAAUは実行するタスクのトークン数と使用するモデルによって決まる。
- AAU単価:0.10ドル
- タスク実行時のみ課金
- 以下で消費量が変動
- トークン数
- 使用モデル
補足
- AAUには月間上限を設定可能
- 上限設定によりコスト制御が可能
モデル別 AAUレート(100万トークンあたり)
| Model | Input | Output | Cache read | Cache write |
|---|---|---|---|---|
| Claude Opus 4.6 | 100 AAU / $10 / ¥1,500 | 500 AAU / $50 / ¥7,500 | 10 AAU / $1 / ¥150 | 125 AAU / $12.5 / ¥1,875 |
| GPT 5.3 Codex | 35 AAU / $3.5 / ¥525 | 280 AAU / $28 / ¥4,200 | 3.5 AAU / $0.35 / ¥52.5 | 0 AAU / $0 / ¥0 |
| GPT 5.2 | 35 AAU / $3.5 / ¥525 | 280 AAU / $28 / ¥4,200 | 3.5 AAU / $0.35 / ¥52.5 | 0 AAU / $0 / ¥0 |
コスト例(簡単なタスクの実行時のコスト)
- 入力:20K
- 出力:2K
- キャッシュ読み取り:15K
- キャッシュ書き込み:5K
| Model | 合計AAU | ドル | 円 |
|---|---|---|---|
| Claude Opus 4.6 | 3.775 | $0.3775 | ¥56.63 |
| GPT 5.3 Codex | 1.3125 | $0.13125 | ¥19.69 |
| GPT 5.2 | 1.3125 | $0.13125 | ¥19.69 |
外部接続機能
- WEBページをナレッジとして使用することが可能。
- GitHub, Azure DevOpsなどと接続が可能。ソースコード解析やissueやpull requestの管理が可能
- OutlookやMicrosoft Teamsに通知が可能
トリガー
チャットベース
- ユーザーからチャットベースで指示された内容をもとに動作。
- Q&A Bot(アーキテクチャやアプリケーション仕様についてドキュメント、ソースコード、リソースの設定をもとに回答)
- Gitの操作(Issue 作成、ソース修正 & PR作成)
- ドキュメント作成(障害対応のRunbook化)
HTTPトリガー
- Azure Monitor Alerts などのインシデント管理ツールからWebhookで通知をトリガーとして動作。
- エラーログや、メトリック異常などのアラートをトリガーとして起動
- アラートの初動対応: インシデント調査、過去の対応内容から障害対応手順をアドバイス
Cron 定期タスク
- cron式で記述したスケジュールで定期的なタスクの実行が可能。SREエージェントから接続しているAzureリソースやGit、外部リソースにアクセスし、監視、調査し、レポートをTeamsに通知などが可能。
- コスト最適化:
- レポート生成 → Teams通知
UI / 管理機能
- Microsoft Foundry ライクなプレイグラウンドで各種設定がGUIで可能
機能
- メトリック管理
- 日次レポート確認
おわりに
Azure SRE Agent は、単なる監視・通知の枠を超え、運用の意思決定や実行を支援する新しいレイヤーのサービスです。 適切に設計すれば、インシデント対応の効率化や運用負荷の軽減に大きく貢献する一方で、常時稼働のコストや権限管理といった注意点も存在します。 これらを踏まえた上で、自身のシステム特性に合わせて導入・設計することで、より高度で持続可能な運用体制の構築が可能になります。 今後のクラウド運用において、SRE Agent は重要な選択肢の一つとなるでしょう。