ai

Azure SRE Agent とは?料金・機能・活用方法を解説

  • POST
はじめに Azure SRE Agent は、Azure 環境における運用業務を効率化・自動化するために登場した AI エージェントです。 従来の監視ツールやオペレーション自動化ツールとは異なり、インシデントの検知だけでなく、その原因調査や対応支援、さらにはリソース操作までを一貫して実行できる点が大きな特徴です。 本記事では、Azure SRE Agent の基本機能や料金体系、活用方法について整理し、実運用でどのように活かせるのかを解説します。 Azure SRE Agentとは Azure SRE Agent は、Azure 上のリソースに対して継続的なヘルスチェック、インシデント調査、復旧支援を行うことができるAI エージェント。 様々な種類のトリガーで起動できる (チャットベース、Webhook通知、cronによる定期実行) azコマンドを内部で実行できるのでAzure上のリソースに対する操作が可能 ハーネス機能が実装されている (Skills, サブエージェント作成、 MCP連携) メリット 多様なトリガーに対応 チャットベース Webhook通知 cronによる定期実行 Azure操作が可能 内部で az コマンドを実行できるため、Azureリソースの直接操作が可能 拡張性(ハーネス機能) Skills サブエージェント作成 MCP連携 公式情報 Microsoft公式ドキュメント Microsoft公式YouTube GitHub SREエージェント Microsoft公式ドキュメント: Azure Advisor Optimization workbook 料金体系 料金は Azure Agent Units(AAU) を基準に算出されます。

Anthropic Claudeの明示的プロンプトキャッシュ入門

  • POST
はじめに この記事では、Anthropic Claudeのプロンプトキャッシュについてまとめました。 Anthropoc Caludeとは Anthropic Claudeは、Anthropic社が開発した高度なAI言語モデルです。 このモデルは、自然言語処理タスクにおいて高い性能を発揮し、特に会話型AIやテキスト生成、分析などの用途に適しています。 Anthropic Claudeは、AWSやGoogle Cloudなどのクラウドプラットフォームを通じて利用可能であり、さまざまな業界で活用されています。 Anthropic公式サイト Anthropic Claudeのプロンプトキャッシングの仕組み プロンプトキャッシングを導入すると、指定したプロンプトをキャッシュすることができます。 キャッシュするとキャッシュブレークポイント(cache_control)が設定されているプロンプトのプレフィックス(先頭部分)が、キャッシュされているかを確認します。 キャッシュされている場合、プレフィックス部分のプロンプトを再利用することで、LLM側での内部処理が不要になり、処理時間とコストを削減することができます。 キャッシュされていない場合は、プロンプト全体を新規に処理した後に、プロンプトのプレフィックスを保存します。 この仕組みにより、繰り返し使用されるプロンプトの再処理を避け、システム全体の効率を向上させています。 OpenAIにも同様にプロンプトキャッシュが導入されています。 GoogleのGeminiシリーズにもコンテキストキャッシュという名称は異なりますが、同様の機能があります。 Anthropic: プロンプトキャッシュ Google クラウド: Claudeモデルのプロンプトキャッシュ OpenAI: プロンプトキャッシングAPI Medium: LLMのプロンプトキャッシュのメカニズム 株式会社Algomatic: テックブログ Zenn: Claude Prompt Cachingは本当に効果的なのか検証してみた キャッシュにはサービス側で自動キャッシュしてくれる暗黙的キャッシュと、ユーザーがキャッシュする箇所を指定する明示的キャッシュがあります。 この記事は明示的キャッシュについて紹介します。 プロンプトキャッシュの料金 料金 キャッシュの料金は以下の通りです。 キャッシュ書き込み: 入力トークンよりも25%高価格 キャッシュ読み取り: 入力トークンよりも90%低価格 初回に発生するキャッシュの書き込みでは、料金が上がってしまいますが、複数回LLMとの会話が行われると、キャッシュが活用されるので、その分料金が安くなります。 サポートモデル プロンプトキャッシュをサポートしているモデルは以下になります。 Claude Sonnet系は3.5以降 Claude Haikua系は3以降 Claude Opus系は3以降 プロンプトキャッシュ プロンプトキャッシュの利用方法 プロンプトキャッシュを利用するにはClaudeのAPIをコールする際にcache_controlパラメータを指定します。 cache_controlのtypeで指定できるタイプは現状はephemeralのみなので、実質固定値 ephemeralは「一瞬の~」という意味 curl <https://api.

無料音声入力「Amical」レビュー:AquaVoiceの代替として使えるか?

  • POST
はじめに 音声入力ソフトウェアとしてはAquaVoiceなど有料のものが有名ですが、 Amicalという無料の音声入力ソフトウェアが登場しました。 この記事では、音声入力ソフトウェアAmicalについて紹介します。 Amicalとは Amicalは無料のオープンソース音声入力ソフトウェアです。 OpenAIのWhisperモデルを採用しており、無料でありながら高速な音声入力が可能です。 Amical公式ソフトウェア Aqua Voiceと比較 音声入力ソフトウェアとしてはAquaVoiceが有名です。 AquaVoice公式サイト AmicalとAquaVoiceを比較すると以下の表のようになります。 項目 Amical AquaVoice Free (Starter) AquaVoice Pro 料金 無料(オープンソース) 無料(1,000語制限) note 月額8-10ドル(年払い換算8ドル) 入力制限 無制限(ローカル/クラウド) 1,000語 無制限 カスタム辞書 文脈記憶 5語まで 800語まで プラットフォーム Windows/macOS macOS/Windows macOS/Windows Amicalのインストール 公式サイトからインストーラーをダウンロードして、インストーラーを起動します。 最初にどの機能をインストールするか求められるので、以下の2つにチェックします。 Contextual Dictation Note Taking マイクへのアクセス許可を設定、continueをクリックします。

AzureでもClaude Codeを使いたい! Claude CodeでMicrosoft Foundryのモデルを使う手順

  • POST
AzureでもClaude Codeを使いたい! Claude CodeでMicrosoft Foundryのモデルを使う手順 はじめに 2025年11月のAzureのアップデートで、Microsoft Foundry(旧AI Foundry)でもAnthropic系のモデルが使用できるようになりました。 今までAzureプラットフォームでしかLLMを使用できないユーザーはClaudeモデルを使用することができませんでしたが、今回のアップデートからClaudeモデルが使用できることになります。 そこで、この記事では、Claude CodeでMicrosoft Foundryのモデルを使用する手順を紹介します。 1. Microsoft Foundryリソースのプロビジョニング Azure で Claude リソースを作成します。 Microsoft Foundryポータルに移動する 新しいリソースを作成し、リソース名をメモします。 Claude モデルのデプロイメントを作成します。 Claude Opus Claude Sonnet Claude Haiku 2. MS Foundryへのアクセス情報を取得 Claude Codeは、Microsoft Foundryでは、APIキーとEntra IDでの認証の2つの認証方法をサポートする。 自身のAzureユーザーアカウントにMicrosoft Foundryへのアクセス必要なRABCのロールが付与されている場合は、EntraIDを使用した方が、セキュアなアクセスになるので、おすすめです。 APIキー認証 エンドポイントとキーのセクションからAPIキーをコピーして控えます。 後述の環境変数の設定で、APIキーを設定します。 ANTHROPIC_FOUNDRY_API_KEY=xxx Microsoft Entra ID認証 ローカル環境でEntra IDを使用する場合は、一般的に Azure CLI を使用します。 Azure CLIをインストールして、Claude Codeの起動前に以下のコマンドを実行します。 az login 3.環境変数を設定 Claude Codeのsettings.jsonに以下を設定します。 ※Entra ID認証の場合は、ANTHROPIC_FOUNDRY_API_KEYの行は不要です。また、漏洩させないようにGit 管理しないようにしましょう。 { "companyAnnouncements": [ "Success to load ~/.

Aqua Voiceとは何か?|AI時代に必須となる音声入力ツール完全解説

  • POST
はじめに 生成AIを業務や創作に活用する際、多くの方が課題として感じておられるのは、知識量や思考力ではなく「入力速度」だと思います。 どれほど優れた着想があっても、それをテキストとしてAIに渡すまでに時間がかかれば、思考の鮮度は失われてしまいます。 その根本的な問題を、極めて地味ながら確実に解決するツールが Aqua Voice というツールです。 派手な生成機能を持つわけではありませんが、「日常的なAI支援ツール」として、近年注目を集めています。 この記事では、Aqua Voiceについて紹介します。 Aqua Voiceの概要 Aqua Voiceは、MacおよびWindowsの両方に対応した音声入力専用アプリケーションです。 以下のような既存の音声入力と比較しても、 Windows標準の音声入力 iPhoneの音声入力機能 ChatGPTに付属する音声入力 これらに比べて、誤変換が著しく少ない点が最大の特長です。 無料プランが用意されており、導入前の検証が可能 有料プランは月額約8ドルで入力無制限 ヘビーユーザーの方は「1日で元が取れる」と評されてます AquaVoice公式サイト 精度の高さとAIとの相性 Aqua Voiceは、早口で話した場合でも、ほぼ修正を不要な精度で文字起こしてくれます。 ChatGPTの入力欄に直接音声で入力 長文の背景説明や複雑な前提条件も一度で伝達可能 タイピングを介さず、十分な文脈をAIに供給できます この結果、AIの出力品質そのものが向上するという構造が成立いたします。 活用シーン1:AIへの指示・思考の検証 画像生成やリサーチ依頼の際、 背景 制約条件 意図 判断基準 これらを口頭でそのまま説明し、即座にテキスト化してプロンプトに変換できます。 思考を一切削らずにAIへ流し込める点は、従来の入力手法では得られない価値があると言えるでしょう。 活用シーン2:書籍・長文執筆 書籍や長文記事の執筆においても、Aqua Voiceは極めて高い効果を発揮いたします。 CursorやChatGPTに対して口頭で内容を説明 Aqua Voiceで即座にテキスト化 AIに構成整理・推敲を任せる ご自身の発話内容が一次原稿となるため、文章の核がぶれにくくなります。 活用シーン3:音声コーディング プログラミングにおいても、Aqua Voiceは大きな威力を発揮いたします。 CursorやGitHub Copilot、Claude Codeとの連携で、音声入力した説明を基にコード生成 コメントやドキュメントを自然な言葉で記述 特に、日本語と英語の切り替えが不要になる点は大きなPRポイントです。

2025年のAIニュース振り返り。State of AI Report 2025

  • POST
はじめに State of AI Report 2025 は、Air Street Capital により毎年発表されている、AI業界全体を俯瞰する総合レポートです。 本レポートは300ページを超える英語資料のため、本記事では特に実務・ビジネスへの影響が大きい論点のみをピックアップして整理しております。 STATE OF AI REPORT 2025 State of AI Reportは2018年から毎年発表されているAI業界総まとめレポートで、技術だけでなく産業・政治・安全性・将来予測まで広く扱っています。 このレポートはAir Street Capital [AI特化のベンチャーキャピタル]によって公開されています。 ※レポート自体は今年の秋に発表されたものなので、Gemini 3, GPT-5.1が出る前の内容になっています State of AI 余分な情報は推論精度を低下させ、モデルに「考えすぎ」を誘発し、必要トークン数を増加。21-24スライド 無関係な情報を追加するだけで、モデルの推論性能が大きく低下します。 例:「猫は一生のほとんどを寝て過ごします」という無関係な文を追加すると、数学問題の正答率が半減しました。 無関係な情報があると、モデルは余計な推論を行い、必要トークン数が増加します。 研究者はトレーニングデータ選定において、量よりも質と多様性を優先し始めている。29スライド 従来は大量のデータでモデルを強化していましたが、最近は「質の高い質問」が重要視されています。 NaturalReasoning データセット Webベースの大学院レベルの質問を使用しています。 数学や科学的推論の進展を促しています。 8B Llamaを抽出すると、大規模なWebInstruct/OpenMathInstructセットよりも効率的な精度向上が得られています。 RLポストトレーニング オックスフォードの新しい論文で、最適なトレーニング問題の自動選択を実装しました。 LILO(Learning from Important Logical Outcomes)を導入しています。 質問に対する成功のバラツキが大きい質問を優先的にトレーニングすることで、トレーニングステップを1/3に削減しました。 オープンモデルとクローズドモデルの知能差は拡大。42スライド DeepSeek R1登場後、オープンモデルの性能は向上しましたが、クローズドモデルとの差は再び拡大しています。 o3リリース以降、知能差が大幅に広がっており、クローズドモデルが圧倒的優位です。 現在のトップモデルは、GPT-5、o3、Gemini 2.

【2025年12月】3大クラウド(Azure, Google クラウド, Google クラウド)のAI系サービスリリースノート

  • POST
はじめに この記事では、Azure、Google クラウド、Google Cloudの3大クラウドサービスのAIサービスの新規機能リリース履歴をまとめています。 主に以下のURLの情報をもとに新機能のキャッチアップを行っています。 Azure公式ドキュメント: Azure OpenAI Serviceニュース Azure公式ドキュメント: Azure AI Agent Serviceニュース Github: Azure公式ドキュメント管理リポジトリ Github: Azure OpenAI APIプレビューバージョン一覧 Github: Azure OpenAI API安定版バージョン一覧 AWS公式ドキュメント: AWS Bedrockリリースノート Google Cloud公式ドキュメント: Vertex AIリリースノート Anthropic公式ドキュメント: APIバージョン一覧 Azure 2025年12月01日: GPT-image-1.5モデルが利用可能に OpenAIの最新画像生成モデルGPT-image-1.5がリリースされました。 パフォーマンス、品質、編集コントロール、顔の保持機能が向上しています。 編集モードでは、高い入力忠実度をサポートし、入力画像の一部を追加/削除しながら他の部分を保持できます。 主な機能: テキストから画像生成 画像から画像生成(編集) インペインティング 高品質な画像生成(最大1024x1536および1536x1024ピクセル)

主要LLMの料金・機能を比較「OpenAI, Anthropic Claude, Google Gemini」

  • POST
はじめに この記事ではOpenAIのGPTシリーズや、AnthropicのClaudeシリーズ、GoogleのGeminiシリーズなどの主要モデルについて比較表にまとめています。 免責事項: 本記事の料金や仕様は公開時点の情報であり、変更される可能性があります。最新情報については各サービスの公式ドキュメントをご確認ください。 提供プロパイダー 各モデルの提供団体は以下の通りです。 プロパイダー モデル 設立 国 備考 OpenAI GPT 2015年12月11日 米国 GPTは「Generative Pre-trained Transformer」の略。2017年にGoogleが発表したLLM「Transformer」がベース。事前に大量のデータで訓練されたLLMを示す。 Anthropic Claude 2021年ごろ 米国 Claudeはフランス語圏に多い名前。 数学者クロード・シャノン(Claude Shannon)など Google Gemini 1998年9月4日 米国 Geminiはラテン語で双子座を意味する。Google社内の2つの研究チームが合併したこと、Geminiの共同技術責任者がLLM開発はロケットを打ち上げる精神と同じと共鳴したことが由来。 Meta Llama 2004年2月4日 米国 Large Language Model Meta AI 料金 以下のリンクから各LLMの料金をまとめたExcelを表示できます。 LLM料金表 注記: 最新の料金情報は各公式ドキュメントでご確認ください 料金参考リンク OpenAI系モデル OpenAI公式ドキュメント: OpenAI APIの料金 Azure公式ドキュメント: Azure OpenAIの料金 Anthropic系モデル Anthropic公式ドキュメント: Anthropic APIの料金 AWS公式ドキュメント: AWS Bedrockの料金 Google Cloud公式ドキュメント: Google クラウド Vertex AIの料金 Google系モデル Google Cloud公式ドキュメント: Google クラウド Vertex AIの料金 Meta系モデル AWS公式ドキュメント: AWS Bedrockの料金 Google Cloud公式ドキュメント: Google クラウド Vertex AIの料金 Model ID参考リンク OpenAI系モデル OpenAI公式ドキュメント: モデル一覧 Azure公式ドキュメント: モデル一覧 Anthropic系モデル Anthropic公式ドキュメント: モデル一覧 AWS公式ドキュメント: AWS BedrockのAnthropicモデルID覧 Google Cloud公式ドキュメント: モデルガーデン Google系モデル Google公式ドキュメント: Vertex AIのモデル一覧 Meta系モデル AWS公式ドキュメント: AWS BedrockのAnthropicモデルID覧 Google公式ドキュメント: Vertex AIのモデル一覧 機能要件 プラットフォーム 入力 出力 機能 モデル名 Azure AWS Google クラウド テキスト 画像 音声 動画 PDF テキスト 画像 音声 日本語対応 Thinking Streaming Fuction Calling Structured outputs GPT-4o 〇 〇 〇 〇 〇 〇 〇 〇 GPT-4o-mini 〇 〇 〇 〇 〇 〇 〇 〇 GPT-4.

【2025年11月】3大クラウド(Azure, Google クラウド, Google クラウド)のAI系サービスリリースノート

  • POST
はじめに この記事では、Azure、Google クラウド、Google Cloudの3大クラウドサービスのAIサービスの新規機能リリース履歴をまとめています。 主に以下のURLの情報をもとに新機能のキャッチアップを行っています。 Azure公式ドキュメント: Azure OpenAI Serviceニュース Azure公式ドキュメント: Azure AI Agent Serviceニュース Github: Azure公式ドキュメント管理リポジトリ Github: Azure OpenAI APIプレビューバージョン一覧 Github: Azure OpenAI API安定版バージョン一覧 [Google Cloud公式ドキュメント: Google クラウド Bedrockリリースノート](https://docs.Google クラウド.amazon.com/bedrock/latest/userguide/doc-history.html) Google Cloud公式ドキュメント: Vertex AIリリースノート Anthropic公式ドキュメント: APIバージョン一覧 Azure 2025年11月18日: Anthropic ClaudeモデルがMicrosoft Foundryで利用可能に Claude Sonnet 4.5、Haiku 4.5、Opus 4.1モデルがMicrosoft Foundryでパブリックプレビューとして提供開始されました。 これにより、AzureはClaudeとGPTの両方のフロンティアモデルへのアクセスを1つのプラットフォームで提供する唯一のクラウドプロバイダーとなりました。 主な特徴: Microsoft Azure Consumption Commitment (MACC)の対象 既存のAzure契約と請求システムで利用可能(別途ベンダー承認不要) Python、TypeScript、C# SDKでアクセス可能 コード実行ツール、ウェブ検索・取得、引用、ビジョン、ツール使用、プロンプトキャッシングなど、Claude Developer Platformの各種機能をサポート 戦略的パートナーシップ:

生成系AIが正しいナレッジカットオフを答えない理由

  • POST
はじめに 生成系AI(LLM:Large Language Model)を使っていて、「あなたのナレッジカットオフは?」と聞いたときに、明らかに間違った日付を返されたことはありませんか? 例えば、Redditのユーザー報告によると、Geminiに英語で「今日の日付は?」と聞くと「2024年6月11日」と答えることがあるそうです。これは一見すると単純なバグのように見えますが、実はLLMの構造的な特性によるものです。 この記事では、AIの「ナレッジカットオフ」と「トレーニングカットオフ」の違い、そしてなぜAIが現在の日付について虚偽の報告(hallucination)をしてしまうのかを解説します。 ナレッジカットオフとトレーニングカットオフの違い まず、2つの重要な概念を理解する必要があります。 トレーニングカットオフ(Training Data Cutoff) トレーニングカットオフとは、AIモデルの学習に使用されたデータの最終日付です。例えば: あるモデルが「2025年7月までのデータ」で訓練された場合、トレーニングカットオフは2025年7月となります この範囲内のデータは、すべてモデルの学習に使用されたことを意味します ナレッジカットオフ(Reliable Knowledge Cutoff) 一方、ナレッジカットオフは、モデルの知識が最も広範で信頼できる日付を指します。 トレーニングデータに含まれていても、すべての情報が同じレベルで学習されるわけではありません モデルが最も確実に知識を持っているのは、ナレッジカットオフまでの情報です 具体例:Claude Sonnet 4.5 Anthropicの透明性レポートによると、Claude Sonnet 4.5は以下のように定義されています: トレーニングカットオフ: 2025年7月 ナレッジカットオフ: 2025年1月 つまり、7月までのデータで訓練されていますが、最も信頼できる知識は1月までということです。これは、後半のデータが学習に含まれていても、その範囲の情報はまだ十分に網羅的ではない、または検証が不十分であることを示しています。 なぜAIは今日の日付を間違えるのか システム時刻へのアクセスがない LLMは、リアルタイムのシステム時刻にアクセスできません。これが問題の根本原因です。 通常のプログラムであれば、OSのシステム時刻APIを呼び出せば現在の日付を正確に取得できます。しかし、LLMは以下の理由でこれができません: 純粋な言語モデル: LLMは入力されたテキストに基づいて次のテキストを予測するだけ 外部APIへのアクセス制限: セキュリティやアーキテクチャ上の理由で、外部システムへの直接アクセスは制限されている 学習データからの推論: 「今日は何日ですか?」という質問に対して、学習データ内のパターンから「それらしい答え」を生成してしまう トレーニングデータの模倣 LLMは、学習データ内に含まれる「今日は〇〇年△△月××日です」という記述を模倣して答えを生成します。 例えば: 学習データに「今日は2024年6月11日です」という記述が多く含まれていた場合 モデルは「今日の日付を聞かれたら、2024年6月11日と答えるのが適切」と学習してしまう可能性がある これは、モデルが意図的に嘘をついているのではなく、学習データのパターンを忠実に再現しようとした結果です。 Hallucinationのメカニズム この現象は、AIの「hallucination(幻覚、虚偽の報告)」の一種です: 学習データ内の日付の分布: 学習データ内で最も頻繁に「今日」として言及された日付 パターンの強化: 訓練中に繰り返し学習された日付が強く記憶される 現実との乖離: 実際の現在日とは無関係に、学習データのパターンを再現してしまう 実例:各AIモデルの状況 Gemini(Google) Redditの報告によると: