岡山SEナビ

岡山のシステムエンジニアのためのキャリアと技術の発信サイト

ai

【2025年10月】3大クラウド(Azure, AWS, Google クラウド)のAI系サービスリリースノート

Oct 30, 2025
POST

はじめにこの記事では、Azure、AWS、Google Cloudの3大クラウドサービスのAIサービスの新規機能リリース履歴をまとめています。主に以下のURLの情報をもとに新機能のキャッチアップを行っています。 Azure公式ドキュメント: Azure OpenAI Serviceニュース Azure公式ドキュメント: Azure AI Agent Serviceニュース Github: Azure公式ドキュメント管理リポジトリ Github: Azure OpenAI APIプレビューバージョン一覧 Github: Azure OpenAI API安定版バージョン一覧 AWS公式ドキュメント: AWS Bedrockリリースノート Google Cloud公式ドキュメント: Vertex AIリリースノート Anthropic公式ドキュメント: APIバージョン一覧 Azure 2025年10月01日: Microsoftがエージェント型AIアプリ開発基盤「Microsoft Agent Framework」を発表エージェント型AIアプリを開発するためのSDKとランタイム「Microsoft Agent Framework」を発表し、パブリックプレビューを開始されました。概要：AutoGenとSemantic Kernelを統合し、エンタープライズ対応のマルチエージェント開発基盤として設計。 AutoGen＝Microsoft開発のA2A（Agent to Agent）連携用フレームワーク。 Semantic Kernel＝Microsoft開発のエージェント内部の機能・プラグイン・メモリ管理を担うフレームワーク。今後の統合計画：

Microsoft Copilot 秋の大型アップデート：12の新機能まとめ

Oct 28, 2025
POST

はじめに 2025年10月、MicrosoftはCopilotの秋の大型アップデートを発表しました。今回のアップデートでは、共同作業を強化するグループ機能や、新しいAIアシスタントMico、健康情報提供機能など、12の新機能が追加予定とのことです。本記事では、それらの新機能をわかりやすく解説します。 Microsoft Copilot 12の新機能アップデート 1. グループ機能アップデート内容最大32人までのユーザーが同時に同一のCopilotチャットセッションに参加できる機能が追加されました。 Copilotが会話の文脈を保持し、要約やタスク管理も自動的に行います。ユースケースチームブレインストーミング：マーケティングチームが新製品のキャンペーンアイデアを複数人で同時に出し合い、Copilotが提案を整理・要約いたしますプロジェクト計画立案：開発チームがスプリント計画を共同で作成し、タスクの割り振りをCopilotに支援してもらうことができます共同文書編集：複数の部署にまたがるレポート作成時に、リアルタイムで意見を交換しながら文書を完成させることが可能です 2. Imagine アップデート内容 AI生成コンテンツを共同で作成・リミックスできる空間が提供されます。ビジュアル、マーケティング資料、トレーニング素材のプロトタイプ作成に最適化されています。ユースケースマーケティング資料作成：広告チームが複数のビジュアル案をAIで生成し、チーム内で編集・改良を重ねることができます研修教材開発：人事部門が新入社員向けのトレーニング資料を視覚的に作成し、複数の講師で内容を調整できますプレゼンテーション素材：営業チームが顧客向け提案資料のビジュアルを共同で作成・改善することが可能です 3. Mico（ミコ）アップデート内容雫をモチーフにしたキャラクターのAIアシスタントが導入されました。感情表現が豊かで、Cortanaの進化版のような位置付けとなっております。現時点ではキャラクターのアニメーション表示が主な機能で、ビジネス的な用途は限定的になると思われます。ユースケースカジュアルな対話体験：ビジネス以外の場面で、よりフレンドリーなインターフェースを通じてAIと対話することができます教育現場での活用：学生や子供向けに、親しみやすいキャラクターを通じて学習支援を提供できます 4. Real Talk アップデート内容ユーザーの話し方に合わせて会話スタイルを調整し、建設的な対話や「ソクラテス式」の問題解決を支援する機能が追加されました。ソクラテス式とは、古代ギリシャの哲学者ソクラテスが用いた対話による思考法で、質問を通じて相手の考えを深掘りし、矛盾や曖昧さを明らかにすることで、より明確で論理的な理解に導く方法です。ユースケースコーチング・メンタリング：マネージャーが部下との対話スキルを向上させるための練習ツールとして活用が期待されます 5. メモリーとパーソナライズアップデート内容ユーザーの好み、目標、文脈を長期的に記憶する機能が実装されました。記憶内容は編集可能で、プライバシーにも配慮されております。ユースケース継続的なプロジェクト管理：過去の会話や決定事項を記憶し、プロジェクトの文脈を保持したまま作業を継続できますパーソナライズされた提案：ユーザーの業務スタイルや好みを学習し、より適切な提案を行うことが可能です長期目標の追跡：四半期目標や年間目標を記憶し、進捗状況に応じたアドバイスを提供いたします 6. コネクターアップデート内容 OneDrive、Outlook、Gmail、Google Drive、Googleカレンダーなどと連携し、自然言語で横断検索が可能になりました。ユースケース統合情報検索：「先月の営業会議の資料」と尋ねるだけで、複数のクラウドサービスから関連ファイルを検索できますスケジュール管理：異なるカレンダーサービスをまたいで、会議の空き時間を一括で確認することが可能ですメール・ファイル統合管理：GmailとOutlookの両方から特定のプロジェクトに関する情報を一度に取得できます 7.

【初心者向け】思い通りに画像を生成する！画像生成プロンプト作成ガイド

Oct 13, 2025
POST

はじめに以前は画像生成AI技術はなかなか思い通りの画像が生成されなかったり、日本語テキストの生成の精度が低いなどの課題がありましたが、昨今ではOpenAIやGoogleなどが提供している画像生成モデルの精度が大幅に向上し、ビジネスにおいても活用の幅が広がっています。この記事ではChatGPTやMicrosoft Copilotで画像生成AIを使って思い通りの画像を生成するためのプロンプトの書き方について説明します。 ※初心者向けのため、応用的な内容ではなく、基本的な内容になります。ビジネスにおける画像生成のユースケースビジネスにおいての画像生成系AIの活用事例として以下のようなものがあります。 1. デザイン・コンテンツ制作製品ロゴやアイコン、サムネイル画像、キャラクター、書籍表紙、UI素材などの生成。新しく生成するコンテンツに対して、AIにアイディアを提案させたい場合に使用します。例 (新製品の画像をAIに提案させる) 最先端感のある最新スペックPCのデザインを提案せよ。例 (新製品のアイコンをAIに提案させる) 新しいAIチャットサービス「Hogehoge AI」のアイコンを生成せよ 2. マーケティング・プロモーション商品画像、広告用画像、イベント告知画像などの生成。販売促進や集客目的で視覚的訴求を強化したい場合に使用します。例 (イベント告知用画像を生成系AIに作成させる) 10月開催のテックカンファレンス告知用のSNS投稿用の画像 3. 業務・資料作成支援図解、構成図、スライド背景、資料添付用画像などの生成。文章だと分かりづらい事柄を図で表現させたり、資料作成の素材を生成させたい場合に使用します。例 (図解: 生成系AIとチャットしていて分からなかったことなどを図で表現させる) 今までの会話内容をもとにLLMの概念について説明する画像を作成して例: PowerPointのスライド背景テクノロジー×イノベーションを象徴するデザインのスライド背景を生成して既存画像への編集最新の生成系AIでは既存の画像に対しての編集も可能になっており、以下のようなことができます。テロップ挿入キャッチコピーの挿入タイトルの挿入日付情報の挿入この画像にキャッチコピーを追加した画像を生成して画像の一部を別の画像と差し替え商品や人物画像の背景を変更し、商品、人物にあった背景を検証商品や人物画像を変更し、背景にあった商品、人物を検証画像内の花瓶をコーヒーカップに変更した画像を生成して画像の一部を削除商品写真の余計な影や撮影機材を削除観光地やイベント写真の通行人を消去画像内の机を削除して特に最新の画像生成AIモデルは日本語の生成精度が上がったことにより、テキスト画像の生成が期待した通りの結果が得やすくなっており、テロップ挿入などがビジネスツールとしてかなり強力になってきています。

Azure OpenAIでGPT-Image-1をPythonのopenaiライブラリから使用する方法まとめ【注意点・トークン消費検証】

Sep 24, 2025
POST

はじめに GPT-Image-1は、OpenAIが提供する最新の画像生成モデルです。この記事では、PythonのopenaiライブラリからGPT-Image-1を使用するにあたって導入から実装、料金や注意点まで体系的に整理します。 GPT-Image-1の概要 GPT-Image-1は、テキストからの画像生成や既存画像の編集を行うことができる画像生成モデルです。以下の2つの機能が提供されています。 Image Genaration (画像生成) Image Edit (画像編集) OpenAI公式: GPT-Image-1 Image Genaration (画像生成) 入力したテキストプロンプトを元に画像を生成するAPIです。 gpt-image-1ではストリーミングを設定することができ、ストリーミングを有効にすると生成途中の中間画像を生成させることができます。中間画像完成画像 Image Edit (画像編集) 既存の画像に対して、画像の編集し、新たな画像を生成することが可能です。入力したプロンプトにもとづき画像を編集 (例:背景を赤色にして、人物画像を追加して) 複数の入力画像を合成して、新たな画像を生成 (例: 2つの画像を合成して) 入力画像とともにマスク画像を指定することで、マスク画像に表示されている画像のみを編集対象にできる (例: 背景は同じまま、男性の画像を女性に変更する) マスク画像は入力画像の一部を透過したもので透明になっている部分のみが編集対象以下にImage Editでマスク画像を使って既存の画像を編集した例を示します。元画像マスク画像編集画像料金体系 Azure OpenAIでは以下の料金体系で提供されています。 GPT-5と比較すると入力テキストのトークンの料金も4倍に上がっています。 ※GPT-Image-1 Globalの料金モデル名バージョン提供状態入力テキスト料金[$/1Mトークン] 入力画像[$/1Mトークン] 出力料金[$/1Mトークン] 備考 GPT-Image-1 gpt-image-1 GA 5 10 40 GPT-5 gpt-5-2025-08-07 GA 1.

Azure AI Fondry Agenst ServiceのSDKについてまとめてみた

Jul 26, 2025
POST

はじめに 2025年05月20日からAzure AI Foundry Agent Serviceが一般提供が開始されました。この記事では、Azure AI Foundry Agent ServiceのSDKについて紹介します。 GitHub: azure-sdk-for-python Azure公式ドキュメント: azure-sdk-for-python Azure公式ドキュメント: azure-sdk-for-python: readme Azure AI Foundry Agent Serviceとは Azure AI Foundry Agent Serviceは、AI エージェントの構築・管理ができるAzureのマネージドサービスです。 Azure AI Foundry Agent Serviceは、以下のような機能を提供しています。 AI Foundry PortalやAzure AI Foundry SDKを使って、エージェントの構築、管理が可能複数のAIエージェントを組み合わせるマルチエージェントの構築が可能 A2A（Agent2Agent）、MCP（Model Context Protocol）などの業界標準プロトコルをサポートスレッドによるステートフルAPIをサポートしており、クライアントアプリ側での対話履歴の保持が不要 Azure AI Foundry Agent Service のセットアップパターン Azure AI Foundry Agent Service には、以下の2つのセットアップパターンがあります。 1. Basic setup(基本セットアップ) Agent Serviceで使用するデータをMicrosoftのマネージドリソース上に保持させる方法です。通常、AzureでRAGアーキテクチャを構築する場合、Azure AI Searchなど高額なリソースを作成する必要がありますが、Basic setupを使用すれば、リソースの用意が不要なのでコストを下げることができます。

Github Copilot チートシート

Jul 11, 2025
POST

はじめにこの記事では、Github Copilotの機能の一覧をまとめたチートシートを紹介します。 Github Copilotとは Microsoftによって開発されたAIベースのコーディングアシスタントです。 AIによるコードの自動補完やコードの提案機能を提供します。コード補完: コーディング中にAIが提案するコード補完を活用して、効率的にコーディングを進めます。ドキュメントやコメントの生成: コードに関するドキュメントやコメントをAIが自動生成してくれる機能を活用します。 IDEの拡張機能 CopilotはそれぞれのIDEに対応するGitHub Copilot拡張機能をインストールすることで、IDEで開いているファイルのコードの自動補完や、コードの提案を提供します。対応するエディタとして以下のようなものがあります。 Azure Data Studio JetBrains IDEs Vim/Neovim Visual Studio Visual Studio Code Github copilot公式ドキュメント: IDE拡張機能 GitHub Copilot Chat GitHub Copilot Chatは、コーディング関連の質問をしたり、回答を受け取ったりできるチャットインターフェイスを提供します。 Copilot Chatは、Visual Studio Codeの場合は4種類のチャット欄から利用できます。クイックチャット(画面上部に表示) インラインチャット(現在のカーソル位置に表示) チャットビュー(サイドパネルに表示) チャットエディタ(エディタのタブに表示) Copliot Chatで生成したテキストはチャット欄からコピーやインサートをすることができます。 Github Copilot公式ドキュメント Participants Visual StudioやVs Codeでは、「Participants」という機能が使えます。 GitHub Copilot Chatの「Participants」は、エディタ上で開いているファイル以外だけでなく、より幅広いコンテキストに対しての回答や操作を可能にする機能です。 Participantsはネット上では、Agentsなどとも呼ばれています。従来のCopilotは主にエディタで開いているファイルや直接関連するコードブロックに対してのみ操作や提案を行っていましたが、Participantsを使用することで、エディタで開いているファイル以外にも質問が可能になります。以下の3種類のParticipantsが用意されており、チャット欄の先頭に@から始まるコマンドを入力することで使用することができます。 @workspace : プロジェクト全体への質問、操作を行う @vscode : VS Codeの操作方法などについて質問する @terminal : ターミナルで何かをする方法について質問する Visual Studioブログ

ChatGPTのUIを整理してみた

Jul 5, 2025
POST

はじめに生成系AIを使ったチャットアプリケーションを開発するにあたって、ユーザーに対してどのようなUIを提供するのが適切か検討することが多いと思います。検討材料として本家となるOpenAIのChatGPTのUIをもとに実装することが多いので、ChatGPTのUIについて整理しました。外観 ChatGPTのアプリの外観は以下の通り。出力はストリーミングで応答されます。サポート対象ファイル原則全ファイルのアップロードが可能 UI上はアップロードファイルに制限はなく、どのファイルでもアップロード可能です。ただし、下表の通り、ファイルの種類によってはLLMから正しい回答が得られないようになっています。ドキュメント PDF ◯ Html ◯ Word ◯ PowerPoint ◯ Excel ◯ 画像 PNG ◯ JPEG ◯ WEBP ◯ GIF ◯ SVG ✕ アーカイブファイル ZIP ◯ 実行ファイル EXE ✕ ドキュメントファイル各種ドキュメントファイルのアップロードが可能です。

Vertex AI GroundingのRest API仕様の調査

Jun 8, 2025
POST

はじめにこの記事では、VertexAIのGroundingをREST API仕様についてまとめています。公式ドキュメントにはSDKを使った例は載っていたのですが、REST APIを使った例が古いAPI仕様に基づくものになっていたので、紹介します。 Groundingとは Vertex AIの「Grounding」は、生成AIモデルの出力を信頼できる情報源に結びつけ、回答時に出典が明記したレスポンスを生成する機能です。現状は、以下の2種類のGroundingが可能です。 Google 検索によるGrounding ユーザー独自データでのGrounding Google Cloud公式ドキュメント: Grounding 料金 VertexAI GroundingでGemini 2.0 Flashを使った場合の料金は以下のようになっています。 1日1500件までは無料ですが以降は1000件当たり、$35と割高 1日のリクエスト数料金（米ドル備考～1,500件無料無料枠 1,501～1,000,000件 $35 / 1,000件従量課金 1,000,001件以上要問い合わせアカウント担当者に要連絡公式ページ: Vertex AI Pricing ちなみに、AzureでGroundingをする場合も1000件当たり$35。プラン名最大コール数料金主な特徴 Grounding with Bing Search 1秒あたり150トランザクション1日あたり100万件 $35 / 1,000トランザクション - Bing Search APIを活用したグラウンディング- Azure AI Foundry Agentの知識ソースとして利用可 Grounding with Bing Custom Search 1秒あたり150トランザクション1日あたり100万件 $35 / 1,000トランザクション - カスタム検索空間を指定してグラウンディング- Azure AI Foundry Agentの知識ソースとして利用可公式ページ: Microsoft Bing Grounding API Pricing

Anthropic Claude 3.7 Sonnetの拡張思考(Extended Thiking)をPython SDKから使用

Apr 26, 2025
POST

はじめにこの記事では、Anthropic Claude 3.7 Sonnetから導入された拡張思考モードをPython SDKで実装する際のコードについて紹介します。 Anthropoc Caludeとは Anthropic Claudeは、Anthropic社が開発した高度なAI言語モデルです。このモデルは、自然言語処理タスクにおいて高い性能を発揮し、特に会話型AIやテキスト生成、分析などの用途に適しています。 Anthropic Claudeは、AWSやGoogle Cloudなどのクラウドプラットフォームを通じて利用可能であり、さまざまな業界で活用されています。 Anthropic公式サイト Anthropic Claude 3.7 Sonnetとは 2025年2月にAnthropicから提供されたClaude Sonnetシリーズの最新モデルです。 3.7 Sonnetから新たに拡張思考モード(Extended Thinking mode)が導入されています。 Anthropic公式: Claude 3.7 Sonnet 拡張思考モードとは Claude 3.7 Sonnetは2つのモードで動作します。標準モード：以前のClaudeモデルと同様に、内部の推論を表示せずに直接応答を提供拡張思考モード：最終的な回答を提供する前にClaudeの推論プロセスを表示拡張思考モードを使用した場合Reasoning model（推論モデル）として動作します。 Reasoning modelは、Chain of Thought（COT）という手法を活用することで、問題解決や質問に対して、単に答えを返すのではなく、段階的に考えながら回答を導き出すAIモデルのことです。モデルが推論の各ステップを明確に示すことができ、問題解決の過程を理解しやすくします。 Anthropic公式サイト: 拡張思考拡張思考モード使用時の注意点リクエストヘッダにのanthropic-betaフィールドにoutput-128k-2025-02-19を指定する必要があるリクエストヘッダに以下のように、output-128k-2025-02-19設定が必要です。 anthropic-beta: output-128k-2025-02-19 リクエストボディにthinkingパラメータを使用して、推論に使用するトークン予算（budget_tokens）を設定する拡張思考モード使用時は回答生成とは別に、CoTによる推論でトークンが使用されるため、推論用のトークン数の予算を設定する必要があります。 "thinking": { "type": "enabled", "budget_tokens": 32000 } 設定するトークン予算(budget_tokens)はmax_tokens以下に設定する必要がある budget_tokensに設定している値がmax_tokens(出力時の最大トークン)を超過している場合は推論だけでトークン上限に達してしまうため、budget_tokensはmax_tokens以下に設定する必要があります。

Azure OpenAIの各デプロイメントタイプ

Oct 14, 2024
POST

Azure OpenAIの各デプロイメントタイプはじめに Azure OpenAIでは、モデルをデプロイするときに5つのデプロイメントタイプを選択することができます。この記事では、Azure OpenAIのそれぞれのデプロイメントタイプについて紹介します。 Azure OpenAI のデプロイメントタイプ Azure Open AIでは、以下の5つのデプロイメントタイプが存在します。 Standard Provisioned Global Standard Global Provisioned Global Batch Azure公式ドキュメント: Azure OpenAI デプロイメントタイプ Azure公式ドキュメント: Azure Open価格 Standard Standardは、Azure OpenAIのサービス開始当初からあるデプロイメントタイプです。モデルのデプロイ時に設定したTPM(1分当たりのトークン数)を処理上限として、APIのコール時に使用したトークン数に応じて従量課金される形式になっています。データを処理するリージョンは、作成したAzure OpenAIリソースのリージョンで固定されるため、データを処理する所在地の指定があるリージョンでの利用に適しています。 Azure公式ドキュメント: Azure OpenAI デプロイメントタイプ Provisioned Provisionedは、月間または、年間通して使用するスループット(PTU: Provisioned Throughput)を事前予約することができるデプロイメントタイプ。事前にモデルの処理可能量にあたるPTUを購入することで、以下のメリットが得られます。 Azure公式ドキュメント: Azure OpenAI Provisioned Throughput 一貫したレイテンシ: レートリミットによる429エラーの発生が抑止され、応答時間が安定するコストの削減: 月間または、年間通しての利用により従量課金よりも安いコストでOpenAIを利用できるデメリットとしては、未使用時のコストの増加: 事前にPTUを購入するため、使用量が少ない場合にもコストが発生する Azure OpenAIのモデルバージョンごとに、購入できるPTUの単位や、PTU当たりの処理能力(単位時間当たりで何トークン処理できるかなど)は異なります。 PTU当たりの処理能力や、PTU当たりの料金はドキュメントに記載がないが、Azure OpenAI Studioのモデルのデプロイの画面から、プロンプトトークン、生成トークン、1分当たりのピーク時のリクエスト数から必要な推定PTUを算出と価格の確認が可能です。 Global Standard/Provisioned Globalデプロイメントは、Azure基盤側でAzure Open AIへの各リクエストを最も可用性の高いリージョンのデータセンターにルーティングすることで、通常のデプロイメントタイプよりも高い可用性を提供するデプロイメントタイプ。