ai

Claude Code入門 - CLI型AIコーディングツールの使い方

  • POST
はじめに 本記事では、Claude Codeについてご紹介いたします。 近年、AIによるコーディング支援は急速に発展しており、Anthropic社が提供するClaude Codeはその最前線に位置しています。 従来の「エディタ連携型(VS Code拡張など)」とは異なり、CLI(Command Line Interface)ベースで動作する点が大きな特徴です。 Claude Codeとは Claude Codeは、2025年5月22日にAnthropic社から提供されたCLI型のAIコーディングツールです。 ターミナル上で自然言語を入力すると、AIがコードベースを解析し、以下のような操作をサポートします。 新機能の実装 バグ修正 リファクタリング マルチファイル編集 👉 公式ドキュメント: https://docs.anthropic.com/en/docs/claude-code/overview Claude CodeがCLIで提供されている理由 IDE依存の回避 開発者によって使用するIDE(VS Code、Xcode、Vimなど)は異なります。 すべてのIDEにAI機能を実装することは現実的ではないため、CLI形式にすることで全ての環境で共通利用を可能にしています。 進化スピードへの柔軟な対応 GUIベースの開発支援ツールはアップデートに時間がかかる傾向があります。 モデルの進化に追随しやすいCLI形式を採用することで、俊敏な更新や適応が可能となっています。 将来的にはIDE自体が不要となる可能性も見据えています。 Claude Codeが注目される背景 CLIのメリット 環境依存がないため、OSやエディタを問わず使用可能 コマンドラインベースのため、GUIよりも軽量で動作が高速 Claude Codeをインストール 以下のサイトをもとに各OSに応じてインストールします。 https://docs.claude.com/ja/docs/claude-code/setup 自身のプロジェクトのルートに移動します。 cd your-project-directory .claude/settings.json を作成します。 Google CloudeのVertex AIを使用する場合は以下を設定。 hooksの設定はClaude Codeがタスクを完了したときに通知を送信する設定です。 { "env": { "CLAUDE_CODE_USE_VERTEX": 1, "CLOUD_ML_REGION": "使用するリージョン", "ANTHROPIC_VERTEX_PROJECT_ID": "<GCPのプロジェクト名>", "ANTHROPIC_MODEL": "使用するモデル名", "ANTHROPIC_SMALL_FAST_MODEL": "使用するモデル名" }, "hooks": { "Stop": [ { "matcher": "", "hooks": [ { "type": "command", "command": "powershell.

生成系AIが正しいナレッジカットオフを答えない理由

  • POST
はじめに 生成系AI(LLM:Large Language Model)を使っていて、「あなたのナレッジカットオフは?」と聞いたときに、明らかに間違った日付を返されたことはありませんか? 例えば、Redditのユーザー報告によると、Geminiに英語で「今日の日付は?」と聞くと「2024年6月11日」と答えることがあるそうです。これは一見すると単純なバグのように見えますが、実はLLMの構造的な特性によるものです。 この記事では、AIの「ナレッジカットオフ」と「トレーニングカットオフ」の違い、そしてなぜAIが現在の日付について虚偽の報告(hallucination)をしてしまうのかを解説します。 ナレッジカットオフとトレーニングカットオフの違い まず、2つの重要な概念を理解する必要があります。 トレーニングカットオフ(Training Data Cutoff) トレーニングカットオフとは、AIモデルの学習に使用されたデータの最終日付です。例えば: あるモデルが「2025年7月までのデータ」で訓練された場合、トレーニングカットオフは2025年7月となります この範囲内のデータは、すべてモデルの学習に使用されたことを意味します ナレッジカットオフ(Reliable Knowledge Cutoff) 一方、ナレッジカットオフは、モデルの知識が最も広範で信頼できる日付を指します。 トレーニングデータに含まれていても、すべての情報が同じレベルで学習されるわけではありません モデルが最も確実に知識を持っているのは、ナレッジカットオフまでの情報です 具体例:Claude Sonnet 4.5 Anthropicの透明性レポートによると、Claude Sonnet 4.5は以下のように定義されています: トレーニングカットオフ: 2025年7月 ナレッジカットオフ: 2025年1月 つまり、7月までのデータで訓練されていますが、最も信頼できる知識は1月までということです。これは、後半のデータが学習に含まれていても、その範囲の情報はまだ十分に網羅的ではない、または検証が不十分であることを示しています。 なぜAIは今日の日付を間違えるのか システム時刻へのアクセスがない LLMは、リアルタイムのシステム時刻にアクセスできません。これが問題の根本原因です。 通常のプログラムであれば、OSのシステム時刻APIを呼び出せば現在の日付を正確に取得できます。しかし、LLMは以下の理由でこれができません: 純粋な言語モデル: LLMは入力されたテキストに基づいて次のテキストを予測するだけ 外部APIへのアクセス制限: セキュリティやアーキテクチャ上の理由で、外部システムへの直接アクセスは制限されている 学習データからの推論: 「今日は何日ですか?」という質問に対して、学習データ内のパターンから「それらしい答え」を生成してしまう トレーニングデータの模倣 LLMは、学習データ内に含まれる「今日は〇〇年△△月××日です」という記述を模倣して答えを生成します。 例えば: 学習データに「今日は2024年6月11日です」という記述が多く含まれていた場合 モデルは「今日の日付を聞かれたら、2024年6月11日と答えるのが適切」と学習してしまう可能性がある これは、モデルが意図的に嘘をついているのではなく、学習データのパターンを忠実に再現しようとした結果です。 Hallucinationのメカニズム この現象は、AIの「hallucination(幻覚、虚偽の報告)」の一種です: 学習データ内の日付の分布: 学習データ内で最も頻繁に「今日」として言及された日付 パターンの強化: 訓練中に繰り返し学習された日付が強く記憶される 現実との乖離: 実際の現在日とは無関係に、学習データのパターンを再現してしまう 実例:各AIモデルの状況 Gemini(Google) Redditの報告によると:

【2025年10月】3大クラウド(Azure, AWS, Google Cloud)のAI系サービスリリースノート

  • POST
はじめに この記事では、Azure、AWS、Google Cloudの3大クラウドサービスのAIサービスの新規機能リリース履歴をまとめています。 主に以下のURLの情報をもとに新機能のキャッチアップを行っています。 Azure公式ドキュメント: Azure OpenAI Serviceニュース Azure公式ドキュメント: Azure AI Agent Serviceニュース Github: Azure公式ドキュメント管理リポジトリ Github: Azure OpenAI APIプレビューバージョン一覧 Github: Azure OpenAI API安定版バージョン一覧 AWS公式ドキュメント: AWS Bedrockリリースノート Google Cloud公式ドキュメント: Vertex AIリリースノート Anthropic公式ドキュメント: APIバージョン一覧 Azure 2025年10月01日: Microsoftがエージェント型AIアプリ開発基盤「Microsoft Agent Framework」を発表 エージェント型AIアプリを開発するためのSDKとランタイム「Microsoft Agent Framework」を発表し、パブリックプレビューを開始されました。 概要:AutoGenとSemantic Kernelを統合し、エンタープライズ対応のマルチエージェント開発基盤として設計。 AutoGen=Microsoft開発のA2A(Agent to Agent)連携用フレームワーク。 Semantic Kernel=Microsoft開発のエージェント内部の機能・プラグイン・メモリ管理を担うフレームワーク。 今後の統合計画:

Microsoft Copilot 秋の大型アップデート:12の新機能まとめ

  • POST
はじめに 2025年10月、MicrosoftはCopilotの秋の大型アップデートを発表しました。 今回のアップデートでは、共同作業を強化するグループ機能や、新しいAIアシスタントMico、健康情報提供機能など、12の新機能が追加予定とのことです。 本記事では、それらの新機能をわかりやすく解説します。 Microsoft Copilot 12の新機能アップデート 1. グループ機能 アップデート内容 最大32人までのユーザーが同時に同一のCopilotチャットセッションに参加できる機能が追加されました。 Copilotが会話の文脈を保持し、要約やタスク管理も自動的に行います。 ユースケース チームブレインストーミング:マーケティングチームが新製品のキャンペーンアイデアを複数人で同時に出し合い、Copilotが提案を整理・要約いたします プロジェクト計画立案:開発チームがスプリント計画を共同で作成し、タスクの割り振りをCopilotに支援してもらうことができます 共同文書編集:複数の部署にまたがるレポート作成時に、リアルタイムで意見を交換しながら文書を完成させることが可能です 2. Imagine アップデート内容 AI生成コンテンツを共同で作成・リミックスできる空間が提供されます。 ビジュアル、マーケティング資料、トレーニング素材のプロトタイプ作成に最適化されています。 ユースケース マーケティング資料作成:広告チームが複数のビジュアル案をAIで生成し、チーム内で編集・改良を重ねることができます 研修教材開発:人事部門が新入社員向けのトレーニング資料を視覚的に作成し、複数の講師で内容を調整できます プレゼンテーション素材:営業チームが顧客向け提案資料のビジュアルを共同で作成・改善することが可能です 3. Mico(ミコ) アップデート内容 雫をモチーフにしたキャラクターのAIアシスタントが導入されました。 感情表現が豊かで、Cortanaの進化版のような位置付けとなっております。 現時点ではキャラクターのアニメーション表示が主な機能で、ビジネス的な用途は限定的になると思われます。 ユースケース カジュアルな対話体験:ビジネス以外の場面で、よりフレンドリーなインターフェースを通じてAIと対話することができます 教育現場での活用:学生や子供向けに、親しみやすいキャラクターを通じて学習支援を提供できます 4. Real Talk アップデート内容 ユーザーの話し方に合わせて会話スタイルを調整し、建設的な対話や「ソクラテス式」の問題解決を支援する機能が追加されました。 ソクラテス式とは、古代ギリシャの哲学者ソクラテスが用いた対話による思考法で、質問を通じて相手の考えを深掘りし、矛盾や曖昧さを明らかにすることで、より明確で論理的な理解に導く方法です。 ユースケース コーチング・メンタリング:マネージャーが部下との対話スキルを向上させるための練習ツールとして活用が期待されます 5. メモリーとパーソナライズ アップデート内容 ユーザーの好み、目標、文脈を長期的に記憶する機能が実装されました。記憶内容は編集可能で、プライバシーにも配慮されております。 ユースケース 継続的なプロジェクト管理:過去の会話や決定事項を記憶し、プロジェクトの文脈を保持したまま作業を継続できます パーソナライズされた提案:ユーザーの業務スタイルや好みを学習し、より適切な提案を行うことが可能です 長期目標の追跡:四半期目標や年間目標を記憶し、進捗状況に応じたアドバイスを提供いたします 6. コネクター アップデート内容 OneDrive、Outlook、Gmail、Google Drive、Googleカレンダーなどと連携し、自然言語で横断検索が可能になりました。 ユースケース 統合情報検索:「先月の営業会議の資料」と尋ねるだけで、複数のクラウドサービスから関連ファイルを検索できます スケジュール管理:異なるカレンダーサービスをまたいで、会議の空き時間を一括で確認することが可能です メール・ファイル統合管理:GmailとOutlookの両方から特定のプロジェクトに関する情報を一度に取得できます 7.

主要LLMの料金・機能を比較「OpenAI, Anthropic Claude, Google Gemini」

  • POST
はじめに この記事ではOpenAIのGPTシリーズや、AnthropicのClaudeシリーズ、GoogleのGeminiシリーズなどの主要モデルについて比較表にまとめています。 最終更新日: 2025年10月19日 免責事項: 本記事の料金や仕様は公開時点の情報であり、変更される可能性があります。最新情報については各サービスの公式ドキュメントをご確認ください。 提供団体 各モデルの提供団体は以下の通りです。 団体 モデル 設立 国 備考 OpenAI GPT 2015年12月11日 米国 GPTは「Generative Pre-trained Transformer」の略。2017年にGoogleが発表したLLM「Transformer」がベース。事前に大量のデータで訓練されたLLMを示す。 Anthropic Claude 2021年ごろ 米国 Claudeはフランス語圏に多い名前。 数学者クロード・シャノン(Claude Shannon)など Google Gemini 1998年9月4日 米国 Geminiはラテン語で双子座を意味する。Google社内の2つの研究チームが合併したこと、Geminiの共同技術責任者がLLM開発はロケットを打ち上げる精神と同じと共鳴したことが由来。 Meta Llama 2004年2月4日 米国 Large Language Model Meta AI 料金 モデル名 バージョン 提供状態 入力料金[/1Mトークン] 出力料金[/1Mトークン] 備考 GPT-4o-mini gpt-4o-mini-2024-07-18 GA 0.

【初心者向け】思い通りに画像を生成する!画像生成プロンプト作成ガイド

  • POST
はじめに 以前は画像生成AI技術はなかなか思い通りの画像が生成されなかったり、日本語テキストの生成の精度が低いなどの課題がありましたが、 昨今ではOpenAIやGoogleなどが提供している画像生成モデルの精度が大幅に向上し、ビジネスにおいても活用の幅が広がっています。 この記事ではChatGPTやMicrosoft Copilotで画像生成AIを使って思い通りの画像を生成するためのプロンプトの書き方について説明します。 ※初心者向けのため、応用的な内容ではなく、基本的な内容になります。 ビジネスにおける画像生成のユースケース ビジネスにおいての画像生成系AIの活用事例として以下のようなものがあります。 1. デザイン・コンテンツ制作 製品ロゴやアイコン、サムネイル画像、キャラクター、書籍表紙、UI素材などの生成。 新しく生成するコンテンツに対して、AIにアイディアを提案させたい場合に使用します。 例 (新製品の画像をAIに提案させる) 最先端感のある最新スペックPCのデザインを提案せよ。 例 (新製品のアイコンをAIに提案させる) 新しいAIチャットサービス「Hogehoge AI」のアイコンを生成せよ 2. マーケティング・プロモーション 商品画像、広告用画像、イベント告知画像などの生成。 販売促進や集客目的で視覚的訴求を強化したい場合に使用します。 例 (イベント告知用画像を生成系AIに作成させる) 10月開催のテックカンファレンス告知用のSNS投稿用の画像 3. 業務・資料作成支援 図解、構成図、スライド背景、資料添付用画像などの生成。 文章だと分かりづらい事柄を図で表現させたり、資料作成の素材を生成させたい場合に使用します。 例 (図解: 生成系AIとチャットしていて分からなかったことなどを図で表現させる) 今までの会話内容をもとにLLMの概念について説明する画像を作成して 例: PowerPointのスライド背景 テクノロジー×イノベーションを象徴するデザインのスライド背景を生成して 既存画像への編集 最新の生成系AIでは既存の画像に対しての編集も可能になっており、以下のようなことができます。 テロップ挿入 キャッチコピーの挿入 タイトルの挿入 日付情報の挿入 この画像にキャッチコピーを追加した画像を生成して 画像の一部を別の画像と差し替え 商品や人物画像の背景を変更し、商品、人物にあった背景を検証 商品や人物画像を変更し、背景にあった商品、人物を検証 画像内の花瓶をコーヒーカップに変更した画像を生成して 画像の一部を削除 商品写真の余計な影や撮影機材を削除 観光地やイベント写真の通行人を消去 画像内の机を削除して 特に最新の画像生成AIモデルは日本語の生成精度が上がったことにより、テキスト画像の生成が期待した通りの結果が得やすくなっており、テロップ挿入などがビジネスツールとしてかなり強力になってきています。

Azure OpenAIでGPT-Image-1をPythonのopenaiライブラリから使用する方法まとめ【注意点・トークン消費検証】

  • POST
はじめに GPT-Image-1は、OpenAIが提供する最新の画像生成モデルです。 この記事では、PythonのopenaiライブラリからGPT-Image-1を使用するにあたって導入から実装、料金や注意点まで体系的に整理します。 GPT-Image-1の概要 GPT-Image-1は、テキストからの画像生成や既存画像の編集を行うことができる画像生成モデルです。 以下の2つの機能が提供されています。 Image Genaration (画像生成) Image Edit (画像編集) OpenAI公式: GPT-Image-1 Image Genaration (画像生成) 入力したテキストプロンプトを元に画像を生成するAPIです。 gpt-image-1ではストリーミングを設定することができ、ストリーミングを有効にすると生成途中の中間画像を生成させることができます。 中間画像 完成画像 Image Edit (画像編集) 既存の画像に対して、画像の編集し、新たな画像を生成することが可能です。 入力したプロンプトにもとづき画像を編集 (例:背景を赤色にして、人物画像を追加して) 複数の入力画像を合成して、新たな画像を生成 (例: 2つの画像を合成して) 入力画像とともにマスク画像を指定することで、マスク画像に表示されている画像のみを編集対象にできる (例: 背景は同じまま、男性の画像を女性に変更する) マスク画像は入力画像の一部を透過したもので透明になっている部分のみが編集対象 以下にImage Editでマスク画像を使って既存の画像を編集した例を示します。 元画像 マスク画像 編集画像 料金体系 Azure OpenAIでは以下の料金体系で提供されています。 GPT-5と比較すると入力テキストのトークンの料金も4倍に上がっています。 ※GPT-Image-1 Globalの料金 モデル名 バージョン 提供状態 入力テキスト料金[$/1Mトークン] 入力画像[$/1Mトークン] 出力料金[$/1Mトークン] 備考 GPT-Image-1 gpt-image-1 GA 5 10 40 GPT-5 gpt-5-2025-08-07 GA 1.

Azure AI Fondry Agenst ServiceのSDKについてまとめてみた

  • POST
はじめに 2025年05月20日からAzure AI Foundry Agent Serviceが一般提供が開始されました。 この記事では、Azure AI Foundry Agent ServiceのSDKについて紹介します。 GitHub: azure-sdk-for-python Azure公式ドキュメント: azure-sdk-for-python Azure公式ドキュメント: azure-sdk-for-python: readme Azure AI Foundry Agent Serviceとは Azure AI Foundry Agent Serviceは、AI エージェントの構築・管理ができるAzureのマネージドサービスです。 Azure AI Foundry Agent Serviceは、以下のような機能を提供しています。 AI Foundry PortalやAzure AI Foundry SDKを使って、エージェントの構築、管理が可能 複数のAIエージェントを組み合わせるマルチエージェントの構築が可能 A2A(Agent2Agent)、MCP(Model Context Protocol) などの業界標準プロトコルをサポート スレッドによるステートフルAPIをサポートしており、クライアントアプリ側での対話履歴の保持が不要 Azure AI Foundry Agent Service のセットアップパターン Azure AI Foundry Agent Service には、以下の2つのセットアップパターンがあります。 1. Basic setup(基本セットアップ) Agent Serviceで使用するデータをMicrosoftのマネージドリソース上に保持させる方法です。 通常、AzureでRAGアーキテクチャを構築する場合、Azure AI Searchなど高額なリソースを作成する必要がありますが、Basic setupを使用すれば、リソースの用意が不要なのでコストを下げることができます。

Github Copilot チートシート

  • POST
はじめに この記事では、Github Copilotの機能の一覧をまとめたチートシートを紹介します。 Github Copilotとは Microsoftによって開発されたAIベースのコーディングアシスタントです。 AIによるコードの自動補完やコードの提案機能を提供します。 コード補完: コーディング中にAIが提案するコード補完を活用して、効率的にコーディングを進めます。 ドキュメントやコメントの生成: コードに関するドキュメントやコメントをAIが自動生成してくれる機能を活用します。 IDEの拡張機能 CopilotはそれぞれのIDEに対応するGitHub Copilot拡張機能をインストールすることで、IDEで開いているファイルのコードの自動補完や、コードの提案を提供します。 対応するエディタとして以下のようなものがあります。 Azure Data Studio JetBrains IDEs Vim/Neovim Visual Studio Visual Studio Code Github copilot公式ドキュメント: IDE拡張機能 GitHub Copilot Chat GitHub Copilot Chatは、コーディング関連の質問をしたり、回答を受け取ったりできるチャットインターフェイスを提供します。 Copilot Chatは、Visual Studio Codeの場合は4種類のチャット欄から利用できます。 クイックチャット(画面上部に表示) インラインチャット(現在のカーソル位置に表示) チャットビュー(サイドパネルに表示) チャットエディタ(エディタのタブに表示) Copliot Chatで生成したテキストはチャット欄からコピーやインサートをすることができます。 Github Copilot公式ドキュメント Participants Visual StudioやVs Codeでは、「Participants」という機能が使えます。 GitHub Copilot Chatの「Participants」は、エディタ上で開いているファイル以外だけでなく、より幅広いコンテキストに対しての回答や操作を可能にする機能です。 Participantsはネット上では、Agentsなどとも呼ばれています。 従来のCopilotは主にエディタで開いているファイルや直接関連するコードブロックに対してのみ操作や提案を行っていましたが、Participantsを使用することで、エディタで開いているファイル以外にも質問が可能になります。 以下の3種類のParticipantsが用意されており、チャット欄の先頭に@から始まるコマンドを入力することで使用することができます。 @workspace : プロジェクト全体への質問、操作を行う @vscode : VS Codeの操作方法などについて質問する @terminal : ターミナルで何かをする方法について質問する Visual Studioブログ