Ohina Work

元エンジニアのワークハック

Posts

Anthropic Claudeのプロンプトキャッシュ入門

Apr 26, 2025
POST

はじめにこの記事では、Anthropic Claudeのプロンプトキャッシュについてまとめました。 Anthropoc Caludeとは Anthropic Claudeは、Anthropic社が開発した高度なAI言語モデルです。このモデルは、自然言語処理タスクにおいて高い性能を発揮し、特に会話型AIやテキスト生成、分析などの用途に適しています。 Anthropic Claudeは、AWSやGoogle Cloudなどのクラウドプラットフォームを通じて利用可能であり、さまざまな業界で活用されています。 Anthropic公式サイト Anthropic Claudeのプロンプトキャッシングの仕組みプロンプトキャッシングを導入すると、指定したプロンプトをキャッシュすることができます。キャッシュするとキャッシュブレークポイント(cache_control)が設定されているプロンプトのプレフィックス(先頭部分)が、キャッシュされているかを確認します。キャッシュされている場合、プレフィックス部分のプロンプトを再利用することで、LLM側での内部処理が不要になり、処理時間とコストを削減することができます。キャッシュされていない場合は、プロンプト全体を新規に処理した後に、プロンプトのプレフィックスを保存します。この仕組みにより、繰り返し使用されるプロンプトの再処理を避け、システム全体の効率を向上させています。 OpenAIにも同様にプロンプトキャッシュが導入されています。 GoogleのGeminiシリーズにもコンテキストキャッシュという名称は異なりますが、同様の機能があります。 Anthropic: プロンプトキャッシュ Google Cloud: Claudeモデルのプロンプトキャッシュ OpenAI: プロンプトキャッシングAPI Medium: LLMのプロンプトキャッシュのメカニズム株式会社Algomatic: テックブログ Zenn: Claude Prompt Cachingは本当に効果的なのか検証してみたプロンプトキャッシュの料金料金キャッシュの料金は以下の通りです。キャッシュ書き込み: 入力トークンよりも25%高価格キャッシュ読み取り: 入力トークンよりも90%低価格初回に発生するキャッシュの書き込みでは、料金が上がってしまいますが、複数回LLMとの会話が行われると、キャッシュが活用されるので、その分料金が安くなります。サポートモデルプロンプトキャッシュをサポートしているモデルは以下になります。 Claude 3.7 Sonnet（claude-3-7-sonnet@20250219） Claude 3.5 Sonnet v2（claude-3-5-sonnet-v2@20241022） Claude 3.5 Sonnet（claude-3-5-sonnet@20240620） Claude 3.5 Haiku（claude-3-5-haiku@20241022） Claude 3 Haiku（claude-3-haiku@20240307） Claude 3 Opus（claude-3-opus@20240229）プロンプトキャッシュの利用方法プロンプトキャッシュを利用するにはClaudeのAPIをコールする際にcache_controlパラメータを指定します。

Azure Durable Functions入門

Apr 13, 2025
POST

はじめにこの記事では、Azure Durable Functionsについて解説します。 Azure Durable Functions Durable Functionsは、Azure Functionsの拡張機能で、状態を保持する（ステートフルな）ワークフローを実現可能にする機能です。複数の処理を順番や並列で実行し、状態管理や再実行といった処理をユーザーは実装する必要がなく、Durable Functions側で自動で行うため、開発者はビジネスロジックの実装に集中することができます。また、HTTPトリガー関数の場合3分50秒のタイムアウト制限があるため、長時間の処理を行うことができませんが、Durable Functionsを使うことで、長時間の処理を行うことが可能になります。　 Azure公式ドキュメント: Azure Durable Functionsとは Azure Durable Functionsのアーキテクチャ Durable Fucntionsは以下の4つの関数で構成されています。クライアント関数 (Client Function) オーケストレーター関数 (Orchestrator Function) アクティビティ関数 (Activity Function) エンティティ関数 (Entity Function) それぞれの次の項で、それぞれの関数について解説していきます。　 Azure公式ドキュメント: Azure Durable Functionsにおける各関数の説明クライアント関数 Durable Functionsをスタートさせるトリガー関数です。通常のFunctionsと同様にHTTPトリガーやタイマートリガーなどイベントドリブンで実装されており、定義したトリガーからイベントなどを受け取って、オーケストレーター関数を起動するのがこの関数の役目です。　オーケストレーター関数後述するアクティビティ関数の実行を管理する役割の関数です。後述するアクティビティ関数や他の関数を記載された通りに起動します。　ただし注意点として、オーケストレーター関数は決定論的（deterministic）である必要があります。決定論的とは、「同じ入力なら、いつ呼んでもまったく同じ動きをする」ように書く必要があることを示します。 Durable FunctionsではAzureサービスの障害時やサービスメンテナンス時などで処理が中断された場合に、オーケストレーター関数を再実行することができます。再実行時に実行のたびに結果が変わるような処理が入っていると、予期しない動作を起こす危険性があるため、現在時刻やランダム値を使った処理など、毎回結果が変わるようなコードをオーケストレーター関数で定義することはアンチパターンとされています。

在職者が選ぶ!「2025年岡山IT企業ランキング」

Apr 6, 2025
POST

在職者が選ぶ!「2025年岡山IT企業ランキング」はじめに転職者向けの口コミサイトでの評価をもとに、岡山のシステム会社(Sier)やWEB制作会社などIT企業の人気ランキングを作成しました。岡山で就活・転職活動をされている方の参考になれば幸いです。選定条件ランキングの作成に当たり、以下の条件でランキングを作成しています。以下の3つの著名口コミサイトに全てに評価が記載されている企業を対象 OpenWork 転職会議ライトハウス 3つの口コミサイトの評価の平均値を総合評価として順位付け 2024年4月時点での評価点を記載 ※企業ごとに投稿口コミ数が異なるため、口コミサイトの評価点が必ずしも企業の「格」を示すものではなく、本ランキングはあくまで参考指標です ※3つの口コミサイト全てに評価が記載されている企業を対象としているため、一部の企業は今回のランキングからは対象外とさせていただきましたランキング各社のランキングは以下の結果になりました。順位会社名総合評価 1 両備システムズ 3.44 2 NICS 3.32 3 セリオ 3.25 4 OEC 3.23 5 トスコ 3.22 6 アイピーシステム 3.22 7 システムヨシイ 3.15 8 システムタイズ 3.

岡山でのシステムエンジニア就職・転職ガイド2025

Apr 5, 2025
POST

岡山でのシステムエンジニア就職・転職ガイド2025 はじめにこの記事では、岡山でシステムエンジニアとして就職、転職を希望している方向けに、岡山のIT産業やSierの特徴を記載し、就職・転職活動時に確認すべき観点を紹介します。実際に岡山県内の企業で働かれている方の話を元に作成しており、かなりディープなところまで踏み込んでいます。岡山に限らず、地方企業への就職を検討されている方や、Uターン・Iターン転職をされている方の参考になれば幸いです。注意事項この記事は岡山県内の企業で実際に働かれている方に伺った話を元に記載しています事実ではありますが、あくまでも一例に過ぎず、すべての企業に当てはまるものではありません岡山の企業や勤めている方を貶めることが目的ではなく、情報収集が困難な求職者側に事実として記事に記載したような実態があるということを知っていただき、就職や転職に役立てていただくことが目的です岡山のIT産業の特徴県内最大手は両備システムズ県内の最大手は、両備システムズです。両備システムズは、行政・医療・福祉などの分野に強みを持つ、岡山県内最大の従業員数を誇る両備グループ配下のSierです。両備システムズは、学生が選ぶ人気企業ランキング発表(株式会社ビザビ様調べ)でも学生の方からも高評価を得ており、岡山県内に安定した人気を誇っている企業で、岡山での就職、転職先として最も無難な選択肢と言われています。富士通系とベネッセ系の案件が多い岡山県では多くのSierは富士通と、岡山地場企業のベネッセがメインクライアントになっているケースが多く、案件も富士通系、ベネッセ系が主流になるケースが多いです。岡山でシステムエンジニアとして活動するのであれば、両社の動向はチェックしておいたほうがいいかもしれません。岡山の企業の特徴同じ業界であっても、地域ごとに独自の企業文化があり、使用されている技術も異なるので、若い方や、首都圏にいらっしゃった方が岡山の企業に就職したときにギャップを感じることもあると思います。このセクションでは、岡山の企業で働かれている方に伺った話を元に、企業の文化や働き方、キャリア形成、転職市場など岡山の企業の特徴について紹介します。企業文化・イベント岡山の実際に企業で働かれている方に伺った話を元に、岡山の企業で導入されているイベントの一例や、企業の文化について紹介します。始業前にラジオ体操がある首都圏だともうあまり聞かなくなりましたが、従業員の健康を維持・増進を目的に就業前にラジオ体操を導入している企業も結構あります。ラジオ体操が導入されていることにメリットを感じるかどうかは人によると思いますが、就業時間外にラジオ体操を強要していているケースもあり、労働基準監督署から指導を受けた企業もあるようです。始業前にラジオ体操などのイベントがないか確認した方がいいでしょう。始業開始前に朝礼がある始業開始前に毎朝社内で朝礼を実施している企業もあります。朝礼では、社訓を読み上げたり、従業員によるショートスピーチをしたりします。朝礼を導入している企業は、首都圏でもしばしば聞きますが、複数の従業員の時間を拘束してしまっていることから、若い方のウケは悪いというのが実態です。社内清掃業務がある中小企業が多いので、清掃員を雇えない企業もあります。清掃員がいない企業では、清掃は事務職、エンジニア問わず、全従業員で協力して実施しています。会社によっては定時後の業務時間外や、休日に掃除をすることを強要され、サービス残業をすることになるケースもあるようです。また、年末は従業員総出で本社の大掃除を行う企業が多々あり、こちらもサービス残業なるケースが多いようです。本業以外の業務を長時間することにストレスを感じる方は、入社前に確認した方がいいでしょう。読書感想文の提出会社から推薦された書籍について、感想文の提出を強要されるケースがあるようです。書籍を推薦するだけならいいのですが、読書と感想文を強制されるとプライベートの時間を拘束されることになるので、従業員側としてはデメリットですよね。推薦図書などの教育制度がないか確認し、感想文の提出のありなしがないか掘り下げて質問してみるといいでしょう。新入社員歓迎会で一発芸を強制される新入社員の歓迎会で新入社員の方に一発芸をすることを強制される企業もあるようです。一発芸の目的は新入社員に会社に馴染んでもらうことだと思いますが、そういったことをすることにストレスを感じる方もいらっしゃると思います。また、一発芸も事前に実施する内容について、旧人からレビューや手直しの指示があり、意外とプライベートの時間が取られて、面倒なようです。新人歓迎会など飲み会の場で、一発芸などのイベントがあるかさり気なく聞いてみるといいかもしれません。社員旅行が強制される会社によっては、社員旅行への参加を義務付けることが就業規則に記載されており、参加を強制されるケースがあるようです。また、顧客への旅行のお土産の購入を自費で払わされるケースもあるようです。休日に社内のレクリエーションのイベントがある休日にサークル活動などを通したレクリエーションを導入している企業もあります。例として、岡山で有名なうらじゃ祭り(夏祭り)の盆踊りに会社として参加している企業などがあります。ただ、サークル活動への参加が強要され、衣装などの活動費も自費で支払いを強要されるケースもあるようです。業務時間外に社内勉強会を実施しているケースがある求職者に社内勉強会を実施していることをPRしている企業は結構あるのですが、多くの場合、社内勉強会は無給です。また、業務時間外にも関わらず社内勉強会へ参加を強要されるケースもあるので、社内勉強会の実施を過剰にPRしている企業には注意したほうがいいでしょう。働き方フレックスタイム制や裁量労働制を導入している企業は結構あるフレックスタイム(就業開始と終了時刻を労働者が決定できる制度)や、裁量労働制(企業と労働者で規定した時間の労働をしたとみなして、その時間分の賃金を支払う制度)などを導入している企業も意外とあるようです。フレックスタイムが導入されていない企業に入社して、育児や、両親の介護などで両立ができないため、退職する方もいるようなので、事前に会社の方針を確認しておいたほうがいいでしょう。副業は基本禁止されている企業が多い岡山のSierでは、副業は禁止している企業が多いようです。ただ、中小企業あるあるで就業規則に副業禁止の旨が記載されていなかったり、自身の所属部署だと副業禁止周知されているのに、

【2025年03月】3大クラウドのAI系サービスリリースノート

Mar 30, 2025
POST

はじめにこの記事では、Azure、AWS、Google Cloudの3大クラウドサービスのAIサービスの新規機能リリース履歴をまとめています。主に以下のURLの情報をもとに新機能のキャッチアップを行っています。 Azure公式ドキュメント: Azure OpenAI Serviceニュース Github: Azure公式ドキュメント管理リポジトリ Github: Azure OpenAI APIプレビューバージョン一覧 Github: Azure OpenAI API安定版バージョン一覧 AWS公式ドキュメント: AWS Bedrockリリースノート Google Cloud公式ドキュメント: Vertex AIリリースノート Anthropic公式ドキュメント: APIバージョン一覧 Azure 2025年03月05日: リクエストレベルでコンテンツフィルタリングを指定できる機能がプレビュー提供開始デプロイメントレベルのコンテンツフィルタリング構成に加えて、APIコールごとにリクエストヘッダー(x-policy-id)を使用してカスタム構成を指定できる機能が追加されました。 curl --request POST \ --url 'URL' \ --header 'Content-Type: application/json' \ --header 'api-key: API_KEY' \ --header 'x-policy-id: CUSTOM_CONTENT_FILTER_NAME' \ --data '{ "messages": [ { "role": "system", "content": "You are a creative assistant.

【2025年02月】3大クラウドのAI系サービスリリースノート

Feb 28, 2025
POST

はじめにこの記事では、Azure、AWS、Google Cloudの3大クラウドサービスのAIサービスの新規機能リリース履歴をまとめています。主に以下のURLの情報をもとに新機能のキャッチアップを行っています。 Azure公式ドキュメント: Azure OpenAI Serviceニュース Github: Azure公式ドキュメント管理リポジトリ Github: Azure OpenAI APIプレビューバージョン一覧 Github: Azure OpenAI API安定版バージョン一覧 AWS公式ドキュメント: AWS Bedrockリリースノート Google Cloud公式ドキュメント: Vertex AIリリースノート Anthropic公式ドキュメント: APIバージョン一覧 Azure 2025年02月05日: GPT-4o Mini Audioがリリース GPT-4o-mini-audio-preview (2024-12-17) とGPT-4o-mini-realtime-preview (2024-12-17)が提供開始されました。 GPT-4o-mini-audio-preview (2024-12-17) は最新の音声生成モデルです。モデル名種別入力出力 GPT-4o-Mini-Audio-Preview-2024-12-17-Global テキスト $0.15 $0.

【2025年01月】3大クラウドのAI系サービスリリースノート

Jan 30, 2025
POST

はじめにこの記事では、Azure、AWS、Google Cloudの3大クラウドサービスのAIサービスの新規機能リリース履歴をまとめています。主に以下のURLの情報をもとに新機能のキャッチアップを行っています。 Azure公式ドキュメント: Azure OpenAI Serviceニュース Github: Azure公式ドキュメント管理リポジトリ Github: Azure OpenAI APIプレビューバージョン一覧 Github: Azure OpenAI API安定版バージョン一覧 AWS公式ドキュメント: AWS Bedrockリリースノート Google Cloud公式ドキュメント: Vertex AIリリースノート Anthropic公式ドキュメント: APIバージョン一覧 Azure 2025年01月21日: gpt-4o-realtime-previewがグローバルデプロイ可能に gpt-4o-realtime-previewのモデルバージョン 2024-12-17がEast US 2とSweden Centralリージョンでグローバルデプロイメント可能になりました。 Azure公式: グローバルスタンダードデプロイメント 2025年01月21日: GPT-4o Realtime APIがプロンプトキャッシュをサポート GPT-4o Realtime APIがプロンプトキャッシュをサポートしました。プロンプトキャッシュを使用すると、プロンプトの開始時に同じ内容だった長いプロンプトに対して、全体的なリクエストの遅延とコストを削減できます。 Azure公式: プロンプトキャッシュについて 2025年01月21日: GPT-4o Realtime APIが新音声をサポート GPT-4o Realtime APIで以下の新しい音声が使用できるようになりました。

2024年岡山ITニュースまとめ

Dec 31, 2024
POST

2024年岡山ITニュースまとめはじめに 2024年の岡山県の県内のシステム会社の動向や、ITに関連した主なニュースについてまとめました。エンジニアや、就職活動中の学生の方の参考になれば幸いです。 2024年主要イベント年表日付ジャンル会社・団体イベント 2024/01/09 経営情報セリオ様ファジアーノ岡山の2024シーズンユニフォームスポンサー決定 2024/01/09 経営情報両備システムズ様ファジアーノ岡山の2024シーズンアップウェアスポンサー決定 2024/01/25 リリース岡山大学様生成AIチャットボットによる介護保険説明で理解をサポート 2024/01/26 リリーストスコ様 RFIDを活用して人件費削減・社内DX化 2024/01/25 経営情報両備システムズ様「中期経営計画2024～2026」を発表、2026年に売上高446億円を目指す 2024/02/23 - 2024/03/09 キャンペーンオーユーシステム様【2月23日～ 3月9日】ベトコンラーメン倉敷新京が特別メニューを提供 2024/02/27 リリースベネッセホールディングス様ベネッセ幼児向け会話型 AI「しまじろう」を共同開発 2024/03/01 経営情報セリオ様本社移転プロジェクト開始 2024/03/11 リリースベネッセホールディングス様生成AIによる自己PR作成支援サービスを2024年3月11日（月）より提供開始 2024/03/12 経営情報セリオ様経済産業省「健康経営優良法人2024（中小規模法人部門）」に認定 2024/03/18 経営情報ピープルソフトウェア様株式会社フォーバルとGDXで業務提携 2024/03/25 経営情報両備システムズ様両備システムズ東京本社移転 2024/04/04 人事ビザビ様 2025年卒学生が選ぶ人気企業ランキング発表(株式会社ビザビ様調べ) - 両備システムズ様 : 前年1位 → 3位 - OEC様 : 前年56位 → 16位 - ピコシステム様 : 前年100位 → 30位 - システムエンタープライズ様 : 前年13位 → ランク外 - 東都システムズ様 : 前年17位 → ランク外 - セリオ様 : 22位 →　ランク外 - ピープルソフトウェア様 : 前年27位 → ランク外 2024/04/12 経営情報両備システムズ様両備システムズが東京本社を移転、首都圏での売上高を2030年までに倍増を目指す 2024/04/24 経営情報セリオ様セリオ本社ビル建築プロジェクトが「CLT建築実証事業」として採択 2024/05/14 経営情報両備システムズ様事業拡大のため、岡山市南区豊成に新オフィス建設 2024/05/23 認定エクシードシステム様 LINEヤフー Partner Program LINEミニアプリ部門「Technology Partner」に認定 2024/05/31 リリース両備システムズ様ファイル共有サービス「R-Cloud FileShare」の無料トライアルを受付開始 2024/06/01 イベント SEO SEO親睦フットサル大会 2024/06/03 リリースリゾーム様商業施設のテナント選びを支援するChatGPTを使ったAIクラウドサービス『PROCOCO』を5月リリース 2024/06/08 イベント岡山IT座談会 THE岡山IT座談会 2024/06/09 その他岡山大学様産学官連携「おかやまデジタルイノベーション創出プラットフォーム」設立 2024/06/10 リリース両備システムズ様 AI画像解析による物流の数量確認の時間を短縮できるAIカウントツール「CountShot」などを使ったサービスを提供 2024/06/10 リリースアイアットOEC様ノーコードツール「@pocket（アットポケット）」をリリース 2024/06/12 - 2024/06/14 イベント両備システムズ様「画像センシング展2024」へ出展 2024/06/14 イベントネットリンクス様 kintoneでのアプリ作成体験ワークショップ開催 2024/06/15 イベントフィネット様 Geeks Who Drink in Okayama 20224/06/17 ピープルソフトウエア様リリース複数映像の自動切り替えソフトウェア「Intelligent Switching」をリリース 2024/06/18 経営情報セリオ様役員異動:取締役的野秀明氏が任期満了により退任 2024/06/20 リリースアイアットOEC様ノーコードツール「@pocket（アットポケット）」をリリース 2024/06/22 イベント Okayama.

Azure OpenAIの各デプロイメントタイプ

Oct 14, 2024
POST

Azure OpenAIの各デプロイメントタイプはじめに Azure OpenAIでは、モデルをデプロイするときに5つのデプロイメントタイプを選択することができます。この記事では、Azure OpenAIのそれぞれのデプロイメントタイプについて紹介します。 Azure OpenAI のデプロイメントタイプ Azure Open AIでは、以下の5つのデプロイメントタイプが存在します。 Standard Provisioned Global Standard Global Provisioned Global Batch Azure公式ドキュメント: Azure OpenAI デプロイメントタイプ Azure公式ドキュメント: Azure Open価格 Standard Standardは、Azure OpenAIのサービス開始当初からあるデプロイメントタイプです。モデルのデプロイ時に設定したTPM(1分当たりのトークン数)を処理上限として、APIのコール時に使用したトークン数に応じて従量課金される形式になっています。データを処理するリージョンは、作成したAzure OpenAIリソースのリージョンで固定されるため、データを処理する所在地の指定があるリージョンでの利用に適しています。 Azure公式ドキュメント: Azure OpenAI デプロイメントタイプ Provisioned Provisionedは、月間または、年間通して使用するスループット(PTU: Provisioned Throughput)を事前予約することができるデプロイメントタイプ。事前にモデルの処理可能量にあたるPTUを購入することで、以下のメリットが得られます。 Azure公式ドキュメント: Azure OpenAI Provisioned Throughput 一貫したレイテンシ: レートリミットによる429エラーの発生が抑止され、応答時間が安定するコストの削減: 月間または、年間通しての利用により従量課金よりも安いコストでOpenAIを利用できるデメリットとしては、未使用時のコストの増加: 事前にPTUを購入するため、使用量が少ない場合にもコストが発生する Azure OpenAIのモデルバージョンごとに、購入できるPTUの単位や、PTU当たりの処理能力(単位時間当たりで何トークン処理できるかなど)は異なります。 PTU当たりの処理能力や、PTU当たりの料金はドキュメントに記載がないが、Azure OpenAI Studioのモデルのデプロイの画面から、プロンプトトークン、生成トークン、1分当たりのピーク時のリクエスト数から必要な推定PTUを算出と価格の確認が可能です。 Global Standard/Provisioned Globalデプロイメントは、Azure基盤側でAzure Open AIへの各リクエストを最も可用性の高いリージョンのデータセンターにルーティングすることで、通常のデプロイメントタイプよりも高い可用性を提供するデプロイメントタイプ。

Azure OpenAI APIの正しいトークン数の計算方法

Sep 22, 2024
POST

Azure OpenAI APIの正しいトークン数の計算方法はじめに OpenAIのAPI利用する際、OpenAI内のGPTなどのLLMはトークンと呼ばれる文字列の単位で処理を行い、APIの利用料金は処理したトークン数にもとづいて課金されます。そのため、OpenAI APIの利用料金を算出するにあたって、トークン数を試算する必要があります。この記事では、OpenAI APIにおいてトークン数の算出をする方法について紹介します。 OpenAI APIのレスポンスボディからトークン数を算出 OpenAIのAPIをコールすると通常は、レスポンスボディのusageの項目からトークン数を取得することができます。 // OpenAI APIのレスポンスボディの例 { "id": "chatcmpl-123", "object": "chat.completion", "created": 1677652288, "model": "gpt-4o-mini", "system_fingerprint": "fp_44709d6fcb", "choices": [{ "index": 0, "message": { "role": "assistant", "content": "\n\nHello there, how may I assist you today?", }, "logprobs": null, "finish_reason": "stop" }], "usage": { "prompt_tokens": 9, "completion_tokens": 12, "total_tokens": 21, "completion_tokens_details": { "reasoning_tokens": 0 } } } usage配下のパラメータはそれぞれ以下の意味を持ちます。