2025年のAIニュース振り返り。State of AI Report 2025

はじめに

State of AI Report 2025 は、Air Street Capital により毎年発表されている、AI業界全体を俯瞰する総合レポートです。本レポートは300ページを超える英語資料のため、本記事では特に実務・ビジネスへの影響が大きい論点のみをピックアップして整理しております。

STATE OF AI REPORT 2025

State of AI Reportは2018年から毎年発表されているAI業界総まとめレポートで、技術だけでなく産業・政治・安全性・将来予測まで広く扱っています。このレポートはAir Street Capital [AI特化のベンチャーキャピタル]によって公開されています。 ※レポート自体は今年の秋に発表されたものなので、Gemini 3, GPT-5.1が出る前の内容になっています

State of AI

余分な情報は推論精度を低下させ、モデルに「考えすぎ」を誘発し、必要トークン数を増加。21-24スライド

無関係な情報を追加するだけで、モデルの推論性能が大きく低下します。
例：「猫は一生のほとんどを寝て過ごします」という無関係な文を追加すると、数学問題の正答率が半減しました。
無関係な情報があると、モデルは余計な推論を行い、必要トークン数が増加します。

研究者はトレーニングデータ選定において、量よりも質と多様性を優先し始めている。29スライド

従来は大量のデータでモデルを強化していましたが、最近は「質の高い質問」が重要視されています。
NaturalReasoning データセット
- Webベースの大学院レベルの質問を使用しています。
- 数学や科学的推論の進展を促しています。
- 8B Llamaを抽出すると、大規模なWebInstruct/OpenMathInstructセットよりも効率的な精度向上が得られています。
RLポストトレーニング
- オックスフォードの新しい論文で、最適なトレーニング問題の自動選択を実装しました。
- LILO（Learning from Important Logical Outcomes）を導入しています。
- 質問に対する成功のバラツキが大きい質問を優先的にトレーニングすることで、トレーニングステップを1/3に削減しました。

オープンモデルとクローズドモデルの知能差は拡大。42スライド

DeepSeek R1登場後、オープンモデルの性能は向上しましたが、クローズドモデルとの差は再び拡大しています。
o3リリース以降、知能差が大幅に広がっており、クローズドモデルが圧倒的優位です。
現在のトップモデルは、GPT-5、o3、Gemini 2.5 Pro、Claude 4.1 Opus、Grok 4（すべてクローズド）です。
オープンウェイト側の最強モデルはgpt-ossがトップで、その次にQwenシリーズが続いています。

中国の台頭 44-46 スライド

新しいシルクロード オープンソースAIモデルを通じて、知識・技術のグローバルな流通が起きています。 → 特に中国がこの流れの「ペースメーカー」になりつつあります。
中国モデルの急成長
- 以前は米国に品質面で遅れていましたが、Qwenなどのモデルがユーザーの嗜好、世界的ダウンロード数、採用率で急伸しています。
1. 寛容なライセンス 中国発のモデルやフレームワーク（Qwen、GLM-4.5など）は Apache-2.0 や MIT ライセンスで提供されており、導入が容易です。
2. 多様なモデル提供 中国では開発者の方々がニーズに合わせて選べるよう、さまざまなサイズや構成のモデルがリリースされています。
3. 強力なツールとコミュニティ
  - ByteDance Seed：初期の HybridFlow 研究システムを進化させ、RLHF/RLVR ライブラリとして実稼働しています。AMD ROCm サポートや Oumi との統合で低コスト・高効率です。
  - OpenRLHF：Ray/vLLM/DeepSpeed を活用し、既存の SOTA フレームワークより最大 1.68 倍高速です。学界・産業界で高評価を得ています。
4. 中国チームのリーダーシップ RL トレーニングスタックの性能・コスト・導入容易性で中国勢が世界をリードしています。
MetaはLlama 4以降も方向性を模索中です。
- コミュニティが低スケールで高密度モデルを最適化しやすいLlama 4でMixture-of-Experts構造に切り替えましたが、完成度不足により開発者の方々には不評でした。2024年後半からHugging FaceではLlamaのシェアは約50%～15％まで低下しています。

SLMはAIエージェントに活用できるか? (82スライド)

NVIDIAとジョージア工科大学の研究者は、ほとんどのエージェントのワークフローは範囲が狭く、反復的で、フォーマットに制限されています。そのため、小規模な言語モデル（SLM）が十分にこれに対応でき、低コストで運用可能だと主張しています。
SLMは短いコード生成や簡単なタスクに適しており、実行コストは10～30倍安く、応答も速いです。
SLMは長文や複雑な会話、推論に弱く、大型モデルとの併用が必要です。
必要な場合のみ大規模モデルを呼び出すハイブリッド構成が推奨されています。

Google vs OpenAIのコスト効率 94-95スライド

「LLMの価格に対する性能が倍増するのにかかる期間(doubling time)」を見ると、3～6ヶ月程度でLLMの価格に対する性能が倍増しています。
LLMの価格は安くなる見込みです。
Google社はOpenAI社よりも短い期間でLLMのコストパフォーマンスを改善しています。
Google社が追い付いてきており、OpenAI社は先行していた分、頭打ちになってきている可能性もあります。

MCPの概要と現状（2024後半～2025） 84スライド

2024年後半にAnthropicが導入したMCPが普及し、2025年には主要プラットフォームで採用されるようになりました。
OpenAI：ChatGPT、エージェントSDK、APIにMCPを搭載しています。
- Google：Geminiに追加されました。
- Microsoft：VS Codeに統合され、WindowsやAndroid Studioにも展開を開始しています。
- MCPはGoogleの競合プロトコルA2Aよりも3倍以上研究論文で引用されています（ゼータアルファ調査）。
- 世界で推定15,000以上のMCPサーバーが稼働しています。
- MicrosoftやVercelなどがガードレールやレジストリを構築し、エコシステムの安全性を強化しています。

エージェントフレームワークの現状と特徴 85スライド

AIエージェントフレームワークが多数登場し、乱立状態で明確な主流が存在しない状況です。

LangChain 依然として人気はありますが、もはや唯一の選択肢ではなく、多数のフレームワークの中の一つです。
AutoGen
- 強み：マルチエージェント + RAG（Retrieval-Augmented Generation）研究で優位です。
- 用途：研究開発における複雑なエージェント間協調です。
CAMEL
- 強み：役割ベースの会話設計です。
- 用途：対話型エージェントの研究や実験です。
MetaGPT
- 強み：ソフトウェアエンジニアリングに特化しています。
- 用途：エージェントを構造化された開発ワークフローに組み込むことです。
DSPy
- 強み：宣言型プログラム合成、エージェントパイプラインです。
- 用途：研究優先のフレームワークとして注目されています。
LlamaIndex
- 強み：エンタープライズドキュメントに基づくRAGワークフローです。
- 用途：企業向け情報検索・知識管理です。
AgentVerse
- 強み：マルチエージェントのシミュレーションとベンチマークです。
- 用途：性能評価や複雑なエージェント環境の実験です。

AI企業の収益化と成長 97-101スライド

2025年8月時点で、主要AI企業上位16社の年間売上は約185億ドル（約3兆円）に達しており、そのうち約120億ドルはOpenAIが占めています。
従業員50人未満・設立5年未満でも高収益なAIスタートアップ（MidjourneyやCursorなど）「Learn AI Leader Board」が増えており、従来のSaaSより約1.5倍のスピードで売上成長しています。
少人数でビッグビジネスができるようになっています。

トークン処理の量の増加 105スライド

Googleが自社施設でGemini機能を有効化し、AI検索体験を強化しました。
- 毎月処理されるトークン数が**1,000兆（1 quadrillion）**に到達しました。
- 年間で50倍の増加という急成長を遂げています。
OpenAIも昨年同様にトークン処理量を増加させています。

コーディングアシスタント関連のスタートアップの厳しい収益構造 108-109

Claude Code や Cursor はプログラマーに人気ですが、ビジネスモデルが非常に不安定です。
- Cursorは自社で価格を自由に決められず、上流モデル提供者の価格・レート制限・デフォルト設定に依存しています。
- Cursorは、OSSの拡張機能がハイジャックを受けるなどのトラブルが発生しました。
Cursorなどのスタートアップは評価額2億ドル以上にも関わらず、厳しいユニットエコノミーに直面しています。
- トークンコストが急増により、ジレンマに直面しています。
  - 損失を受け入れるか
  - ユーザー離れを承知で、値上げ、使用量制限、古いモデルを使うようにアクセス制限、自社モデルにシフトするか

AI検索エンジンの台頭により、Googleの検索・広告モデルに大きな変化が発生。113-117スライド

ChatGPTはAI検索を一般化させ、2025年8月時点で月間7億5,500万人のユーザーを獲得し、市場シェア約**60%**です。
GoogleはAI概要（AIO）やAIモードを導入しましたが、クリック率が最大90%減少し、広告収益に打撃を与えています。
Googleの検索トラフィックは前年比約7.9%減少しています（世界シェアは約90%維持しています）。Bing(-18%)、DuckDuckGo(-11%)も減少しています。
Perplexityは2025年5月に7億8,000万件のクエリを記録し、前月比20%増加しました。
ChatGPTは月間6億1,800万件のクエリで、Google検索ワードランキングにおいては「Facebook」に匹敵する水準です。
それでもGoogleの優位性は揺るぎないものと認識されています。OpenAIはMicrosoftとの提携やBingアクセスがあるにもかかわらず、Google検索結果のスクレイピングを選択しています。
Googleは検索市場で圧倒的なシェアを持ち、競争を阻害しているとの懸念から、規制当局や業界で「公平な競争のための措置」が検討されています。
措置の一環としてのインデックスダンプ
Googleは、競合企業（OpenAI、Anthropicなど）に対して、Webインデックスの一部を「ランキングなし」で一度だけ提供するトライアルを実施しました。
Profound社のデータによると、ユーザーはAI回答エンジンをGoogle検索とは異なる方法で利用されています。
セッション時間が長く、やり取りが多い状況です。
これにより、高い意図（購入や意思決定）と高いコンバージョン率の可能性が示唆されています。
平均的なAI回答エンジンのセッションでは、ユーザーは最大5件のプロンプトと5件の応答をやり取りしており、従来の検索（クエリ→スクロール→リンククリック）よりもはるかに多いインタラクションがあります。
ChatGPTのセッションあたり平均ターン数は5.6、GeminiとPerplexityは最大4、DeepSeekは最大3.9です。 → ターンが多い＝会話が魅力的です、ターンが少ない＝効率的な回答です。
Profoundの分析では、ChatGPTのクローラーはGooglebotやBingbotと並び、インターネット上で最もアクティブなボットのトップ10入りしています。

MicrosoftとOpenAIの関係 126-127スライド

OpenAIは次世代モデルのトレーニングに膨大な計算資源を必要としていますが、Microsoftが十分な速度でクラウド計算を提供できない、または積極的に投資していないことが問題となっています。
- OpenAIはOracleなど他のクラウドベンダーに接近し、マルチクラウド戦略を模索しており、これはMicrosoftとの独占的な関係を緩める動きです。
Microsoftは2030年まで以下を保持しています。
- 収益の20％分配
- OpenAIのIPアクセス権
- API独占権
OpenAIは、収益分配を10％に戻したいという意向を示しており、利益構造の見直しを求めています。
MicrosoftはOpenAIがPBC（公益法人）に転換する動きを阻止できる権利を持っています。
OpenAIは逆に、Microsoftが敵対的な行動を取った場合やAGI関連条項に違反した場合、独占禁止法上の懸念を表明するオプションを保持しています。
OpenAIは2025年末までに200億ドルの資金調達を完了しない場合、新たな資金調達ラウンドを開始する必要があります。
Microsoftは15,000個のH100 GPUでトレーニングした音声モデルとMoEモデルを公開しました。
Oracleは株価が高騰しています。

電力不足とインフラの限界 131スライド

中国・米国・日本の発電量を比較すると、中国がこの20年で4倍に伸ばした一方、米国と日本は横ばい〜微減です。
AIデータセンターの急増により、米エネルギー省の推計として2030年頃までに停電頻度が大幅に増加するリスクや電力価格上昇の懸念があると述べており、物理インフラがAI成長のボトルネックになりつつあります。

新たなAIセキュリティ脅威の表面化 175スライド

AIスタックの進化：ステートレスAPIからステートフルなプロトコルやエージェント層へと進化しています。
進化に伴うセキュリティリスク：
- 仕様変更や下位互換性の破壊
- キャッシュリーク
- MCP（Model Context Protocol）に認証や状態管理のルール化が必要です。
- 攻撃者がオープンモデルをマルウェアに組み込み、ローカル開発ツールをハイジャックして機密コンテキストを追跡します。

トランプ政権の米国政府AI取り組みと中国との関係 190-199スライド

トランプ政権はAI安全規制を大幅に緩和し、バイデン時代の規制をロールバックし、AIインフラに巨額の投資を計画しています。
「American AI Exports」戦略で、選定国にAIスタック（ハードウェア、モデル、クラウド、コンプライアンス）を輸出し、中国のデジタルシルクロードに対抗します。
州レベルのAI規制撤廃やオープンソースモデル推進により、米国の技術優位を維持します。
中国への高度AIチップ輸出は厳しく制限し、ライセンス制を導入します。
NVIDIAやAMDなど企業に対し、米国顧客優先供給を義務化（GAIN法）し、中国市場への販売には制約があります。
中国の代替品開発加速やグレーマーケット拡大が懸念

今後12か月の主要トレンド予測（304スライド）

AIエージェントによるオンライン販売の拡大
大手小売業者が、AIエージェントを使ったチェックアウトでオンライン売上の5%以上を達成し、AI広告費は50億ドルに到達。
AI研究のオープンソース化再加速
米国政府の支持を得るため、主要AI研究所がフロンティアモデルのオープンソース化を再推進。
オープンエージェントによる科学的発見
仮説から実験、論文まで、AIエージェントが科学研究をエンドツーエンドで達成。
深刻なAIサイバー攻撃
ディープフェイクやAIエージェントによる攻撃が、NATO/国連で初のAI安全保障緊急討議を引き起こす。
生成AIゲームの大ヒット
リアルタイム生成型ビデオゲームがTwitchで年間最も視聴されたタイトルに。
「AI中立性」外交政策の台頭
一部の国が主権AIを開発できず、AI中立性を外交ドクトリンとして採用。
AI映画の社会的影響
AIを活用した映画や短編作品が大きな観客評価を得る一方で、批判も発生。
中国研究所の台頭
中国の研究所が米国ラボを抜き、主要AIリーダーボードでトップを獲得。
データセンター問題が政治化
データセンター建設反対運動が米国で拡大し、選挙に影響。
AI規制を巡る米国政治の混乱
トランプが州レベルのAI法を禁止する大統領令を発令、最高裁が違憲判断。

おわりに

この記事では、STATE OF AI レポートについて紹介しました。
この記事がビジネスマンの方の参考になれば幸いです。