主要LLMの比較
はじめに
この記事ではOpenAIのGPTや、AnthropicのClaudeなどの主要モデルについて比較します。
AIサービス
モデル | 団体 | 設立 | 国 | Azure OpenAI | AWS Bedrock | Google Cloud Vertex AI | 備考 |
---|---|---|---|---|---|---|---|
GPT | OpenAI | 2015年12月11日 | 米国 | 〇 | × | × | GPTは「Generative Pre-trained Transformer」の略。2017年にGoogleが発表したLLM「Transformer」がベース。事前に大量のデータで訓練されたLLMを示す。 |
Claude | Anthropic | 2021年ごろ | 米国 | × | 〇 | 〇 | Claudeはフランス語圏に多い名前。 数学者クロード・シャノン(Claude Shannon)など |
機能要件
モデル名 | モデルID | 日本語対応 | マルチモーダル | コンテンツフィルター | Fuction Calling |
---|---|---|---|---|---|
GPT 3.5 | gpt-3.5-turbo-16k(0613) | 〇 | 〇 | 〇 | 〇 |
GPT-4 | gpt-4-32k(0613) | 〇 | 〇 | 〇 | 〇 |
GPT-4 Turbo Preview | gpt-4(0125-Preview) | 〇 | 〇 | 〇 | 〇 |
GPT-4 Turbo With Vision Preview | gpt-4(vision-Preview) | 〇 | 〇 | 〇 | 〇 |
Claude3 Sonnet | anthropic.claude-3-sonnet-20240229-v1:0 | 〇 | 〇 | - | 〇 |
Claude3 Opus | anthropic.claude-3-opus-20240229-v1:0 | 〇 | 〇 | - | 〇 |
非機能要件
モデル名 | モデルID | 入力トークンのコスト[1Kトークン当たり] | 出力トークンのコスト[1Kトークン当たり] | コンテキストウィンドウ | 最大トークン出力 | 1 分当たりのリクエスト数 (RPM) | 1 分当たりのトークン数 (TPM) | ナレッジカットオフ |
---|---|---|---|---|---|---|---|---|
GPT 3.5 | gpt-3.5-turbo-16k(0613) | $0.0015 | $0.0020 | 16.384K (16384) | 16,384 | - | 300K (300,000) ※1 | 2021年09月 |
GPT-4 | gpt-4-32k(0613) | $0.0600 | $0.1200 | 32.768K (32,768) | 32,768 | - | 80K(80,000) ※1 | 2021年09月 |
GPT-4 Turbo Preview | gpt-4(0125-Preview) | $0.0100 | $0.0300 | 128K (128,0000) | 4,096 | - | 150K (150,000) ※1 | 2023年12月 |
GPT-4 Turbo With Vision Preview | gpt-4(vision-Preview) | $0.0100 | $0.0300 | 128K (128,0000) | 4,096 | - | 30K (30,0000) ※1 | 2023年04月 |
Claude3 Sonnet | anthropic.claude-3-sonnet-20240229-v1:0 | $0.0030 | $0.0150 | 200K (2,00,000) | 4,096 | 500 | 1M (1,000,000) | 2023年08月 |
Claude3 Opus | anthropic.claude-3-opus-20240229-v1:0 | $0.0150 | $0.0750 | 400K (400,000) | 4,096 | 500 | 400K (400,000) | 2023年08月 |
※1: Azure OpenAIのスウェーデン北部リージョンの場合
マルチモーダル
モデル名 | モデルID | 画像ファイル種類 | 画像ファイルサイズ | 画像アップロード形式 | 画像ファイルの数 | トークン算出 |
---|---|---|---|---|---|---|
GPT 3.5 | gpt-3.5-turbo-16k(0613) | - | - | - | - | - |
GPT-4 | gpt-4-32k(0613) | - | - | - | - | - |
GPT-4 Turbo Preview | gpt-4(0125-Preview) | - | - | - | - | - |
GPT-4 Turbo With Vision Preview | gpt-4(vision-Preview) | PNG, JPEG, WEBP, GIF | 4 MB | Base64, URL | 10 | 85 ※1 : 解像度による |
Claude3 Sonnet | anthropic.claude-3-sonnet-20240229-v1:0 | PNG, JPEG, WEBP, GIF | 5 MB | Base64 | 20 | 1600※2 : 1600を超える場合は縮小 |
Claude3 Opus | anthropic.claude-3-sonnet-20240229-v1:0 | PNG, JPEG, WEBP, GIF | 5 MB | Base64 | 20 | 1600※2 : 1600を超える場合は縮小 |
※1: GPT 4 Turbo with Visionにおける画像ファイルのトークン算出
→ low :低解像度解析:1画像あたり85トークン → hight : 高解像度解析 : 画像のピクセルサイズによる異なる 固定の85トークンに加えて、使用するタイルごとのトークンが発生 1タイル=512×512ピクセル当たり:17トークン 計算先は消費トークン = 85 + 170 * n (※nはタイル数) → auto : 設定のため、低解像度と高解像度は自動判別
https://platform.openai.com/docs/guides/vision/calculating-costs https://community.openai.com/t/how-do-i-calculate-image-tokens-in-gpt4-vision/492318
参考
ナレッジカットオフ
クォーター制限
コンテンツフィルター
エラーコード
おわりに
この記事では、主要LLMについて、比較しました。
この記事がAIを学習されている方の参考になれば、幸いです。