GeminiのAPI料金プランを徹底解説!〜各モデルの比較表付き〜
.png%3Fw%3D800%26h%3D450&w=1280&q=75)
この記事でわかること
GeminiをAPIで利用できるモデルの種類、料金プランについて5分で理解できます。
目次
はじめに
Googleが提供するGeminiは、高度な言語理解と生成能力で注目を集める生成AIです。
そんなGeminiには、APIが提供されており、様々なモデルと料金プランが用意されています。
本記事では、
Gemini APIで利用できるモデルの種類、無料枠を含む料金プランを比較し、その違い
を分かりやすく解説します。
API導入を検討する際の参考として、ぜひ最後までお読みください。
1. Gemini APIで利用できる主要なモデル
GeminiのAPIでは、様々なモデルを提供しています。
モデル更新のスピードが速いため、下記情報は、2024年12月時点での情報になります。
以下は主要なモデルです。
- Gemini 1.5 Pro:
高度な推論能力を誇り、テキスト、画像、音声、動画など多様なデータを処理できます。最大200万トークンのコンテキストウィンドウを備えています。
- Gemini 1.5 Flash:
高速かつ効率的な軽量モデル。サブ秒の初回トークン遅延を実現し、長文の理解にも優れています。
- Gemini 1.5 Flash-8B:
Gemini 1.5 Flashの軽量版。更なる高速化とコスト削減を実現し、チャットや音声文字変換、長文翻訳などに適しています。
- Gemini 1.0 Pro:
初期のプロフェッショナルモデル。主にテキストデータの処理に特化しています。
それぞれのモデルは、異なる強みと価格帯となっています。
APIでの利用は、プロジェクトの要件と予算に合わせて、最適なモデルを選ぶことが重要です。
2. トークンとは?
Gemini APIは、「トークンベースの従量課金制」を採用しています。
「トークン」とはテキストデータの量を表す単位で、
英語では単語や句読点などが1トークンに相当します。
日本語のような言語では、英語に比べて1文あたりのトークン数が多くなる傾向があります。
ざっくりとした概算として、日本語およそ500~750ワードで1000トークンになると言われています。
また、APIのトークン利用量は基本的に、
①入力されたトークン量(入力トークン)
②応答によって出力されたトークン量(出力トークン)
の2つに基づいて計算されます。
(※モデルによりコンテキストキャッシュがかかる場合があります)
3. コンテキストキャッシュとは?
Gemini APIでは、「コンテキストキャッシュ」機能を利用できます。
コンテキストキャッシュとは、一度モデルに渡した入力データ(トークン)を保存し、再利用することができます。
これにより、「コスト削減」と「処理速度の向上」を実現できます。
現段階では、コンテキストキャッシュは
「Gemini 1.5 Pro」と「Gemini 1.5 Flash」のみ利用可能です。
4. 各モデルの料金プランと無料枠
Gemini APIは、全モデルに無料枠が設けられています。
そのため、無料枠内での利用は料金がかからず、
無料枠を超過する分のみ従量課金として料金が発生する仕組みになっています。
各モデルごとに無料枠と従量課金制のプランが異なります。
以下に、各モデルごとの無料枠と従量課金プランをまとめました。
(2024年12月時点の情報です)
Gemini 1.5 Flash
項目 | 無料枠 | 従量課金制(128,000トークン以下のプロンプト) | 従量課金制(128,000トークンを超えるプロンプト) |
レート制限 | 15 RPM / 100万 TPM / 1,500 RPD | 2,000 RPM / 400万 TPM | 同左 |
入力料金 | 無料 | $0.075 / 100万トークン | $0.15 / 100万トークン |
出力料金 | 無料 | $0.30 / 100万トークン | $0.60 / 100万トークン |
コンテキストキャッシュ保存 | 1時間あたり最大100万トークン無料 | $0.01875 / 100万トークン | $0.0375 / 100万トークン |
コンテキストキャッシュ(ストレージ) | - | $1.00 / 100万トークン/時間 | $1.00 / 100万トークン/時間 |
チューニング料金 | 無料 | 無料 | 無料 |
Gemini 1.5 Flash-8B
項目 | 無料枠 | 従量課金制(128,000トークン以下のプロンプト) | 従量課金制(128,000トークンを超えるプロンプト) |
レート制限 | 15 RPM / 100万 TPM / 1,500 RPD | 4,000 RPM / 400万 TPM | 同左 |
入力料金 | 無料 | $0.0375 / 100万トークン | $0.075 / 100万トークン |
出力料金 | 無料 | $0.15 / 100万トークン | $0.30 / 100万トークン |
コンテキストキャッシュ保存 | 1時間あたり最大100万トークン無料 | $0.01 / 100万トークン | $0.02 / 100万トークン |
コンテキストキャッシュ(ストレージ) | - | $0.25 / 100万トークン/時間 | $0.25 / 100万トークン/時間 |
チューニング料金 | 無料 | 無料 | 無料 |
Gemini 1.5 Pro
項目 | 無料枠 | 従量課金制(128,000トークン以下のプロンプト) | 従量課金制(128,000トークンを超えるプロンプト) |
レート制限 | 2 RPM / 32,000 TPM / 50 RPD | 1,000 RPM / 400万 TPM | 同左 |
入力料金 | 無料 | $1.25 / 100万トークン | $2.50 / 100万トークン |
出力料金 | 無料 | $5.00 / 100万トークン | $10.00 / 100万トークン |
コンテキストキャッシュ保存 | 該当なし | $0.3125 / 100万トークン | $0.625 / 100万トークン |
コンテキストキャッシュ(ストレージ) | - | $4.50 / 100万トークン/時間 | $4.50 / 100万トークン/時間 |
チューニング料金 | 利用不可 | 利用不可 | 利用不可 |
Gemini 1.0 Pro
項目 | 無料枠 | 従量課金制 |
レート制限 | 15 RPM / 32,000 TPM / 1,500 RPD | 360 RPM / 120,000 TPM / 30,000 RPD |
入力料金 | 無料 | $0.50 / 100万トークン |
出力料金 | 無料 | $1.50 / 100万トークン |
コンテキストキャッシュ | 該当なし | 利用不可 |
チューニング料金 | 利用不可 | 利用不可 |
無料枠には、
①RPM: 1分あたりのリクエスト数
②TPM: 1分あたりのトークン数
③RPD: 1日あたりのリクエスト
の3つの制限があります。
例えば「Gemini 1.5 Flash」の場合、
1分あたり15回のリクエスト、100万トークンの利用、1日の合計が1500回リクエストまで利用することができます。
この無料枠は非常にありがたい仕組みです。
「Gemini 1.5 Flash」「Gemini 1.5 Flash-8B」は、最もコストに優れており、採用しやすいモデルです。
一方、「Gemini 1.5 Pro」は料金が高いものの、高度な推論能力を誇り、テキスト、画像、音声、動画など多様なデータを処理できます。
利用用途に合わせて、
「各モデルの性能」や「料金(コスト)」を考慮してモデルを選ぶことが重要になります。
(※料金や仕様は変更される可能性があるので、最新の情報は公式ドキュメントをご確認ください。)
.png)
公式サイト:
https://ai.google.dev/pricing?hl=ja#1_5flash
5. まとめ
今回は、Gemini APIで利用できるモデル、無料枠を含む料金プランについて解説しました。
Gemini APIは様々なモデルとプランを提供しており、それぞれ機能と価格が異なります。
そのため、利用用途に合わせてモデルを選択する必要があります。
本記事が、API導入を検討する際の参考になれば幸いです。