
Grok 4 Fastとは、xAIが発表した新しいAIモデルです。
従来のGrok 4と比べ、性能の低下を抑えながら応答の高速化や低コスト化を実現しました。
AIモデルとして高い性能を誇りますが、公式サイトやXアプリなどを通じて多くの人が無料で利用できるようになっています。
この記事では、Grok 4 Fastの概要や使い方、サブスクやAPIを使う際の料金について解説します。
Grok 4 Fastとは?

xAIが開発したGrok 4 Fastは、同社のフラッグシップモデルであるGrok 4に匹敵する高い知能を持ちながら、速度とコスト効率を劇的に向上させた最先端の大規模言語モデルです。
このモデルは、リアルタイムでの対話や迅速な情報処理が求められる多様なアプリケーションへの組み込みを想定して設計されています。
高速な応答性能と高いコストパフォーマンスを両立させることで、AIの利用シーンを大きく広げる可能性を秘めています。
以降では、その具体的な特徴や性能、従来のモデルとの違いについて詳しく解説します。
特徴と仕様
Grok 4 Fastの最大の特徴の一つは、200万トークンという極めて大きなコンテキスト長です。
We’re also rolling out Grok 4 Fast as two models: grok-4-fast-reasoning and grok-4-fast-non-reasoning, each with a 2M token context window.
出典:Grok 4 Fast
これにより、数千ページに及ぶ長大な文書や数時間にわたる文字起こしデータ全体を一度に読み込み、文脈を維持したままの対話や分析が可能になります。
アーキテクチャ面では、深い思考を要する「reasoning」モードと、素早い応答を返す「non-reasoning」モードを単一のモデルで切り替えられる統合アーキテクチャを採用し、効率性を最大化しています。
Previously, separate reasoning modes required distinct models. Grok 4 Fast introduces a unified architecture where reasoning (long chain-of-thought) and non-reasoning (quick responses) are handled by the same model weights, steered via system prompts. This unification reduces end-to-end latency as well as token costs, making Grok 4 Fast ideal for real-time applications.
出典:Grok 4 Fast
さらに、Web検索やコード実行といった外部ツールを自律的に呼び出す能力が強化学習によって高度に訓練されており、常に最新かつ正確な情報に基づいた回答を生成できます。
Grok 4 Fast was trained end-to-end with tool-use reinforcement learning (RL). It excels at deciding when to invoke tools like code execution or web browsing.
For instance, Grok 4 Fast exhibits frontier agentic search capabilities, seamlessly browsing the web and X to augment queries with real-time data.
出典:Grok 4 Fast
従来のGrok 4との違い
Grok 4 Fastは品質重視のGrok 4と比較して、特に効率性の面で大きな違いがあります。
項目 | Grok 4 Fast | Grok 4 |
---|---|---|
API価格 | 入力:$0.20 出力:$0.50 | 入力:$3.00 出力:$15.00 |
最大コンテキスト長 | 200万トークン | 25万6千トークン |
推論モード | 統一 | 別々 |
代表用途 | 速さと効率重視の日常的タスク 長い文章を入力するタスク | 品質と深い思考が求められる専門的タスク |
最大の変化は思考トークン効率の向上で、Grok 4と同等のベンチマークスコアを達成しつつ、内部的な思考プロセスに要するトークン量を平均で40%削減しました。
In our evaluations, Grok 4 Fast achieves comparable performance to Grok 4 on benchmarks while using 40% fewer thinking tokens on average.
出典:Grok 4 Fast
この効率化は価格に直接反映されており、APIの利用価格は入力と出力ともに安価になっています。
また、最大コンテキスト長はGrok 4と比べてGrok 4 Fastが大幅に大きくなっており、より長い文章を入力可能です。
さらにGrok 4 Fastでは推論モードが統一され、深い思考を要する「reasoning」と、素早い応答を返す「non-reasoning」を同一モード内で切り替えられるようになりました。
Grok 4は高い推論能力を活かし、時間とコストをかけてでも最高の品質や深い分析を求める場面に向いています。
一方でGrok 4 Fastは、即時性が求められるインタラクティブな用途に最適であるほか、長文を入力する必要があるタスクにも向いています。

性能の見どころ
Grok 4 Fastの性能は、各種ベンチマークで証明されています。
例えば、大学レベルの数学能力を測るAIMEや、専門家レベルの知識を問うGPQA、大学レベルの高度な数学問題を扱うHMMTといった指標で、品質重視のGrok 4と遜色ない高いスコアを記録しています。


これらのベンチマークは、モデルの論理的推論能力や知識の深さを示すものです。
特に、Web検索能力を評価するBrowseCompなどではGrok 4を上回る結果を出しており、リアルタイムの情報検索や事実に基づいた回答生成が非常に得意であることがわかります。

一方で、極度に複雑で哲学的な問いなど、速度よりも思考の深さが求められるタスクではGrok 4に軍配が上がる可能性があります。
主なユースケース
その高速性と広大な文脈処理能力から、Grok 4 Fastは多様なユースケースで活躍します。
代表的なのは、最新情報に基づいた検索支援や対話型AIエージェントで、ユーザーの質問に対して即座に的確な回答を提供します。
GrokではWebだけでなくX(旧Twitter)の投稿内容も検索できるため、最新情報を幅広く取得可能です。
開発者にとっては、リアルタイムでのコード補助ツールとして、コード生成やデバッグ作業を大幅に効率化できます。
また、200万トークンのコンテキスト長を活かし、大量の契約書や研究論文を読み込ませて要約・分析させる調査自動化も最適な用途です。
その他、顧客サポートのチャットボットやコンテンツ生成など、速度とコストが重視されるあらゆる場面での活用が期待されます。
注意点・制約
Grok 4 Fastは非常に高性能な言語モデルですが、いくつかの注意点と制約があります。
まず、画像や動画を生成する機能は持っていません。あくまでテキストベースの対話や分析がその中核機能となります。
また、利用にあたっては、xAIが定めるAPIの利用規約を遵守しなければなりません。ユーザーは生成したコンテンツの所有権を持ちますが、同時に責任も負います。
You Own Your User Content. You may provide input (e.g., text, audio, images, video, code, files, folders, drives, etc.) to the Service (”Input”) and receive output from the Service based on the Input (”Output”). Collectively, Input and Output are “User Content.” You are responsible for User Content, including ensuring that it does not violate any applicable law or these Terms.
出典:Terms of Service – Consumer
出力を使用したり共有したりする前には、必ずレビューを行い、正確性を確かめるようにしましょう。
You are responsible for evaluating the Output for accuracy and appropriateness for your use, including using human review and supervision, before using or sharing Output.
出典:Terms of Service – Consumer
なお、GrokはXの情報を参照する傾向があるため、情報の偏りには注意が必要です。
他のAIモデルと同様に、事実に基づかない情報を生成するハルシネーションのリスクもあるため、重要な情報については自分でファクトチェックすることが推奨されます。

Grok 4 Fastの使い方

Grok 4 Fastは複数の媒体で使用できます。
ここでは、grok.comやX、APIで使う方法を解説します。
grok.comでGrok 4 Fastを使う方法
Grokを利用するのであれば、公式サイトのgrok.comから使うのが一番簡単です。
Grok 4 Fastを使う手順は以下の通りです。
画面右上の「サインイン」をクリックしてアカウントにサインインしましょう。

アカウントを持っていない場合はサインアップから始めます。
サインアップにはメールアドレスやXアカウント、Googleアカウントが使用できます。

なお、サインインしなくてもGrok 4 Fastは使用できますが、やり取りが保存されないため注意が必要です。
プロンプトを書く場所にあるプルダウンをクリックすると、使用できるモデル一覧が表示されます。

Grok 4 Fastを選択することで使用可能です。

XアプリでGrok 4 Fastを使う方法
GrokはXと統合されているため、Xアプリ上から使用することが可能です。
Xから使う手順は以下の通りです。
左のサイドバーから「Grok」を選びます。

画面上部のプルダウンをクリックするとモデルを選択できます。
モデル一覧の中からGrok 4 Fastを選びましょう。

これでGrok 4 Fastを使ってやり取りができます。
APIでGrok 4 Fastを使う方法
GrokはAPIを通して使用することもできます。
ここでは、公式のSDKを使用してGrok 4 Fastを使う手順をご説明します。
次にxAI APIコンソールのAPIキーページに移動し、APIキーを作成します。

「Create API key」をクリックします。

APIキーの名前や権限、レート制限を設定し、「Create API key」をクリックしましょう。

APIキーが生成されるため、コピーして安全な場所に保管しておきましょう。
ここで画面を閉じるとAPIキーは見られなくなるため注意してください。
作成したAPIキーをターミナル上で環境変数に設定するか、.env
ファイルに設定しましょう。
環境変数に設定する場合は以下のコマンドをターミナルで実行します。
export XAI_API_KEY="your_api_key" # Linux, Mac
set XAI_API_KEY="your_api_key" # Windows
.env
ファイルに設定する場合は以下の内容をファイルに書き込みます。
XAI_API_KEY="your_api_key"
APIキーを生成したときに初回リクエスト用のコードが表示されるため、そのコードを使用してテストしましょう。
以下のように回答が返ってくれば成功です。

なお、表示されるコードはLinux用のものであるため、Windowsの場合は\
を^
に変更し、JSONの内容をファイルに保存して以下のコマンドを実行しましょう。
curl https://api.x.ai/v1/chat/completions ^
-H "Content-Type: application/json" ^
-H "Authorization: Bearer %XAI_API_KEY%" ^
-d @<JSONファイル名>
実際に使用する際は、PythonやJavaScriptでAPIにリクエストを送るコードを作成します。
なお、コードを実行する前に以下のコマンドを実行してxai_sdk
をインストールしておきましょう。
pip install xai-sdk
今回は以下のようなPythonコードを実行しました。
import os
from xai_sdk import Client
from xai_sdk.chat import user, system
client = Client(
api_key=os.getenv("XAI_API_KEY"),
timeout=3600,
)
chat = client.chat.create(model="grok-4-fast")
chat.append(system("あなたは有能なアシスタントです。"))
chat.append(user("人生、宇宙、すべての意味は何ですか?"))
response = chat.sample()
print(response.content)
model
には使用するモデルとして、grok-4-fast
を指定しています。
なお、推論モデルを指定したい場合はgrok-4-fast-reasoning
、非推論モデルを指定したい場合はgrok-4-fast-non-reasoning
をmodel
に指定しましょう。
このコードを実行すると、以下のような回答が返ってきました。

モデル使い分け指針
APIを使う場合、推論モデルのreasoning
と非推論モデルのnon-reasoning
を選択できます。
reasoning
は数学問題、コード生成、多段階の論理分析などの複雑な推論タスクや、速度よりも品質を優先する場合に向いています。
一方non-reasoning
はチャット、要約、基本的な検索などのシンプルなクエリや高速応答が必要な場合に向いています。
また、2つのモデルはAPI料金こそ変わりませんが、reasoning
は思考トークンが追加で消費されるため、トータルのコストが高くなります。
そのため、なるべくコストを抑えたい場合にもnon-reasoning
を使うのがいいでしょう。
実際の使い方サンプル
ここでは、実際の使い方としてプロンプトの例を示します。
Grok 4 Fastでは情報を検索してまとめるタスクを実行可能です。
プロンプト例を以下に示します。
現在、大阪で開催されているフードイベントや期間限定のポップアップストアについて教えてください。特に、今週末(2025年10月4日〜5日)に訪問可能で、最寄り駅が梅田駅か難波駅のものを3つリストアップし、それぞれの特徴と営業時間を簡潔にまとめてください。
このプロンプトを入力して得られた回答がこちらです。

検索を含めて約1分でタスクを完了できていました。
また、ユーザーのコーディング補助も行うことができます。
例として今回は以下のようなプロンプトを入力しました。
あなたは経験豊富なPython開発者です。
Pandas DataFrameから特定の条件を満たす行を抽出し、その結果を新しいCSVファイルとして保存する関数を作成してください。
# 仕様
- 関数名: `filter_and_save_csv`
- 引数:
1. `df`: 操作対象のPandas DataFrame
2. `column_name`: フィルタリング対象の列名 (文字列)
3. `threshold`: フィルタリングの閾値 (数値)
4. `output_path`: 保存するCSVのパス (文字列)
- 処理内容:
- `column_name`で指定された列の値が`threshold`よりも大きい行のみを抽出する。
- 抽出した結果を、インデックスなしで`output_path`にCSVとして保存する。
- その他:
- 型ヒントを必ず使用してください。
- 関数には適切なDocstringを記述してください。
実際に生成されたコードがこちらです。
import pandas as pd
from typing import Union
def filter_and_save_csv(
df: pd.DataFrame,
column_name: str,
threshold: Union[float, int],
output_path: str
) -> None:
"""
指定された列の値が閾値よりも大きい行を抽出し、CSVファイルとして保存する。
Parameters
----------
df : pd.DataFrame
操作対象のPandas DataFrame。
column_name : str
フィルタリング対象の列名。
threshold : Union[float, int]
フィルタリングの閾値。列の値がこれよりも大きい行を抽出。
output_path : str
保存するCSVファイルのパス。
Returns
-------
None
Notes
-----
- 抽出された行が0行の場合、空のCSVファイルが保存されます。
- インデックスは保存されません。
"""
filtered_df = df[df[column_name] > threshold]
filtered_df.to_csv(output_path, index=False)
なお、この回答の生成にかかった時間は約3秒であり、高速で生成できていることが分かります。

他にも、情報の要約や比較を行うことも可能です。
xAIの「Grok-4」と「Grok-4-Fast」の2つのモデルについて、以下の観点から違いを比較し、結果を表形式(マークダウン)でまとめてください。
# 比較観点
- 主なターゲット用途
- パフォーマンス(得意なタスク)
- コスト効率
- 応答速度(レイテンシ)
このプロンプト例では、約23秒で以下のような回答が得られました。

Grok 4 Fastの料金体系

最後に、Grok 4 Fastを使う際の料金についてご紹介します。
Grok 4 Fastは基本的に無料で利用できますが、使用量を増やしたい場合やAPIを使う場合には支払いが必要となります。
サブスクリプション料金
Xやgrok.comから使用する場合、サブスクリプションに契約することで利用上限を引き上げることができます。
Grokの有料プランであるSuperGrokの他、Xの有料プランであるプレミアムやプレミアムプラスでもGrokの利用上限が引き上げられます。
プランとそれぞれの料金体系は以下のようになっています。
提供媒体 | プラン | 月額料金 | 年払い料金 | 主な特徴 |
---|---|---|---|---|
grok.com | 基本 | 無料 | 無料 | 各モデルへのアクセス制限 画像生成 音声アクセス |
SuperGrok | $30 | $300 | Grok 3へのアクセス増加 Grok 4へのアクセス増加 拡張メモリ(128,000トークン) 優先音声アクセス | |
SuperGrok ヘビー | $300 | $3,000 | Grok 3への無制限アクセス Grok 4へのアクセス増加 最長メモリ(256,000トークン) 新機能への早期アクセス | |
X | ベーシック | 368円 | 3,916円 | ポストの編集 長いポストや長い動画のアップロード 返信の上位表示 |
プレミアム | 980円 | 10,280円 | Grokの利用上限引き上げ 広告数の削減 広告収益配分の申請へのアクセス クリエイターサブスクリプション | |
プレミアムプラス | 6,080円 | 60,040円 | Grokの利用上限のさらなる引き上げ X上での広告の非表示 返信のブースト |
SuperGrokプランはGrokに特化したプランであり、頻繁にGrokを使用する方におすすめです。
一方Xの有料プランは、Xの使い勝手向上が主な特徴ですが、プレミアムでGrokの利用上限が引き上げられ、プレミアムプラスではさらに引き上げられます。
そのため、普段からXもよく使っているという方は、これらのプランも検討の余地があります。
ただし、ベーシックプランは上限引き上げが明記されていないためご注意ください。
APIの従量課金
APIを使用する場合は、使用するトークン数による従量課金となります。
Grok 4 FastのAPI料金設定は以下のようになっています。
比較としてGrok 4の料金設定も示しています。
モデル | 機能 | 料金 (100万トークンあたり) |
---|---|---|
Grok 4 Fast | 128kトークン未満 (/100万トークン) | 入力:$0.20 キャッシュされた入力:$0.05 出力:$0.50 Live Search:$25/1,000ソース |
128kトークン以上 (/100万トークン) | 入力:$0.40 キャッシュされた入力:$0.05 出力:$1.00 Live Search:$25/1,000ソース | |
Grok 4 | 128kトークン未満 (/100万トークン) | 入力:$3.00 キャッシュされた入力:$0.75 出力:$15.00 Live Search:$25/1,000ソース |
128kトークン以上 (/100万トークン) | 入力:$6.00 キャッシュされた入力:$0.75 出力:$30.00 Live Search:$25/1,000ソース |
Grok 4と比べ、Grok 4 Fastの料金設定はかなり安くなっていることが分かります。
また、入出力の料金に加え、Live Search機能を使う際は追加の課金が必要となります。
なお、Grok 4 Fastはレート制限として1分あたりのリクエスト数は480、1分あたりのトークン数は4,000,000までとなっています。
無料で試す方法
Grok 4 Fastは、grok.comやXから無料で使用することができます。
また、APIは基本的に課金が必要ですが、2025年9月現在では期間限定でOpenRouterとVercel AI Gatewayを通して無料で利用可能です。
For a limited time, Grok 4 Fast will be available for free on OpenRouter and Vercel AI Gateway.
出典:Grok 4 Fast
どちらのサイトでもログイン後にAPIキーを作成できます。


APIを使ってGrok 4 Fastを試したいときにはこれらのサービスを利用することをおすすめします。
コスト最適化の実践
Grok 4 FastのAPIコストを最適化するには、いくつかの方法があります。
まず、最も効果的なのはキャッシュの活用です。
Grokは一度処理した入力をキャッシュし、再利用時のトークン単価を通常の4分の1に抑えるため、繰り返し同じ文脈を与える処理でコストを大幅に削減できます。
次に、プロンプトに入出力例を含めるfew-shot学習において例を最小限にし、指示を簡潔化するプロンプト短縮も有効です。
さらに、長いプロンプトや大量のデータを一度に送るのではなく、関連するタスクごとにリクエストを分割することで、不要なトークン消費を避けられます。
APIを使用する際にはこのようなコスト管理を行うことが大切です。
まとめ
Grok 4 Fastは、Grok 4の高い性能を引き継ぎつつも応答の高速化と低コスト化を実現したモデルです。
すべてのユーザーが無料で利用でき、API料金も従来のGrok 4と比べて大幅に安くなっています。
応答までの時間が速いため、特にリアルタイムでの応答を必要とする場面で活用できるでしょう。
期間限定でAPIを無料で試すこともできるため、気になる方は早めに確認しておくことをおすすめします。