SambaNova Cloudでは、モデルごとに推論リクエストのレート制限を設けており、開発者が最速の推論体験を得られるように管理されています。

開発者ティア (Developer Tier)

開発者向けティアでのレート制限は以下の通りです。
アカウントに支払い方法が登録されている場合は「支払いおよびクレジット」の制限が適用され、支払い方法が登録されていない場合は「クレジットのみ」の制限が適用されます。詳細は請求 (Billing) ページをご覧ください。

プレビューモデル

SambaNova Cloudのプレビューモデルは、主に評価目的のための早期アクセス提供として利用可能です。プレビュー段階では、利用可能な容量に制限がありますが、精度とパフォーマンスの面では本番同様に機能します。
開発元モデルID1分あたりのリクエスト数 (RPM)1時間あたりのリクエスト数 (RPH)1日あたりのリクエスト数 (RPD)
DeepSeek
DeepSeek-V3-03241050600
OpenAI
Whisper-Large-V3201001200
Meta
Llama-4-Scout-17B-16E-Instruct402002400
Llama-4-Maverick-17B-128E-Instruct402002400
Qwen
Qwen2-Audio-7B-Instruct1050600

本番 (Production) モデル

本番モデルは、速度と品質に関する高い基準を満たし、本番環境での利用に適しています。
開発元モデルID1分あたりのリクエスト数 (RPM)1時間あたりのリクエスト数 (RPH)1日あたりのリクエスト数 (RPD)
DeepSeek
DeepSeek-R1201001200
DeepSeek-R1-Distill-Llama-70B703504200
Meta
Meta-Llama-3.3-70B-Instruct804004800
Meta-Llama-3.2-3B-Instruct1206007200
Meta-Llama-3.2-1B-Instruct1206007200
Meta-Llama-3.1-405B-Instruct301501800
Meta-Llama-3.1-8B-Instruct480240028800
Meta-Llama-Guard-3-8B603003600
Qwen
QwQ-32B201001200
東京科学大学
Llama-3.1-Swallow-8B-Instruct-v0.3603003600
その他
E5-Mistral-7B-Instruct301501800

その他のティアについて

Managed SubscriptionDedicatedティアにおけるレート制限については、営業担当までお問い合わせいただくか、コミュニティページよりご相談ください。お客様のプロジェクトに合わせて調整いたします。