SambaNova Cloud APIは、DeepSeek、Llama 4、3.3、3.2、3.1、およびQwen 2.5系などのモデルへのアクセスを提供しており、すべてフル精度で動作します。すべての利用プラン (ティア) で、すべてのモデルにアクセス可能です。

モデルの詳細

以下に、各モデルの比較を示します。モデル名、ID、開発元、コンテキスト長、Hugging Face上のモデルカードへのリンクなど、主要な情報が記載されています。

プレビューモデル

SambaNova Cloudのプレビューモデルは、主に評価目的のための早期アクセス提供として利用可能です。プレビュー段階では、利用可能な容量に制限がありますが、精度とパフォーマンスの面では本番同様に機能します。
開発元モデルIDコンテキスト長Hugging Faceへのリンク
DeepSeek
DeepSeek-V3-03248kトークンモデルカード
OpenAI
Whisper-Large-V3N/Aモデルカード
Meta
Llama-4-Scout-17B-16E-Instruct8kトークンモデルカード
Llama-4-Maverick-17B-128E-Instruct8kトークンモデルカード
Qwen
Qwen2-Audio-7B-InstructN/Aモデルカード

本番 (Production) モデル

本番モデルは、速度と品質に関する高い基準を満たし、本番環境での利用に適しています。
開発元モデルIDコンテキスト長Hugging Faceへのリンク
DeepSeek
DeepSeek-R116kトークンモデルカード
DeepSeek-R1-Distill-Llama-70B128kトークンモデルカード
Meta
Meta-Llama-3.3-70B-Instruct128kトークンモデルカード
Meta-Llama-3.2-3B-Instruct8kトークンモデルカード
Meta-Llama-3.2-1B-Instruct16kトークンモデルカード
Meta-Llama-3.1-405B-Instruct16kトークンモデルカード
Meta-Llama-3.1-8B-Instruct16kトークンモデルカード
Meta-Llama-Guard-3-8B8kトークンモデルカード
Qwen
QwQ-32B16kトークンモデルカード
東京科学大学
Llama-3.1-Swallow-8B-Instruct-v0.316kトークンモデルカード
その他
E5-Mistral-7B-Instruct4kトークンモデルカード