対応モデル

SambaNova Cloud APIは、DeepSeek、Llama 4、3.3、3.2、3.1、およびQwen 2.5系などのモデルへのアクセスを提供しており、すべてフル精度で動作します。すべての利用プラン (ティア) で、すべてのモデルにアクセス可能です。

モデルの詳細

以下に、各モデルの比較を示します。モデル名、ID、開発元、コンテキスト長、Hugging Face上のモデルカードへのリンクなど、主要な情報が記載されています。

SambaNova Cloudのプレビューモデルは、主に評価目的のための早期アクセス提供として利用可能です。プレビュー段階では、利用可能な容量に制限がありますが、精度とパフォーマンスの面では本番同様に機能します。

開発元	モデルID	コンテキスト長	Hugging Faceへのリンク
DeepSeek
	`DeepSeek-V3-0324`	8kトークン	モデルカード
OpenAI
	`Whisper-Large-V3`	N/A	モデルカード
Meta
	`Llama-4-Scout-17B-16E-Instruct`	8kトークン	モデルカード
	`Llama-4-Maverick-17B-128E-Instruct`	8kトークン	モデルカード
Qwen
	`Qwen2-Audio-7B-Instruct`	N/A	モデルカード

本番モデルは、速度と品質に関する高い基準を満たし、本番環境での利用に適しています。

開発元	モデルID	コンテキスト長	Hugging Faceへのリンク
DeepSeek
	`DeepSeek-R1`	16kトークン	モデルカード
	`DeepSeek-R1-Distill-Llama-70B`	128kトークン	モデルカード
Meta
	`Meta-Llama-3.3-70B-Instruct`	128kトークン	モデルカード
	`Meta-Llama-3.2-3B-Instruct`	8kトークン	モデルカード
	`Meta-Llama-3.2-1B-Instruct`	16kトークン	モデルカード
	`Meta-Llama-3.1-405B-Instruct`	16kトークン	モデルカード
	`Meta-Llama-3.1-8B-Instruct`	16kトークン	モデルカード
	`Meta-Llama-Guard-3-8B`	8kトークン	モデルカード
Qwen
	`QwQ-32B`	16kトークン	モデルカード
東京科学大学
	`Llama-3.1-Swallow-8B-Instruct-v0.3`	16kトークン	モデルカード
その他
	`E5-Mistral-7B-Instruct`	4kトークン	モデルカード