パラメータ | 型 | 説明 | デフォルト |
---|---|---|---|
model | String | 使用するモデルのID。 | 必須 |
prompt | String | 文字起こしのスタイルや語彙に影響を与えるプロンプト。例:「間や躊躇を含めて、注意深く文字起こしをしてください。」 | オプション |
temperature | Number | 0から1の間のサンプリング温度。高い値(例:0.8)はランダム性を増加させ、低い値(例:0.2)は出力をより焦点を絞ったものにします。 | 0 |
file | File | FLAC、MP3、MP4、MPEG、MPGA、M4A、Ogg、WAV、またはWebM形式の音声ファイル。ファイルサイズ制限は25MBです。 | 必須 |
response_format | String | 出力形式:JSONまたはテキスト。 | json |
language | String | 入力音声の言語。ISO-639-1形式(例:en)で入力言語を指定すると、精度とレイテンシーが向上します。 | 必須 |
パラメータ | 型 | 説明 | デフォルト |
---|---|---|---|
model | String | 使用するモデルのID。 | 必須 |
messages | Message | ロール(ユーザー/システム/アシスタント)、タイプ(テキスト/音声コンテンツ)、および音声コンテンツ(base64音声コンテンツ)を含むメッセージのリスト。 | 必須 |
response_format | 文字列 | 出力フォーマットはjsonまたはtextのいずれかです。 | json |
temperature | 数値 | 0から1の間のサンプリング温度。高い値(例:0.8)はランダム性を増加させ、低い値(例:0.2)は出力をより焦点を絞ったものにします。 | 0 |
max_tokens | 数値 | 生成するトークンの最大数。 | 1000 |
file | ファイル | FLAC、MP3、MP4、MPEG、MPGA、M4A、Ogg、WAV、またはWebM形式の音声ファイル。各単一ファイルは30秒を超えてはいけません。 | 必須 |
language | 文字列 | 文字起こしまたは翻訳の対象言語。 | オプション |
stream | 真偽値 | ストリーミングレスポンスを有効にします。 | false |
stream_options | オブジェクト | 追加のストリーミング設定(例:{“include_usage”: true})。 | オプション |