OPUS to NIST コンバーター
OPUSからNIST SPHERE音声研究ファイルを作成
opus
nist
音声研究標準
NIST SPHEREはASRツールキットに必須 — OPUS録音から正しくフォーマットされたファイルを生成します。
コーパス対応出力
音声認識トレーニングと分析用の正しいヘッダーを持つSPHEREファイルを生成します。
オンライン処理
ツールキットのインストール不要 — ブラウザでOPUSをNIST SPHEREに変換できます。
OPUSをNISTへ変換する方法
コンピューター、Googleドライブ、Dropbox、URLからファイルを選ぶか、ページにドラッグして下さい.
nistもしくは必要な別のフォーマットを選ぶ(200種類以上のフォーマットが利用できます)
ファイルを変換すれば、すぐにnistファイルをダウンロードできます
フォーマットについて
Opusは、2012年にIETFによってRFC 6716として標準化された、多用途でオープンなオーディオコーデックです。音声用のSILKと音楽用のCELTという2つのコーディングアプローチを1つのアルゴリズムに融合し、コンテンツタイプとビットレートに基づいてそれらの間をブレンドします。このハイブリッド設計により、Opusは幅広い用途でほぼすべての他のコーデックを凌駕します — 6 kbpsでの低遅延音声、128 kbpsでの高忠実度音楽、そしてその間のすべてに対応します。6から510 kbpsのビットレート、最大48 kHzのサンプルレート、2.5 msまでの小さなフレームサイズをサポートし、主流のオーディオコーデックの中で最も低いアルゴリズム遅延を実現しています。3つの利点がOpusを特に魅力的にしています。完全にロイヤリティフリーかつオープンソースで、プロプライエタリコーデックを妨げるライセンス障壁を排除しています。MP3の約半分のビットレートで透明な品質を達成し、同等のレートではAACを上回ります。そして、その低遅延によりWebRTCの必須コーデックとなり、すべての最新ブラウザにOpusデコーダーが搭載されています。WhatsApp、Discord、Zoom、YouTubeはすべてリアルタイムオーディオにOpusを使用しています。
NIST SPHERE(SPeech HEader REsources)は、アメリカ国立標準技術研究所がDARPA資金の音声研究プロジェクト向けに作成した特殊なオーディオファイル形式です。この形式は、サンプルレート、チャンネル数、エンコーディングタイプ、話者の属性、書き起こしアノテーションなどのメタデータをエンコードする構造化されたASCIIヘッダーで生のオーディオサンプルをラップし、音声コーパスの配布に最適です。NISTファイルは通常、電話品質のサンプルレート(8 kHzまたは16 kHz)で非圧縮PCMまたはmu-lawオーディオを格納しますが、コンテナはさまざまなエンコーディングを保持できる柔軟性があります。重要な利点は、研究者が詳細なコーパスメタデータをファイルに直接埋め込める豊富な自己文書化ヘッダーで、サイドカーファイルが不要になります。SPHEREはまた、TIMIT、Switchboard、Fisherコーパスなどの主要な音声データベースのデファクトスタンダードとなり、学術および政府の研究室全体で広く認知されています。オープンな仕様とコマンドラインツール(sphere、h_strip、w_decode)の利用可能性により、音声処理パイプラインでのファイルの変換、検査、処理が容易です。
よくある質問
なぜOPUSをNISTに変換するのですか?
NIST SPHEREは主要な音声処理ツールキットに必須のフォーマットです。言語研究やASRトレーニングにはSPHEREフォーマットの入力が必要です。
NISTを使用するソフトは?
HTK、Kaldi、NIST音声評価ツール、学術コーパスがSPHEREを主要オーディオフォーマットとして使用しています。
NISTとSPHは同じですか?
はい — どちらもNational Institute of Standards and Technologyが定義したSPHERE(SPeech HEader Resources)を指します。
使用されるサンプルレートは?
SPHEREは通常8または16 kHzを使用 — 電話音声と広帯域音声研究の標準レートです。
一括変換できますか?
OPUS音声データセット全体をアップロードし、NIST SPHEREに一括変換できます。