OGG から NIST へのコンバーター

OGGオーディオからNIST SPHERE音声ファイルを生成

ここにファイルをドロップする. 1 GB ファイルサイズの最大限度 または サインアップ
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

音声研究の標準

NIST SPHEREは主要な音声処理ツールキットに必要な形式 — OGG録音から正しい形式のファイルを生成します。

コーパス対応出力

正しいヘッダーを持つSPHEREファイルを生成 — 音声認識トレーニングや言語分析にすぐに使用できます。

オンライン処理

音声ツールキットのインストール不要 — ブラウザから直接OGGをNIST SPHEREに変換できます。

OGGをNISTへ変換する方法

1

コンピューター、Googleドライブ、Dropbox、URLからファイルを選ぶか、ページにドラッグして下さい.

2

nistもしくは必要な別のフォーマットを選ぶ(200種類以上のフォーマットが利用できます)

3

ファイルを変換すれば、すぐにnistファイルをダウンロードできます

フォーマットについて

OGG Vorbisは、Xiph.Org Foundationが開発したOggコンテナ形式内のオープンでロイヤリティフリーの非可逆オーディオコーデックです。VorbisはMP3やAACの特許フリーの代替として設計され、フレームごとに信号の複雑さに適応する可変ビットレートエンコーディングと改良型離散コサイン変換(MDCT)コーディングを使用します。ブラインドリスニングテストでは、特に96-192 kbpsの範囲でVorbisがMP3に匹敵またはそれを超える知覚品質を提供することが一貫して示されています。形式は8 kHzから192 kHzのサンプルレートと1から255チャンネルをサポートし、モノ音声からサラウンドミックスまで網羅します。際立った利点はライセンス料の完全な不在です — ゲーム開発者、ストリーミングプラットフォーム、ハードウェアメーカーはロイヤリティの懸念なくVorbisを実装できます。Spotifyはまさにこの理由で長年Vorbisをプライマリストリーミングコーデックとして使用していました。この形式はまた低ビットレートでの品質劣化を多くの競合よりも優雅に処理するため、ストレージが限られ数千のサウンドエフェクトがスペースを競うビデオゲームで依然として人気があります。VLC、Firefox、Chrome、AndroidはすべてネイティブVorbisデコーディングを提供しています。
初回リリース: 2000年5月1日
NIST SPHERE(SPeech HEader REsources)は、アメリカ国立標準技術研究所がDARPA資金の音声研究プロジェクト向けに作成した特殊なオーディオファイル形式です。この形式は、サンプルレート、チャンネル数、エンコーディングタイプ、話者の属性、書き起こしアノテーションなどのメタデータをエンコードする構造化されたASCIIヘッダーで生のオーディオサンプルをラップし、音声コーパスの配布に最適です。NISTファイルは通常、電話品質のサンプルレート(8 kHzまたは16 kHz)で非圧縮PCMまたはmu-lawオーディオを格納しますが、コンテナはさまざまなエンコーディングを保持できる柔軟性があります。重要な利点は、研究者が詳細なコーパスメタデータをファイルに直接埋め込める豊富な自己文書化ヘッダーで、サイドカーファイルが不要になります。SPHEREはまた、TIMIT、Switchboard、Fisherコーパスなどの主要な音声データベースのデファクトスタンダードとなり、学術および政府の研究室全体で広く認知されています。オープンな仕様とコマンドラインツール(sphere、h_strip、w_decode)の利用可能性により、音声処理パイプラインでのファイルの変換、検査、処理が容易です。
初回リリース: 1990

よくある質問

OGGをNISTに変換するのはなぜですか?

NIST SPHEREは音声研究データセットの標準形式です。言語研究ツールやASRトレーニングパイプラインはSPHERE形式のオーディオを必要とします。

NISTファイルの用途は?

HTK、Kaldi、NIST音声評価ツール、学術的な音声研究コーパスがSPHEREを主要オーディオ形式として使用しています。

NISTとSPHEREは同じですか?

はい — NIST SPHERE(SPeech HEader Resources)は米国標準技術研究所(NIST)が音声研究用に定義した形式です。

NISTがサポートするサンプルレートは?

SPHEREファイルは一般的に8または16 kHzを使用 — 電話音声とワイドバンド音声研究の標準レートです。

OGGをNISTに一括変換できますか?

OGGの音声データセット全体をアップロードして一括でNIST SPHEREに変換 — 研究パイプラインに対応します。