WAV to NIST コンバーター

WAV音声を研究用NIST Sphereにフォーマット変換

ここにファイルをドロップする. 1 GB ファイルサイズの最大限度 または サインアップ
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

研究標準フォーマット

NIST Sphereは音声コーパスのゴールドスタンダード — WAV録音をASRや言語研究で直接使用できるよう変換します。

コーパスメタデータ

NISTヘッダーには話者・チャンネル・録音条件のメタデータが含まれ、音声研究データセットの整理・管理に不可欠です。

データセット準備

WAV音声コーパス全体を一度にNISTフォーマットに変換 — 研究データパイプラインを効率化できます。

WAVをNISTへ変換する方法

1

コンピューター、Googleドライブ、Dropbox、URLからファイルを選ぶか、ページにドラッグして下さい.

2

nistもしくは必要な別のフォーマットを選ぶ(200種類以上のフォーマットが利用できます)

3

ファイルを変換すれば、すぐにnistファイルをダウンロードできます

フォーマットについて

WAV(Waveform Audio File Format)は、MicrosoftとIBMが共同開発した非圧縮オーディオコンテナで、1991年8月にWindows 3.1とともに初めて公開されました。Resource Interchange File Format(RIFF)上に構築されたWAVは、オーディオデータ — 最も一般的にはリニアパルス符号変調(LPCM) — をサンプルレート、ビット深度、チャンネル数を記述するメタデータとともに格納します。この直感的な構造により、WAVはWindows上の非圧縮オーディオのデファクトスタンダードとなり、事実上すべてのオペレーティングシステム、オーディオエディタ、メディアプレーヤーで普遍的に受け入れられる交換形式となりました。CD品質のWAVファイルは44.1 kHzステレオの16ビットサンプルを使用し、プロフェッショナルワークフローでは最大192 kHzで24ビットまたは32ビット浮動小数点サンプルが日常的に使用されています。主な利点はゼロロスの忠実度です — 標準のWAVは圧縮を適用しないため、保存されたデータはオリジナルの録音の正確なデジタル表現であり、マスタリングやアーカイブに最適な選択肢です。WAVはまたINFOおよびBWFチャンクによる埋め込みメタデータをサポートし、タイムスタンプや制作ノートを可能にします。主なトレードオフはファイルサイズで、CD品質ステレオの1分間は約10 MBを占め、32ビットRIFF構造は4 GBの制限を課しますが、RF64によってその上限は解除されます。
開発元: Microsoft and IBM
初回リリース: 8月 1991
NIST SPHERE(SPeech HEader REsources)は、アメリカ国立標準技術研究所がDARPA資金の音声研究プロジェクト向けに作成した特殊なオーディオファイル形式です。この形式は、サンプルレート、チャンネル数、エンコーディングタイプ、話者の属性、書き起こしアノテーションなどのメタデータをエンコードする構造化されたASCIIヘッダーで生のオーディオサンプルをラップし、音声コーパスの配布に最適です。NISTファイルは通常、電話品質のサンプルレート(8 kHzまたは16 kHz)で非圧縮PCMまたはmu-lawオーディオを格納しますが、コンテナはさまざまなエンコーディングを保持できる柔軟性があります。重要な利点は、研究者が詳細なコーパスメタデータをファイルに直接埋め込める豊富な自己文書化ヘッダーで、サイドカーファイルが不要になります。SPHEREはまた、TIMIT、Switchboard、Fisherコーパスなどの主要な音声データベースのデファクトスタンダードとなり、学術および政府の研究室全体で広く認知されています。オープンな仕様とコマンドラインツール(sphere、h_strip、w_decode)の利用可能性により、音声処理パイプラインでのファイルの変換、検査、処理が容易です。
初回リリース: 1990

よくある質問

WAVをNISTに変換するのはなぜですか?

NIST SphereはASR研究で使用される音声コーパスの標準フォーマットです。TIMIT・Switchboard・LDCリリースなどのデータセットがNISTフォーマットを使用しています。

NISTファイルを読み込めるソフトウェアは?

Kaldi、HTK、Praat、SoX、および主要な音声認識ツールキットがNIST Sphereファイルをネイティブでサポートしています。

NISTはどのようなメタデータを持ちますか?

NISTヘッダーには話者ID・録音条件・チャンネル情報などの音声コーパス管理に不可欠なフィールドが含まれます。

NISTはロスレスですか?

NIST SphereはリッチなメタデータヘッダーとともにPCM音声を格納します。WAVからの音声変換は完全にロスレスです。

データセット全体を変換できますか?

すべてのWAV音声録音をアップロードしてNIST Sphereに一括変換 — 完全な研究コーパスを効率的に準備できます。

WAV〜NIST品質評価

5.0 (5投票)
フィードバックを提供するには、少なくとも1つのファイルを変換してダウンロードする必要があります!