WMA から NIST へのコンバーター

WMAオーディオからNIST SPHERE音声ファイルを作成

ここにファイルをドロップする. 1 GB ファイルサイズの最大限度 または サインアップ
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

音声研究

NIST SPHEREはASRの標準 — WMAを研究パイプライン用に変換します。

コーパス対応

音声認識トレーニング用の正しいヘッダ付きSPHEREを生成します。

オンライン処理

ツールキット不要 — ブラウザでWMAをNISTに変換できます。

WMAをNISTへ変換する方法

1

コンピューター、Googleドライブ、Dropbox、URLからファイルを選ぶか、ページにドラッグして下さい.

2

nistもしくは必要な別のフォーマットを選ぶ(200種類以上のフォーマットが利用できます)

3

ファイルを変換すれば、すぐにnistファイルをダウンロードできます

フォーマットについて

WMA(Windows Media Audio)は、Microsoftが開発しWindows Mediaフレームワークの一部として1999年に初めてリリースされた独自オーディオコーデックファミリーです。MP3やAACに対抗するために作られたWMA Standardは、Microsoftが64 kbpsという低いビットレートでCD品質に近い音質を実現すると主張した知覚コーディングを使用します — MP3が同等の結果を得るために通常必要とするデータレートの約半分です。コーデックファミリーはサラウンドサウンドとハイレゾオーディオ用のWMA Professional、ビットパーフェクトなアーカイブ圧縮用のWMA Lossless、非常に低いビットレートでの音声コンテンツに最適化されたWMA Voiceへと拡大しました。Windows、Windows Media Player、Zuneエコシステムとの深い統合により、2000年代を通じてWMAに強力な配布上の優位性を与え、デジタル著作権管理(DRM)サポートはその時代のオンライン音楽ストアにとって魅力的でした。エンコーディングとデコーディングはWindowsでネイティブに処理され、Windowsマシンでの再生にサードパーティソフトウェアは不要です。クロスプラットフォームサポートはFFmpegやGStreamerなどのライブラリを通じて改善されましたが、Microsoft以外のデバイスではWMAはMP3やAACほど普遍的に互換性がありません。この形式はレガシーメディアライブラリにまだ見られますが、ストリーミングやポータブル使用には新しいコーデックが大部分で取って代わっています。
初回リリース: 1999
NIST SPHERE(SPeech HEader REsources)は、アメリカ国立標準技術研究所がDARPA資金の音声研究プロジェクト向けに作成した特殊なオーディオファイル形式です。この形式は、サンプルレート、チャンネル数、エンコーディングタイプ、話者の属性、書き起こしアノテーションなどのメタデータをエンコードする構造化されたASCIIヘッダーで生のオーディオサンプルをラップし、音声コーパスの配布に最適です。NISTファイルは通常、電話品質のサンプルレート(8 kHzまたは16 kHz)で非圧縮PCMまたはmu-lawオーディオを格納しますが、コンテナはさまざまなエンコーディングを保持できる柔軟性があります。重要な利点は、研究者が詳細なコーパスメタデータをファイルに直接埋め込める豊富な自己文書化ヘッダーで、サイドカーファイルが不要になります。SPHEREはまた、TIMIT、Switchboard、Fisherコーパスなどの主要な音声データベースのデファクトスタンダードとなり、学術および政府の研究室全体で広く認知されています。オープンな仕様とコマンドラインツール(sphere、h_strip、w_decode)の利用可能性により、音声処理パイプラインでのファイルの変換、検査、処理が容易です。
初回リリース: 1990

よくある質問

WMAをNISTに変換する理由は?

NIST SPHEREはKaldiやHTKなどの音声認識ツールキットの必須入力形式です。これらのパイプラインはWMAを完全に拒否するため、トレーニングや評価の前にSPHEREへの変換が必要です。

NIST SPHEREを使用する音声処理ツールは?

Kaldi、HTK、CMU Sphinx、NIST評価ツール、多くの大学研究フレームワークがSPHERE入力を期待しています。世界的な音声コーパス配布のデファクトスタンダードです。

NISTはSPHやSPHEREと同じですか?

はい — NIST、SPH、SPHEREはすべて同じフォーマット、NISTが開発したSPeech HEader REsourcesを指します。拡張子は異なる場合がありますが内部構造は同一です。

変換でASR用の音声品質は保たれますか?

NIST SPHEREはPCMオーディオを格納するため、デコードされたWMA内容は追加圧縮なしに転送されます。認識精度はソース品質に依存し、変換時に保持されます。

WMAデータセット全体を一括でNISTへ変換できますか?

はい — WMA録音の全セットをアップロードすると、Convertioが各ファイルのNIST SPHEREファイルを同時に生成します。研究パイプラインですぐ使えるよう個別またはアーカイブでダウンロードできます。