NISTからSPHへのコンバーター
オンラインでしかも無料でnistファイルをsphに変換
nist
sph
NISTをSPHへ変換する方法
コンピューター、Googleドライブ、Dropbox、URLからファイルを選ぶか、ページにドラッグして下さい.
sphもしくは必要な別のフォーマットを選ぶ(200種類以上のフォーマットが利用できます)
ファイルを変換すれば、すぐにsphファイルをダウンロードできます
フォーマットについて
NIST SPHERE(SPeech HEader REsources)は、アメリカ国立標準技術研究所がDARPA資金の音声研究プロジェクト向けに作成した特殊なオーディオファイル形式です。この形式は、サンプルレート、チャンネル数、エンコーディングタイプ、話者の属性、書き起こしアノテーションなどのメタデータをエンコードする構造化されたASCIIヘッダーで生のオーディオサンプルをラップし、音声コーパスの配布に最適です。NISTファイルは通常、電話品質のサンプルレート(8 kHzまたは16 kHz)で非圧縮PCMまたはmu-lawオーディオを格納しますが、コンテナはさまざまなエンコーディングを保持できる柔軟性があります。重要な利点は、研究者が詳細なコーパスメタデータをファイルに直接埋め込める豊富な自己文書化ヘッダーで、サイドカーファイルが不要になります。SPHEREはまた、TIMIT、Switchboard、Fisherコーパスなどの主要な音声データベースのデファクトスタンダードとなり、学術および政府の研究室全体で広く認知されています。オープンな仕様とコマンドラインツール(sphere、h_strip、w_decode)の利用可能性により、音声処理パイプラインでのファイルの変換、検査、処理が容易です。
SPHは、1990年頃に米国国立標準技術研究所が作成したNIST SPHERE(SPeech HEader REsources)形式で保存されたオーディオのファイル拡張子です。音声研究用に構築されたSPHファイルは、データベース識別子、チャンネル数、サンプルレート、バイトオーダー、圧縮タイプなどのメタデータが詰め込まれた1024バイトのASCIIヘッダーを持ち、すべての録音が自己記述的です。基盤となるオーディオは通常16 kHzで16ビットリニアPCMサンプリングですが、他の構成も許可されています。NIST、DARPA、および世界中の大学の研究者は、現代の自動音声認識システムの基盤となるTIMIT、Switchboard、LDCコレクションなどの音声コーパスの配布にSPHを使用しています。主な利点は、人間が読めるヘッダーにより、スクリプトがバイナリデコーディングなしに録音メタデータを解析できることです。形式の厳格な標準化により、機関やプラットフォーム間でデータセットを共有する際の曖昧さも排除されます。SPHファイルは非圧縮PCMを格納するため、完全なオーディオ忠実度が維持されます — 小さなアーティファクトでさえ結果を歪める可能性がある音響モデルのトレーニングにおいて重要です。