SPHからSPXへのコンバーター
オンラインでしかも無料でsphファイルをspxに変換
sph
spx
設定
自動
Speexの全体的な出力オーディオビットレートを設定します。人間の音声のエンコーディング用に設計されたSpeexは、超低ビットレートで透明度を実現し、最大ビットレートは44 kbpsです。
自動 (変更なし)
オーディオチャンネル数を設定します。この設定は、チャンネルをダウンミックスするとき(例えば、5.1からステレオへ)に最も便利です。
自動 (変更なし)
オーディオのサンプルレートを設定します。フルスペクトル(20 Hz~20 kHz)の音楽では、透明度を得るために44.1 kHzより大きな値が必要です。詳細は ウィキ をご参照ください。
sph
SPHは、1990年頃に米国国立標準技術研究所が作成したNIST SPHERE(SPeech HEader REsources)形式で保存されたオーディオのファイル拡張子です。音声研究用に構築されたSPHファイルは、データベース識別子、チャンネル数、サンプルレート、バイトオーダー、圧縮タイプなどのメタデータが詰め込まれた1024バイトのASCIIヘッダーを持ち、すべての録音が自己記述的です。基盤となるオーディオは通常16 kHzで16ビットリニアPCMサンプリングですが、他の構成も許可されています。NIST、DARPA、および世界中の大学の研究者は、現代の自動音声認識システムの基盤となるTIMIT、Switchboard、LDCコレクションなどの音声コーパスの配布にSPHを使用しています。主な利点は、人間が読めるヘッダーにより、スクリプトがバイナリデコーディングなしに録音メタデータを解析できることです。形式の厳格な標準化により、機関やプラットフォーム間でデータセットを共有する際の曖昧さも排除されます。SPHファイルは非圧縮PCMを格納するため、完全なオーディオ忠実度が維持されます — 小さなアーティファクトでさえ結果を歪める可能性がある音響モデルのトレーニングにおいて重要です。
続きを読む
spx
Speexは、Xiph.Org FoundationのもとでJean-Marc Valinが開発した、音声圧縮に特化したオープンソースオーディオコーデックです。2002年10月に初めてリリースされ、VoIP、会議、およびネットワーク上で効率的に音声を伝送する必要があるあらゆるシナリオをターゲットとしています。SPXファイルはSpeexエンコードされたオーディオをOggコンテナ内にラップし、コーデックの音声最適化とOggのストリーミング機能を組み合わせています。3つのサンプリングレートがサポートされています — 8 kHzのナローバンド、16 kHzのワイドバンド、32 kHzのウルトラワイドバンド — さらに音声の複雑さにリアルタイムで適応する可変ビットレートエンコーディングも搭載しています。際立った利点は、特許フリーのBSDライセンスという性質で、開発者は商用およびオープンソース製品の両方に自由に組み込むことができました。Speexはまた音響エコーキャンセレーション、ノイズ抑制、自動ゲインコントロールをバンドルしており、競合コーデックが通常外部ライブラリに委託する機能です。その開発者は2012年以来、公式に後継としてOpusを推奨していますが、Speexはレガシーなるものの、VoIPシステム、アーカイブされた録音、および軽量なデコーダーフットプリントが依然として価値のある組み込みデバイスで使用され続けています。
続きを読む
SPHをSPXへ変換する方法
コンピューター、Googleドライブ、Dropbox、URLからファイルを選ぶか、ページにドラッグして下さい.
spxもしくは必要な別のフォーマットを選ぶ(200種類以上のフォーマットが利用できます)
ファイルを変換すれば、すぐにspxファイルをダウンロードできます
フォーマットについて
SPHは、1990年頃に米国国立標準技術研究所が作成したNIST SPHERE(SPeech HEader REsources)形式で保存されたオーディオのファイル拡張子です。音声研究用に構築されたSPHファイルは、データベース識別子、チャンネル数、サンプルレート、バイトオーダー、圧縮タイプなどのメタデータが詰め込まれた1024バイトのASCIIヘッダーを持ち、すべての録音が自己記述的です。基盤となるオーディオは通常16 kHzで16ビットリニアPCMサンプリングですが、他の構成も許可されています。NIST、DARPA、および世界中の大学の研究者は、現代の自動音声認識システムの基盤となるTIMIT、Switchboard、LDCコレクションなどの音声コーパスの配布にSPHを使用しています。主な利点は、人間が読めるヘッダーにより、スクリプトがバイナリデコーディングなしに録音メタデータを解析できることです。形式の厳格な標準化により、機関やプラットフォーム間でデータセットを共有する際の曖昧さも排除されます。SPHファイルは非圧縮PCMを格納するため、完全なオーディオ忠実度が維持されます — 小さなアーティファクトでさえ結果を歪める可能性がある音響モデルのトレーニングにおいて重要です。
Speexは、Xiph.Org FoundationのもとでJean-Marc Valinが開発した、音声圧縮に特化したオープンソースオーディオコーデックです。2002年10月に初めてリリースされ、VoIP、会議、およびネットワーク上で効率的に音声を伝送する必要があるあらゆるシナリオをターゲットとしています。SPXファイルはSpeexエンコードされたオーディオをOggコンテナ内にラップし、コーデックの音声最適化とOggのストリーミング機能を組み合わせています。3つのサンプリングレートがサポートされています — 8 kHzのナローバンド、16 kHzのワイドバンド、32 kHzのウルトラワイドバンド — さらに音声の複雑さにリアルタイムで適応する可変ビットレートエンコーディングも搭載しています。際立った利点は、特許フリーのBSDライセンスという性質で、開発者は商用およびオープンソース製品の両方に自由に組み込むことができました。Speexはまた音響エコーキャンセレーション、ノイズ抑制、自動ゲインコントロールをバンドルしており、競合コーデックが通常外部ライブラリに委託する機能です。その開発者は2012年以来、公式に後継としてOpusを推奨していますが、Speexはレガシーなるものの、VoIPシステム、アーカイブされた録音、および軽量なデコーダーフットプリントが依然として価値のある組み込みデバイスで使用され続けています。