AVIからSPHコンバーター

AVI音声をNIST SPHERE音声フォーマットにオンライン抽出

ここにファイルをドロップする. 1 GB ファイルサイズの最大限度 または サインアップ
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

AVIから音声データへ

AVIの動画音声をSPHERE形式の音声データに変換、言語コーパス、認識トレーニング、音響分析にすぐに使用可能。

サーバーサイド処理

音声抽出とSPHエンコードは当社サーバーで実行。お使いのマシンは負荷なし — ローカルソフトウェアのインストール不要。

研究対応出力

AVIファイルからのSPH出力はNIST SPHERE仕様を満たします。Kaldi、HTK、その他の音声処理フレームワークに直接インポート可能。

AVIをSPHへ変換する方法

1

コンピューター、Googleドライブ、Dropbox、URLからファイルを選ぶか、ページにドラッグして下さい.

2

sphもしくは必要な別のフォーマットを選ぶ(200種類以上のフォーマットが利用できます)

3

ファイルを変換すれば、すぐにsphファイルをダウンロードできます

フォーマットについて

AVI (Audio Video Interleave) は、最も古く、最も広く認知されているマルチメディアコンテナフォーマットの一つであり、1992年11月にMicrosoftがVideo for Windowsテクノロジーの一部として導入しました。RIFF (Resource Interchange File Format) 構造を基盤とし、AVIは音声と映像のデータを交互のチャンクでインターリーブし、高度なストリーム管理を必要とせずに同期再生を可能にします。コーデック非依存のフォーマットであり、初期のCinepakやIndeoから最新のDivX、Xvid、H.264ストリームに至るまで、事実上あらゆるコーデックで圧縮された映像を格納できます。この柔軟性が、1990年代から2000年代にかけてパーソナルコンピュータ全体での幅広い普及に貢献しました。注目すべき特徴として、シンプルな内部構造により、より複雑な現代のコンテナと比較してバイナリレベルでの編集や処理が比較的容易です。AVIは複数のオーディオストリームもサポートしており、単一ファイル内に多言語コンテンツを収録できます。ただし、初期の仕様には、古い実装での2 GBファイルサイズ上限や、可変フレームレートや高度な字幕フォーマットのネイティブサポートがないなどの制限がありました。OpenDML拡張 (AVI 2.0) により、ファイルが元の境界を超えることが可能になり、サイズ制限が解消されました。数十年の歴史がありながらも、AVIは最も普遍的に認知されたマルチメディアフォーマットの一つであり、すべての主要オペレーティングシステムのメディアプレーヤーや編集ツールで広くサポートされ続けています。
開発元: Microsoft
初回リリース: 1992年11月10日
SPHは、1990年頃に米国国立標準技術研究所が作成したNIST SPHERE(SPeech HEader REsources)形式で保存されたオーディオのファイル拡張子です。音声研究用に構築されたSPHファイルは、データベース識別子、チャンネル数、サンプルレート、バイトオーダー、圧縮タイプなどのメタデータが詰め込まれた1024バイトのASCIIヘッダーを持ち、すべての録音が自己記述的です。基盤となるオーディオは通常16 kHzで16ビットリニアPCMサンプリングですが、他の構成も許可されています。NIST、DARPA、および世界中の大学の研究者は、現代の自動音声認識システムの基盤となるTIMIT、Switchboard、LDCコレクションなどの音声コーパスの配布にSPHを使用しています。主な利点は、人間が読めるヘッダーにより、スクリプトがバイナリデコーディングなしに録音メタデータを解析できることです。形式の厳格な標準化により、機関やプラットフォーム間でデータセットを共有する際の曖昧さも排除されます。SPHファイルは非圧縮PCMを格納するため、完全なオーディオ忠実度が維持されます — 小さなアーティファクトでさえ結果を歪める可能性がある音響モデルのトレーニングにおいて重要です。
初回リリース: 1990

よくある質問

なぜAVIをSPHに変換するのですか?

SPH(SPHERE)は言語学や音声認識で使用されるNISTの音声標準です。AVIを変換することで、研究データセット用の対話を抽出できます。

SPHファイルで使えるツールは?

HTK、Kaldi、Praat、その他の音声分析フレームワークがSPHを読み取ります。NIST SPHEREツールキットもこのフォーマットのネイティブツールを提供しています。

SPHとNISTは同じですか?

SPHとNISTはどちらも米国国立標準技術研究所が定義したSPHEREフォーマットを指します。機能的には同一です。

SPHはステレオ音声をサポートしますか?

SPHEREファイルはマルチチャンネルデータを保存できますが、音声コーパスは通常モノラルを使用します。AVIの音声チャンネルは設定通りに保持されます。

大きなAVIファイルを処理できますか?

当社サーバーはさまざまなサイズのAVIファイルを処理します。大きな動画は少し時間がかかる場合がありますが、音声抽出とSPHエンコードは確実に行われます。