WEBMからSPHコンバーター

WebMオーディオをNIST SPHERE音声形式として抽出

ここにファイルをドロップする. 1 GB ファイルサイズの最大限度 または サインアップ
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

ウェブ動画からコーパスへ

WebMウェブ動画のオーディオを直接NIST SPHEREに変換 — 自由にアクセス可能なオンラインコンテンツを構造化された音声研究データに変えます。

サーバー処理

オーディオ抽出とSPHエンコードはサーバー上で実行。ローカルにツールキットのインストールは不要 — アップロードしてダウンロードするだけです。

安全なデータ

WebMのアップロードは変換後に削除されます。SPH出力は24時間以内に消去 — 研究用音声データの機密性が保たれます。

WEBMをSPHへ変換する方法

1

コンピューター、Googleドライブ、Dropbox、URLからファイルを選ぶか、ページにドラッグして下さい.

2

sphもしくは必要な別のフォーマットを選ぶ(200種類以上のフォーマットが利用できます)

3

ファイルを変換すれば、すぐにsphファイルをダウンロードできます

フォーマットについて

WebMは、Googleが開発し、2010年5月のGoogle I/Oカンファレンスで発表されたオープンでロイヤリティフリーのマルチメディアコンテナフォーマットです。フォーマットはMatroskaコンテナ (MKVのサブセット) とVP8またはVP9ビデオコーデック、VorbisまたはOpusオーディオコーデックを組み合わせ、Web専用に設計された完全にオープンなメディアスタックを構築しています。GoogleはVP8コーデックとともにWebMをBSDスタイルの寛容なライセンスで公開し、オープンWebビデオにおけるH.264の採用を妨げていた特許とロイヤリティの障壁を取り除きました。WebMコンテナはMatroskaの効率的なバイナリ構造を継承しつつ、Web最適化プロファイルに制限することで、高速な解析と軽量なブラウザ実装を実現しています。VP9搭載のWebMはH.264 High Profileに匹敵し、HEVCに迫る圧縮効率を達成しており、低帯域幅で高品質な動画配信を実現します。Chrome、Firefox、Edge、Operaを含む主要Webブラウザがネイティブ再生をサポートしており、YouTubeもVP9搭載WebMをコンテンツの多くの主要配信フォーマットとして使用しています。フォーマットは映像のアルファチャンネル透過性をサポートしており、Webグラフィックスやオーバーレイの合成に価値があります。最近では、WebMはAV1ビデオのサポートも追加され、オープンコーデック普及の推進役としての進化を続けています。競争力のある圧縮、ゼロライセンスコスト、ユニバーサルなブラウザサポートの組み合わせにより、WebMはロイヤリティフリーのWebマルチメディア配信の要となっています。
開発元: Google
初回リリース: 2010年5月19日
SPHは、1990年頃に米国国立標準技術研究所が作成したNIST SPHERE(SPeech HEader REsources)形式で保存されたオーディオのファイル拡張子です。音声研究用に構築されたSPHファイルは、データベース識別子、チャンネル数、サンプルレート、バイトオーダー、圧縮タイプなどのメタデータが詰め込まれた1024バイトのASCIIヘッダーを持ち、すべての録音が自己記述的です。基盤となるオーディオは通常16 kHzで16ビットリニアPCMサンプリングですが、他の構成も許可されています。NIST、DARPA、および世界中の大学の研究者は、現代の自動音声認識システムの基盤となるTIMIT、Switchboard、LDCコレクションなどの音声コーパスの配布にSPHを使用しています。主な利点は、人間が読めるヘッダーにより、スクリプトがバイナリデコーディングなしに録音メタデータを解析できることです。形式の厳格な標準化により、機関やプラットフォーム間でデータセットを共有する際の曖昧さも排除されます。SPHファイルは非圧縮PCMを格納するため、完全なオーディオ忠実度が維持されます — 小さなアーティファクトでさえ結果を歪める可能性がある音響モデルのトレーニングにおいて重要です。
初回リリース: 1990

よくある質問

なぜWebMをSPHに変換するのですか?

SPHはNISTの音声研究標準です。WebMのウェブ動画 — 講義、ポッドキャスト、トーク — はASRトレーニング用の多様な音声データを提供します。

SPHを扱えるツールは?

Kaldi、HTK、Praat、およびNIST SPHEREツールキットがSPHをネイティブにサポートしています。音声認識研究ラボ全体で標準的です。

SPHはオーディオを圧縮しますか?

いいえ — SPHは非可逆圧縮なしでPCMを保存します。WebMオーディオはデコードされ、正確な音声分析のためにフル品質で保存されます。

WebMは音声データに適していますか?

WebMは標準的なウェブ動画形式です。教育動画や録画されたトークはWebMに豊富な音声データを提供し、研究用途に適しています。

一括変換はできますか?

複数のWebM動画をアップロードして同時にSPHに変換。ウェブ動画コレクションから音声コーパスを効率的に構築できます。