WEBMからNISTコンバーター

WebM動画ファイルからNIST SPHEREオーディオを作成

ここにファイルをドロップする. 1 GB ファイルサイズの最大限度 または サインアップ
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

研究ベンチマーク

NIST SPHEREは研究における音声オーディオの配布方法です。WebMウェブコンテンツがASR開発用に適切にフォーマットされたデータに変換されます。

ブラウザベース

SPHEREツールキットやWebMデコーダーはローカルに不要です。任意のデバイスやOSのブラウザから完全に変換できます。

データセキュリティ

WebMのアップロードは変換後に削除されます。NIST出力は24時間以内に削除 — 音声研究データの機密性が保たれます。

WEBMをNISTへ変換する方法

1

コンピューター、Googleドライブ、Dropbox、URLからファイルを選ぶか、ページにドラッグして下さい.

2

nistもしくは必要な別のフォーマットを選ぶ(200種類以上のフォーマットが利用できます)

3

ファイルを変換すれば、すぐにnistファイルをダウンロードできます

フォーマットについて

WebMは、Googleが開発し、2010年5月のGoogle I/Oカンファレンスで発表されたオープンでロイヤリティフリーのマルチメディアコンテナフォーマットです。フォーマットはMatroskaコンテナ (MKVのサブセット) とVP8またはVP9ビデオコーデック、VorbisまたはOpusオーディオコーデックを組み合わせ、Web専用に設計された完全にオープンなメディアスタックを構築しています。GoogleはVP8コーデックとともにWebMをBSDスタイルの寛容なライセンスで公開し、オープンWebビデオにおけるH.264の採用を妨げていた特許とロイヤリティの障壁を取り除きました。WebMコンテナはMatroskaの効率的なバイナリ構造を継承しつつ、Web最適化プロファイルに制限することで、高速な解析と軽量なブラウザ実装を実現しています。VP9搭載のWebMはH.264 High Profileに匹敵し、HEVCに迫る圧縮効率を達成しており、低帯域幅で高品質な動画配信を実現します。Chrome、Firefox、Edge、Operaを含む主要Webブラウザがネイティブ再生をサポートしており、YouTubeもVP9搭載WebMをコンテンツの多くの主要配信フォーマットとして使用しています。フォーマットは映像のアルファチャンネル透過性をサポートしており、Webグラフィックスやオーバーレイの合成に価値があります。最近では、WebMはAV1ビデオのサポートも追加され、オープンコーデック普及の推進役としての進化を続けています。競争力のある圧縮、ゼロライセンスコスト、ユニバーサルなブラウザサポートの組み合わせにより、WebMはロイヤリティフリーのWebマルチメディア配信の要となっています。
開発元: Google
初回リリース: 2010年5月19日
NIST SPHERE(SPeech HEader REsources)は、アメリカ国立標準技術研究所がDARPA資金の音声研究プロジェクト向けに作成した特殊なオーディオファイル形式です。この形式は、サンプルレート、チャンネル数、エンコーディングタイプ、話者の属性、書き起こしアノテーションなどのメタデータをエンコードする構造化されたASCIIヘッダーで生のオーディオサンプルをラップし、音声コーパスの配布に最適です。NISTファイルは通常、電話品質のサンプルレート(8 kHzまたは16 kHz)で非圧縮PCMまたはmu-lawオーディオを格納しますが、コンテナはさまざまなエンコーディングを保持できる柔軟性があります。重要な利点は、研究者が詳細なコーパスメタデータをファイルに直接埋め込める豊富な自己文書化ヘッダーで、サイドカーファイルが不要になります。SPHEREはまた、TIMIT、Switchboard、Fisherコーパスなどの主要な音声データベースのデファクトスタンダードとなり、学術および政府の研究室全体で広く認知されています。オープンな仕様とコマンドラインツール(sphere、h_strip、w_decode)の利用可能性により、音声処理パイプラインでのファイルの変換、検査、処理が容易です。
初回リリース: 1990

よくある質問

なぜWebMをNISTに変換するのですか?

NIST SPHEREは音声データ配布のベンチマーク形式です。WebMの講義やトークは自動音声認識研究用の構造化音声データになります。

NISTとSPHは同じですか?

はい — どちらもアメリカ国立標準技術研究所のSPHERE形式を指します。拡張子は互換性があります。

WebMは良質なオーディオを提供しますか?

WebMは最新のOpusまたはVorbisコーデックを使用しており、効率的で高品質です。NIST用に抽出された音声は音声の明瞭さを十分に保持します。

NISTを受け付けるASRツールは?

Kaldi、HTK、NIST評価フレームワーク、およびほとんどの学術音声認識研究室がNIST SPHEREを標準形式として使用しています。

WebMファイルを一括変換できますか?

複数のWebM動画をアップロードして一度にすべてNISTに変換できます。ウェブ動画アーカイブから大規模な音声コーパスを効率的に構築できます。