AVIからNISTコンバーター

AVI動画から音声をNIST SPHEREフォーマットでオンライン抽出

ここにファイルをドロップする. 1 GB ファイルサイズの最大限度 または サインアップ
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

規格準拠

出力はNIST SPHERE仕様に厳密に準拠。AVI音声は音声研究ワークフローで直接使用できる適切なヘッダとともにパッケージ化されます。

インストール不要

ブラウザで直接AVIをNISTに変換 — SPHEREツールキットのダウンロードは不要。アップロード、変換、研究用音声ファイルを取得するだけです。

安全なデータ処理

アップロードされたAVI動画は変換後に削除されます。NIST出力ファイルは24時間以内に削除 — 音声データの機密性が保たれます。

AVIをNISTへ変換する方法

1

コンピューター、Googleドライブ、Dropbox、URLからファイルを選ぶか、ページにドラッグして下さい.

2

nistもしくは必要な別のフォーマットを選ぶ(200種類以上のフォーマットが利用できます)

3

ファイルを変換すれば、すぐにnistファイルをダウンロードできます

フォーマットについて

AVI (Audio Video Interleave) は、最も古く、最も広く認知されているマルチメディアコンテナフォーマットの一つであり、1992年11月にMicrosoftがVideo for Windowsテクノロジーの一部として導入しました。RIFF (Resource Interchange File Format) 構造を基盤とし、AVIは音声と映像のデータを交互のチャンクでインターリーブし、高度なストリーム管理を必要とせずに同期再生を可能にします。コーデック非依存のフォーマットであり、初期のCinepakやIndeoから最新のDivX、Xvid、H.264ストリームに至るまで、事実上あらゆるコーデックで圧縮された映像を格納できます。この柔軟性が、1990年代から2000年代にかけてパーソナルコンピュータ全体での幅広い普及に貢献しました。注目すべき特徴として、シンプルな内部構造により、より複雑な現代のコンテナと比較してバイナリレベルでの編集や処理が比較的容易です。AVIは複数のオーディオストリームもサポートしており、単一ファイル内に多言語コンテンツを収録できます。ただし、初期の仕様には、古い実装での2 GBファイルサイズ上限や、可変フレームレートや高度な字幕フォーマットのネイティブサポートがないなどの制限がありました。OpenDML拡張 (AVI 2.0) により、ファイルが元の境界を超えることが可能になり、サイズ制限が解消されました。数十年の歴史がありながらも、AVIは最も普遍的に認知されたマルチメディアフォーマットの一つであり、すべての主要オペレーティングシステムのメディアプレーヤーや編集ツールで広くサポートされ続けています。
開発元: Microsoft
初回リリース: 1992年11月10日
NIST SPHERE(SPeech HEader REsources)は、アメリカ国立標準技術研究所がDARPA資金の音声研究プロジェクト向けに作成した特殊なオーディオファイル形式です。この形式は、サンプルレート、チャンネル数、エンコーディングタイプ、話者の属性、書き起こしアノテーションなどのメタデータをエンコードする構造化されたASCIIヘッダーで生のオーディオサンプルをラップし、音声コーパスの配布に最適です。NISTファイルは通常、電話品質のサンプルレート(8 kHzまたは16 kHz)で非圧縮PCMまたはmu-lawオーディオを格納しますが、コンテナはさまざまなエンコーディングを保持できる柔軟性があります。重要な利点は、研究者が詳細なコーパスメタデータをファイルに直接埋め込める豊富な自己文書化ヘッダーで、サイドカーファイルが不要になります。SPHEREはまた、TIMIT、Switchboard、Fisherコーパスなどの主要な音声データベースのデファクトスタンダードとなり、学術および政府の研究室全体で広く認知されています。オープンな仕様とコマンドラインツール(sphere、h_strip、w_decode)の利用可能性により、音声処理パイプラインでのファイルの変換、検査、処理が容易です。
初回リリース: 1990

よくある質問

なぜAVIをNISTに変換するのですか?

NIST SPHEREは音声研究データセットの標準フォーマットです。AVI音声をNISTに抽出することで、動画の対話が認識システムで利用可能になります。

NISTファイルを読み込むものは?

NIST SPHEREツールキット、Kaldi ASRフレームワーク、HTKがすべてNIST音声をネイティブにサポートしています。SOXもこのフォーマットの読み書きに対応しています。

NISTとWAVの違いは?

NIST SPHEREはWAVにはない音声コーパス管理のための豊富なヘッダメタデータを含みます。どちらもPCM音声を保存しますが、NISTは研究パイプラインをターゲットにしています。

音声品質は維持されますか?

NISTは圧縮なしでPCMデータを保存するため、AVIから抽出された音声は完全な品質を保持します。変換中にロッシーエンコーディングは適用されません。

長い動画も処理できますか?

当社サーバーはさまざまな長さのAVIファイルを処理します。長い動画は比例的に時間がかかりますが、変換は安定して確実に行われます。