MP4 から NIST コンバーター

MP4動画からNIST SPHERE音声をオンラインで抽出

ここにファイルをドロップする. 1 GB ファイルサイズの最大限度 または サインアップ
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

研究標準

NIST SPHEREは音声コーパスのゴールドスタンダードです。MP4音声をNISTに変換することで、データを研究パイプラインに統合できます。

コーパス構築

MP4ファイルを一括でNISTに変換し、効率的に音声コーパスを作成。複数の動画をアップロードして研究用音声を抽出できます。

クラウド処理

SPHEREツールキットのインストールは不要です。当社のサーバーがMP4アップロードからNIST音声を抽出・フォーマットします。

MP4をNISTへ変換する方法

1

コンピューター、Googleドライブ、Dropbox、URLからファイルを選ぶか、ページにドラッグして下さい.

2

nistもしくは必要な別のフォーマットを選ぶ(200種類以上のフォーマットが利用できます)

3

ファイルを変換すれば、すぐにnistファイルをダウンロードできます

フォーマットについて

MP4 (MPEG-4 Part 14) は、世界で最も広く使用されているマルチメディアコンテナフォーマットであり、2003年にMPEG-4仕様の一部として動画エキスパートグループによって標準化されました。Apple QuickTimeコンテナから派生したISOベースメディアファイルフォーマット (MPEG-4 Part 12) を基盤とし、MP4は事実上あらゆる種類のメディアデータをカプセル化できる階層的なアトム/ボックス構造を使用しています。コンテナは最も一般的にH.264またはH.265映像とAACオーディオをパッケージしますが、AV1、VP9、MPEG-4 Visual、AC-3、ALACなど幅広い代替コーデックもサポートしています。設計は、プログレッシブダウンロードおよびアダプティブストリーミング用のストリーミングヒント、チャプターマーカー、複数のオーディオ・字幕トラック、メタデータタグ、埋め込みサムネイル画像などの高度な機能をサポートしています。標準化された構造と幅広いコーデックサポートにより、MP4はオンラインビデオプラットフォーム、モバイルデバイス、デジタルカメラ、オペレーティングシステムのメディアライブラリのデフォルトの選択肢となっています。MP4内のH.264によるHTML5ビデオはすべての主要Webブラウザでサポートされており、この組み合わせがWebビデオ配信のユニバーサルベースラインとして確立されています。効率的なパッケージングオーバーヘッドと、搭載する最新コーデックの圧縮能力を組み合わせることで、帯域幅に制約のあるネットワークやストレージの限られたデバイスでも実用的なファイルサイズで高品質な動画配信を可能にしています。
初回リリース: 2003
NIST SPHERE(SPeech HEader REsources)は、アメリカ国立標準技術研究所がDARPA資金の音声研究プロジェクト向けに作成した特殊なオーディオファイル形式です。この形式は、サンプルレート、チャンネル数、エンコーディングタイプ、話者の属性、書き起こしアノテーションなどのメタデータをエンコードする構造化されたASCIIヘッダーで生のオーディオサンプルをラップし、音声コーパスの配布に最適です。NISTファイルは通常、電話品質のサンプルレート(8 kHzまたは16 kHz)で非圧縮PCMまたはmu-lawオーディオを格納しますが、コンテナはさまざまなエンコーディングを保持できる柔軟性があります。重要な利点は、研究者が詳細なコーパスメタデータをファイルに直接埋め込める豊富な自己文書化ヘッダーで、サイドカーファイルが不要になります。SPHEREはまた、TIMIT、Switchboard、Fisherコーパスなどの主要な音声データベースのデファクトスタンダードとなり、学術および政府の研究室全体で広く認知されています。オープンな仕様とコマンドラインツール(sphere、h_strip、w_decode)の利用可能性により、音声処理パイプラインでのファイルの変換、検査、処理が容易です。
初回リリース: 1990

よくある質問

なぜMP4をNISTに変換するのですか?

NISTフォーマットは米国国立標準技術研究所が配布する音声研究コーパスの標準です — NLPやASR研究に欠かせません。

NISTファイルを開くには?

NIST SPHEREツール、SoX、Kaldi、HTKがNISTフォーマットの音声を処理できます。ほとんどの音声認識研究ツールチェーンがこのフォーマットに対応しています。

NISTはAIトレーニングで使われていますか?

NISTフォーマットの音声は自動音声認識システムのトレーニングに広く使用されています。主要な研究データセットがこのフォーマットで配布されています。

一括変換できますか?

複数のMP4ファイルを一度にアップロードし、各音声トラックを個別にNISTフォーマットに抽出できます — 研究コーパスの構築に便利です。

NISTとWAVの違いは?

NISTは研究用アノテーション向けの豊富なメタデータを持つSPHEREヘッダーを使用します。音声データ自体はWAVと同様のPCMです。

NISTは映像を除去しますか?

はい — MP4から音声のみが抽出されます。出力は研究に適したNIST SPHERE音声ファイルです。

MP4〜NIST品質評価

3.8 (9投票)
フィードバックを提供するには、少なくとも1つのファイルを変換してダウンロードする必要があります!