VOBからHTKへのコンバーター

DVD VOB音声をHTK音声認識形式に抽出

ここにファイルをドロップする. 1 GB ファイルサイズの最大限度 または サインアップ
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

DVDから音声データへ

DVD VOBファイルから対話を抽出しHTKとして保存 — 隠れマルコフモデルトレーニングと音響分析研究に即座に対応。

サーバー側抽出

VOBファイルは大きくなることがあります。当社サーバーが抽出とHTKエンコードを処理 — ローカルツールキットのインストールは不要です。

データ保護

VOBアップロードは変換後に削除。HTK出力は24時間以内に消去 — 研究音声データのプライバシーを確保します。

VOBをHTKへ変換する方法

1

コンピューター、Googleドライブ、Dropbox、URLからファイルを選ぶか、ページにドラッグして下さい.

2

htkもしくは必要な別のフォーマットを選ぶ(200種類以上のフォーマットが利用できます)

3

ファイルを変換すれば、すぐにhtkファイルをダウンロードできます

フォーマットについて

VOB (Video Object) は、DVD Forumが策定したDVD仕様の一部として定義された、DVD-Videoディスクで使用される主要なコンテナフォーマットです。1996年9月に確定したDVD規格とともに初めて登場し、世界中で数十億枚のDVDディスクに使用されてきました。VOBファイルはMPEG-2プログラムストリームフォーマットを基盤とし、MPEG-2映像とAC-3 (Dolby Digital)、DTS、MPEG-1 Layer II、またはLPCMフォーマットのオーディオを多重化して格納します。音声と映像以外に、VOBファイルはビットマップオーバーレイとしてのDVD字幕ストリーム、メニューインタラクション用のナビゲーションデータ、チャプターポイント情報も格納します。ファイルはDVDディスクのVIDEO_TSディレクトリに置かれ、命名規則 (VTS_01_1.VOBなど) はコンテンツのタイトルとパート構造を反映しています。個々のVOBファイルはUDFファイルシステム要件に対応するため約1 GBに制限されており、より長いコンテンツは複数のファイルにシームレスにまたがります。フォーマットはNTSC (720x480) とPAL (720x576) の両方の映像解像度を、音声と映像の合計で最大9.8 Mbpsのビットレートでサポートしています。映像、マルチトラックオーディオ、字幕、ナビゲーションを単一のプログラムストリームに統合することで、VOBはコンシューマー向け映画配信の完全なソリューションとなりました。ストリーミングや新しいディスクフォーマットが新規コンテンツではDVDに取って代わりましたが、VOBは既存のDVDコンテンツの膨大なライブラリへのアクセスに引き続き非常に重要です。
開発元: DVD Forum
初回リリース: 9月 1996
HTKは、ケンブリッジ大学工学部が開発した音声認識研究用ソフトウェアスイートHidden Markov Model Toolkitのネイティブ波形コンテナです。1993年に初めて配布され、HTKは世界中の計算言語学研究室でリファレンスプラットフォームとなり、そのファイル形式も同様に広まりました。各ファイルにはパラメータベクトルまたは生のサンプルが格納され、フレーム数、100 ns単位のフレーム周期、フレームあたりのバイト数、およびデータの種類を示すタイプコードを指定する12バイトのヘッダーが先行します — オプションは波形PCMからメル周波数ケプストラム係数やフィルタバンクエネルギーまで多岐にわたります。この汎用性により、単一のコンテナがパーサーを変更することなくソースオーディオと抽出された特徴量の両方を保持できます。意図的に最小限のヘッダーはアラインメントパディングやオプションチャンクを避け、C、Python、MATLABから数行のバイナリI/Oで簡単に読み取れます。HTKの持続的な関連性を支える3つの利点は、HTKトレーニングおよび認識パイプラインとの緊密な統合、パーサーの曖昧さを排除する決定論的なバイトレイアウト、そしてアカデミックコーパスでの広範な採用です。
初回リリース: 1993

よくある質問

なぜVOBをHTKに変換するのですか?

HTKは隠れマルコフモデルツールキット用の形式です。対話のあるDVD VOBファイルが音声認識研究のトレーニングデータになります。

HTK音声とは?

HTKは単一チャンネル16ビットPCM音声を保存します。Cambridge HTK音声認識・分析フレームワーク専用に構築されています。

VOBサラウンド音声は対応しますか?

HTKはモノラルです。VOBのDVDマルチチャンネル音声は単一チャンネルにダウンミックスされます — 音声処理作業の標準手順です。

対話品質は保持されますか?

HTKは非圧縮16ビットPCMを保存。DVD VOBファイルの対話は認識トレーニングと分析に完全な明瞭さを維持します。

複数のVOBチャプターを処理できますか?

複数のVOBファイルをアップロードし一括でHTKに変換。一回の操作でDVD全体から音声データセットを構築できます。