OPUS to HTK コンバーター

OPUSからHTK音声処理オーディオを生成

ファイルを選ぶ

ここにファイルをドロップする. 1 GB ファイルサイズの最大限度またはサインアップ

に

ASRトレーニング形式

HTKはHMM音声認識の標準 — OPUS音声録音を研究パイプライン向けに変換します。

コーパス処理

OPUS音声データセット全体をアップロードし、すべてのファイルに対してHTK形式を一度に生成できます。

オンライン変換

HTKツールキットのインストール不要 — ブラウザからOPUSのフォーマット済みオーディオを生成できます。

OPUSをHTKへ変換する方法

コンピューター、Googleドライブ、Dropbox、URLからファイルを選ぶか、ページにドラッグして下さい.

htkもしくは必要な別のフォーマットを選ぶ（200種類以上のフォーマットが利用できます）

ファイルを変換すれば、すぐにhtkファイルをダウンロードできます

フォーマットについて

Opusは、2012年にIETFによってRFC 6716として標準化された、多用途でオープンなオーディオコーデックです。音声用のSILKと音楽用のCELTという2つのコーディングアプローチを1つのアルゴリズムに融合し、コンテンツタイプとビットレートに基づいてそれらの間をブレンドします。このハイブリッド設計により、Opusは幅広い用途でほぼすべての他のコーデックを凌駕します — 6 kbpsでの低遅延音声、128 kbpsでの高忠実度音楽、そしてその間のすべてに対応します。6から510 kbpsのビットレート、最大48 kHzのサンプルレート、2.5 msまでの小さなフレームサイズをサポートし、主流のオーディオコーデックの中で最も低いアルゴリズム遅延を実現しています。3つの利点がOpusを特に魅力的にしています。完全にロイヤリティフリーかつオープンソースで、プロプライエタリコーデックを妨げるライセンス障壁を排除しています。MP3の約半分のビットレートで透明な品質を達成し、同等のレートではAACを上回ります。そして、その低遅延によりWebRTCの必須コーデックとなり、すべての最新ブラウザにOpusデコーダーが搭載されています。WhatsApp、Discord、Zoom、YouTubeはすべてリアルタイムオーディオにOpusを使用しています。

開発元: Internet Engineering Task Force

初回リリース: 2012年9月11日

HTKは、ケンブリッジ大学工学部が開発した音声認識研究用ソフトウェアスイートHidden Markov Model Toolkitのネイティブ波形コンテナです。1993年に初めて配布され、HTKは世界中の計算言語学研究室でリファレンスプラットフォームとなり、そのファイル形式も同様に広まりました。各ファイルにはパラメータベクトルまたは生のサンプルが格納され、フレーム数、100 ns単位のフレーム周期、フレームあたりのバイト数、およびデータの種類を示すタイプコードを指定する12バイトのヘッダーが先行します — オプションは波形PCMからメル周波数ケプストラム係数やフィルタバンクエネルギーまで多岐にわたります。この汎用性により、単一のコンテナがパーサーを変更することなくソースオーディオと抽出された特徴量の両方を保持できます。意図的に最小限のヘッダーはアラインメントパディングやオプションチャンクを避け、C、Python、MATLABから数行のバイナリI/Oで簡単に読み取れます。HTKの持続的な関連性を支える3つの利点は、HTKトレーニングおよび認識パイプラインとの緊密な統合、パーサーの曖昧さを排除する決定論的なバイトレイアウト、そしてアカデミックコーパスでの広範な採用です。

開発元: Cambridge University Engineering Department

初回リリース: 1993

よくある質問

なぜOPUSをHTKに変換するのですか？

HTKフォーマットは隠れマルコフモデルツールキットのASRトレーニングに必要です。音声研究者はHTK形式の入力データを必要とします。

HTKは何に使われますか？

Cambridge HTKツールキット、Kaldi、音声認識研究パイプラインがHTK形式のオーディオを消費します。

HTKは一般的ですか？

HTKは音声処理研究に特化 — カスタムヘッダー付き16ビットPCM形式で、汎用オーディオではありません。

サンプルレートは？

大半のASRタスクは8または16 kHzモノラルを使用 — コンバーターがOPUSからの再サンプリングを自動で行います。

データセットを変換できますか？

OPUS音声コーパス全体をアップロードし、一括でHTKに変換 — モデルトレーニング用に準備できます。

専用コンバーター

MP3 から HTK に

WAV から HTK に

MP4 から HTK に

FLAC から HTK に

M4A から HTK に

OGG から HTK に

MPG から HTK に

ASF から HTK に

AAC から HTK に

3G2 から HTK に

3GP から HTK に

AAF から HTK に

AV1 から HTK に

AVCHD から HTK に

AVI から HTK に

CAVS から HTK に

DIVX から HTK に

DV から HTK に

F4V から HTK に

FLV から HTK に

HEVC から HTK に

M2TS から HTK に

M2V から HTK に

M4V から HTK に

MJPEG から HTK に

MKV から HTK に

MOD から HTK に

MOV から HTK に

MPEG から HTK に

MPEG-2 から HTK に