IRCAMからHTKへのコンバーター

オンラインでしかも無料でircamファイルをhtkに変換

ここにファイルをドロップする. 1 GB ファイルサイズの最大限度 または サインアップ
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

IRCAMをHTKへ変換する方法

1

コンピューター、Googleドライブ、Dropbox、URLからファイルを選ぶか、ページにドラッグして下さい.

2

htkもしくは必要な別のフォーマットを選ぶ(200種類以上のフォーマットが利用できます)

3

ファイルを変換すれば、すぐにhtkファイルをダウンロードできます

フォーマットについて

IRCAMサウンドファイルは、作曲家Pierre Boulezによってパリに設立された世界有数のコンピュータ音楽研究所、Institut de Recherche et Coordination Acoustique/Musiqueに由来しています。この形式は1980年代初頭にIRCAMの研究ニーズに対応するために作成され、以来、科学とサウンドの交差点で活動する学術・芸術コミュニティに採用されてきました。IRCAMファイルは、マジックナンバー、サンプルレート、チャンネル数、リニアPCM(16/32ビット整数および32ビット浮動小数点)、mu-law、A-lawバリアントをサポートするエンコーディングタイプフィールドを含む1024バイトのヘッダーで始まります。ヘッダーブロックは自由形式のアノテーションテキストも収容でき、研究者が実験メタデータをオーディオファイルに直接埋め込めます。ペイロードはデフォルトで非圧縮であるため、録音は連続する分析と再合成サイクルを通じて完全な忠実度を維持します — 心理音響実験に不可欠です。Csound、libsndfile、SoXなどのソフトウェアがこの形式をネイティブに読み書きします。主な利点には、解析の曖昧さを排除する明確に定義されたヘッダー、科学的DSP作業に不可欠な浮動小数点サンプルのサポート、そして継続的なツール提供を保証するコンピュータ音楽コミュニティでの深いルーツが含まれます。
開発元: IRCAM
初回リリース: 1983
HTKは、ケンブリッジ大学工学部が開発した音声認識研究用ソフトウェアスイートHidden Markov Model Toolkitのネイティブ波形コンテナです。1993年に初めて配布され、HTKは世界中の計算言語学研究室でリファレンスプラットフォームとなり、そのファイル形式も同様に広まりました。各ファイルにはパラメータベクトルまたは生のサンプルが格納され、フレーム数、100 ns単位のフレーム周期、フレームあたりのバイト数、およびデータの種類を示すタイプコードを指定する12バイトのヘッダーが先行します — オプションは波形PCMからメル周波数ケプストラム係数やフィルタバンクエネルギーまで多岐にわたります。この汎用性により、単一のコンテナがパーサーを変更することなくソースオーディオと抽出された特徴量の両方を保持できます。意図的に最小限のヘッダーはアラインメントパディングやオプションチャンクを避け、C、Python、MATLABから数行のバイナリI/Oで簡単に読み取れます。HTKの持続的な関連性を支える3つの利点は、HTKトレーニングおよび認識パイプラインとの緊密な統合、パーサーの曖昧さを排除する決定論的なバイトレイアウト、そしてアカデミックコーパスでの広範な採用です。
初回リリース: 1993