MKV to SPH コンバーター

MKVからSPHEREオーディオを抽出して音声データセット構築に

ここにファイルをドロップする. 1 GB ファイルサイズの最大限度 または サインアップ
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

研究標準

SPHは音声研究コーパスのゴールドスタンダードです。音声認識フレームワークが期待する形式でMKVオーディオを抽出します。

コーパス構築

複数のMKVファイルを一度にSPHに変換。動画録音からの大規模音声データセット組み立てに効率的です。

機密データ

すべてのMKVアップロードは処理後に削除されます。SPH結果は24時間以内に消去 — 機密音声データのプライバシーが保たれます。

MKVをSPHへ変換する方法

1

コンピューター、Googleドライブ、Dropbox、URLからファイルを選ぶか、ページにドラッグして下さい.

2

sphもしくは必要な別のフォーマットを選ぶ(200種類以上のフォーマットが利用できます)

3

ファイルを変換すれば、すぐにsphファイルをダウンロードできます

フォーマットについて

MKV (Matroska Video) は、2002年12月にフォーマットを発表したMatroskaプロジェクトが開発したオープンスタンダードのマルチメディアコンテナフォーマットです。ロシアのマトリョーシカ人形にちなんで名付けられたこのフォーマットは、XMLの簡素化されたバイナリ変形であるEBML (Extensible Binary Meta Language) を基盤としており、柔軟で前方互換性のある構造を提供します。MKVは、映像用のH.264やHEVCからVP9やAV1まで、オーディオ用のAAC、FLAC、Opus、DTSまで、事実上無制限のビデオ、オーディオ、字幕トラックを単一ファイル内に格納できます。際立った機能は包括的な字幕サポートであり、シンプルなSRTテキストから複雑なASSスタイル字幕、Blu-rayディスクのビットマップベースPGSトラックまで対応しています。MKVはチャプターマーカー、添付ファイル (スタイル字幕に必要なフォントなど)、タグ付きメタデータもサポートしており、利用可能な中で最も機能豊富なコンテナの一つです。オープンな仕様により、どの開発者もライセンス料なしにMKVの読み書きを実装でき、メディアプレーヤー、ストリーミングツール、エンコーディングソフトウェア全体で幅広い採用を推進しています。事実上あらゆるコーデックの組み合わせを単一の整理されたファイルにカプセル化する能力により、MKVは高品質な動画配信、アーカイブ、個人メディアライブラリに好まれるコンテナとなっています。
開発元: Matroska
初回リリース: 2002年12月6日
SPHは、1990年頃に米国国立標準技術研究所が作成したNIST SPHERE(SPeech HEader REsources)形式で保存されたオーディオのファイル拡張子です。音声研究用に構築されたSPHファイルは、データベース識別子、チャンネル数、サンプルレート、バイトオーダー、圧縮タイプなどのメタデータが詰め込まれた1024バイトのASCIIヘッダーを持ち、すべての録音が自己記述的です。基盤となるオーディオは通常16 kHzで16ビットリニアPCMサンプリングですが、他の構成も許可されています。NIST、DARPA、および世界中の大学の研究者は、現代の自動音声認識システムの基盤となるTIMIT、Switchboard、LDCコレクションなどの音声コーパスの配布にSPHを使用しています。主な利点は、人間が読めるヘッダーにより、スクリプトがバイナリデコーディングなしに録音メタデータを解析できることです。形式の厳格な標準化により、機関やプラットフォーム間でデータセットを共有する際の曖昧さも排除されます。SPHファイルは非圧縮PCMを格納するため、完全なオーディオ忠実度が維持されます — 小さなアーティファクトでさえ結果を歪める可能性がある音響モデルのトレーニングにおいて重要です。
初回リリース: 1990

よくある質問

MKVをSPHに変換する理由は?

SPH(SPHERE)は音声研究コーパスのNIST標準です。Linguistic Data Consortiumや主要音声データベースで必要とされます。

SPHを読み取るソフトは?

NIST SPeech HEader Resourcesツール、HTK、Kaldi、SoX、学術的音声処理フレームワークがSPHファイルを標準入力として処理します。

SPHはAI訓練に使われますか?

はい — SPHEREは音声認識訓練データで広く使用されています。多くの基盤的ASRデータセットがSPH形式で配布されています。

SPHにはメタデータが含まれますか?

はい — SPHファイルにはサンプルレート、チャンネル数、エンコードタイプなど、自動処理に有用なメタデータを含むテキストヘッダーがあります。

MKVファイルのバッチ処理はできますか?

はい — 複数のMKV録音をアップロードしてすべてからSPHオーディオを抽出。動画ソースからの音声データセット構築に最適です。