HTK'den WAV'ye dönüştürücü
htk dosyalarınızı wav'ye çevrimiçi & ücretsiz olarak dönüştürün
htk
wav
Ayarlar
PCM_S16LE (Sıkıştırılmamış)
Ses parçasını kodlayan çözücü. "Yeniden kodlama olmadan" çözücü, giriş dosyasındaki ses akışını mümkünse yeniden kodlamadan çıktıya kopyalar.
Otomatik (Değişiklik yok)
Ses kanalı sayısını ayarlayın. Bu ayar en çok kanalları downmixlerken kullanışlıdır (örn. 5,1'den stereo'ya).
Otomatik (Değişiklik yok)
Sesin örnek oranını ayarlayın. Tam spektrumlu (20 Hz — 20 kHz) müzik, şeffaflık elde etmek için 44.1 kHz'den düşük olmayan değerler gerektirir. Viki'de daha fazla bilgi bulunabilir.
htk
HTK, Cambridge Üniversitesi Mühendislik Bölümü'nde konuşma tanıma araştırmaları için geliştirilen bir yazılım paketi olan Hidden Markov Model Toolkit'ın yerel dalga formu kapsayıcısıdır. 1993'te i̇lk dağıtılan HTK, dünya genelinde hesaplamalı dilbilim laboratuvarlarında hızla referans platform haline gelmiş ve dosya formatı da aynı yolu izlemiştir. Her dosya, çerçeve sayısını, 100 ns birimlerinde çerçeve süresini, çerçeve başına bayt sayısını ve veri türünü belirten bir tür kodu içeren 12 baytlık bir başlık ile öncelenmiş parametre vektörleri veya ham örnekler dizisi depolar — dalga formu PCM'den Mel-frekans kepstral katsayılarına ve filtre bankası enerjilerine kadar seçenekler mevcuttur. Bu çok yönlülük, tek bir kapsayıcının hem kaynak sesi hem de çıkarılan özellikleri ayrıştırıcı değiştirmeden taşımasını sağlar. Kasıtlı olarak minimalist başlık, hizalama dolgusu veya isteğe bağlı yığınlardan kaçınarak formatı C, Python veya MATLAB'da birkaç satır i̇kili G/Ç ile okumayı kolaylaştırır. HTK'nın kalıcı önemini destekleyen üç avantaj: HTK eğitim ve tanıma hattıyla sıkı entegrasyon, ayrıştırıcı belirsizliğini ortadan kaldıran deterministik bayt düzeni ve akademik veri derlemlerinde yaygın benimseme.
devamını oku
wav
WAV (Waveform Audio File Format), Microsoft ve IBM tarafından ortaklaşa geliştirilen ve i̇lk olarak Ağustos 1991'de Windows 3.1 ile birlikte yayınlanan sıkıştırılmamış bir ses kapsayıcısıdır. Resource Interchange File Format (RIFF) üzerine inşa edilen WAV, ses verilerini — en yaygın olarak doğrusal darbe-kod modülasyonu (LPCM) olarak — örnekleme hızı, bit derinliği ve kanal sayısını tanımlayan üst verilerle birlikte depolar. Bu doğrudan yapı, WAV'ı Windows üzerinde sıkıştırılmamış ses için fiili standart ve mevcut neredeyse tüm işletim sistemleri, ses editörleri ve medya oynatıcılar genelinde evrensel olarak kabul gören bir değişim formatı yapmıştır. CD kalitesinde WAV dosyaları 44,1 kHz stereo'da 16 bit örnekler kullanırken, profesyonel iş akışları düzenli olarak 192 kHz'e kadar hızlarda 24 bit veya 32 bit kayan nokta örnekleri kullanır. Büyük avantajı sıfır kayıplı doğruluktur: standart WAV sıkıştırma uygulamadığından, depolanan veri orijinal kaydın tam dijital bir temsilidir ve bu özellik onu mastering ve arşivleme için tercih edilen seçenek yapar. WAV ayrıca INFO ve BWF yığınları aracılığıyla gömülü üst verileri destekleyerek zaman damgaları ve prodüksiyon notlarına olanak tanır. Temel ödünleşim dosya boyutudur — bir dakikalık CD kalitesinde stereo yaklaşık 10 MB yer kaplar — ve 32 bit RIFF yapısı 4 GB sınırı getirirken RF64 bu tavanı kaldırmaktadır.
devamını oku
HTK'i WAV'ye dönüştürme yöntemi
Dosyaları bilgisayar, Google Drive, Dropbox, URL'den veya sayfa üzerinden sürükleyerek seçin.
wav ya da sonuç olarak ihtiyacınız olan diğer formatlardan birini seçin (200'den fazla format desteklenir)
Haydi dosyayı dönüştürün ve wav dosyanızı hemen sonra indirebilirsiniz
Formatlar hakkında
HTK, Cambridge Üniversitesi Mühendislik Bölümü'nde konuşma tanıma araştırmaları için geliştirilen bir yazılım paketi olan Hidden Markov Model Toolkit'ın yerel dalga formu kapsayıcısıdır. 1993'te i̇lk dağıtılan HTK, dünya genelinde hesaplamalı dilbilim laboratuvarlarında hızla referans platform haline gelmiş ve dosya formatı da aynı yolu izlemiştir. Her dosya, çerçeve sayısını, 100 ns birimlerinde çerçeve süresini, çerçeve başına bayt sayısını ve veri türünü belirten bir tür kodu içeren 12 baytlık bir başlık ile öncelenmiş parametre vektörleri veya ham örnekler dizisi depolar — dalga formu PCM'den Mel-frekans kepstral katsayılarına ve filtre bankası enerjilerine kadar seçenekler mevcuttur. Bu çok yönlülük, tek bir kapsayıcının hem kaynak sesi hem de çıkarılan özellikleri ayrıştırıcı değiştirmeden taşımasını sağlar. Kasıtlı olarak minimalist başlık, hizalama dolgusu veya isteğe bağlı yığınlardan kaçınarak formatı C, Python veya MATLAB'da birkaç satır i̇kili G/Ç ile okumayı kolaylaştırır. HTK'nın kalıcı önemini destekleyen üç avantaj: HTK eğitim ve tanıma hattıyla sıkı entegrasyon, ayrıştırıcı belirsizliğini ortadan kaldıran deterministik bayt düzeni ve akademik veri derlemlerinde yaygın benimseme.
WAV (Waveform Audio File Format), Microsoft ve IBM tarafından ortaklaşa geliştirilen ve i̇lk olarak Ağustos 1991'de Windows 3.1 ile birlikte yayınlanan sıkıştırılmamış bir ses kapsayıcısıdır. Resource Interchange File Format (RIFF) üzerine inşa edilen WAV, ses verilerini — en yaygın olarak doğrusal darbe-kod modülasyonu (LPCM) olarak — örnekleme hızı, bit derinliği ve kanal sayısını tanımlayan üst verilerle birlikte depolar. Bu doğrudan yapı, WAV'ı Windows üzerinde sıkıştırılmamış ses için fiili standart ve mevcut neredeyse tüm işletim sistemleri, ses editörleri ve medya oynatıcılar genelinde evrensel olarak kabul gören bir değişim formatı yapmıştır. CD kalitesinde WAV dosyaları 44,1 kHz stereo'da 16 bit örnekler kullanırken, profesyonel iş akışları düzenli olarak 192 kHz'e kadar hızlarda 24 bit veya 32 bit kayan nokta örnekleri kullanır. Büyük avantajı sıfır kayıplı doğruluktur: standart WAV sıkıştırma uygulamadığından, depolanan veri orijinal kaydın tam dijital bir temsilidir ve bu özellik onu mastering ve arşivleme için tercih edilen seçenek yapar. WAV ayrıca INFO ve BWF yığınları aracılığıyla gömülü üst verileri destekleyerek zaman damgaları ve prodüksiyon notlarına olanak tanır. Temel ödünleşim dosya boyutudur — bir dakikalık CD kalitesinde stereo yaklaşık 10 MB yer kaplar — ve 32 bit RIFF yapısı 4 GB sınırı getirirken RF64 bu tavanı kaldırmaktadır.