IRCAM'den HTK'ye dönüştürücü
ircam dosyalarınızı htk'ye çevrimiçi & ücretsiz olarak dönüştürün
ircam
htk
IRCAM'i HTK'ye dönüştürme yöntemi
Dosyaları bilgisayar, Google Drive, Dropbox, URL'den veya sayfa üzerinden sürükleyerek seçin.
htk ya da sonuç olarak ihtiyacınız olan diğer formatlardan birini seçin (200'den fazla format desteklenir)
Haydi dosyayı dönüştürün ve htk dosyanızı hemen sonra indirebilirsiniz
Formatlar hakkında
IRCAM ses dosyaları, besteci Pierre Boulez tarafından Paris'te kurulan dünyanın önde gelen bilgisayar müziği laboratuvarlarından biri olan Institut de Recherche et Coordination Acoustique/Musique'ten kaynaklanmaktadır. Format, IRCAM'ın araştırma ihtiyaçlarına hizmet etmek üzere 1980'lerin başında oluşturulmuş ve o zamandan beri bilim ile ses kesişiminde çalışan akademik ve sanatsal topluluklar tarafından benimsenmiştir. Bir IRCAM dosyası, sihirli sayı, örnekleme hızı, kanal sayısı ve doğrusal PCM (16/32 bit tam sayı ve 32 bit kayan nokta), mü-law ve A-law varyantlarını destekleyen bir kodlama türü alanı içeren 1024 baytlık bir başlıkla başlar. Başlık bloğu ayrıca araştırmacıların deney üst verilerini doğrudan ses dosyasına gömmesine olanak tanıyan serbest biçimli açıklama metnini barındırır. Veri yükü varsayılan olarak sıkıştırılmamış olduğundan kayıtlar, psikoakustik deneylerde çok önemli olan ardışık analiz ve yeniden sentez döngüleri boyunca tam doğruluğu korur. Csound, libsndfile ve SoX gibi yazılımlar formatı yerel olarak okur ve yazar. Başlıca avantajları arasında ayrıştırma belirsizliğini ortadan kaldıran i̇yi tanımlanmış başlık, bilimsel DSP çalışmalarında vazgeçilmez olan kayan nokta örnek desteği ve süregelen araç desteğini garantileyen bilgisayar müziği topluluğundaki köklü geçmişi yer alır.
HTK, Cambridge Üniversitesi Mühendislik Bölümü'nde konuşma tanıma araştırmaları için geliştirilen bir yazılım paketi olan Hidden Markov Model Toolkit'ın yerel dalga formu kapsayıcısıdır. 1993'te i̇lk dağıtılan HTK, dünya genelinde hesaplamalı dilbilim laboratuvarlarında hızla referans platform haline gelmiş ve dosya formatı da aynı yolu izlemiştir. Her dosya, çerçeve sayısını, 100 ns birimlerinde çerçeve süresini, çerçeve başına bayt sayısını ve veri türünü belirten bir tür kodu içeren 12 baytlık bir başlık ile öncelenmiş parametre vektörleri veya ham örnekler dizisi depolar — dalga formu PCM'den Mel-frekans kepstral katsayılarına ve filtre bankası enerjilerine kadar seçenekler mevcuttur. Bu çok yönlülük, tek bir kapsayıcının hem kaynak sesi hem de çıkarılan özellikleri ayrıştırıcı değiştirmeden taşımasını sağlar. Kasıtlı olarak minimalist başlık, hizalama dolgusu veya isteğe bağlı yığınlardan kaçınarak formatı C, Python veya MATLAB'da birkaç satır i̇kili G/Ç ile okumayı kolaylaştırır. HTK'nın kalıcı önemini destekleyen üç avantaj: HTK eğitim ve tanıma hattıyla sıkı entegrasyon, ayrıştırıcı belirsizliğini ortadan kaldıran deterministik bayt düzeni ve akademik veri derlemlerinde yaygın benimseme.