HTK'den MAUD'ye dönüştürücü
htk dosyalarınızı maud'ye çevrimiçi & ücretsiz olarak dönüştürün
htk
maud
HTK'i MAUD'ye dönüştürme yöntemi
Dosyaları bilgisayar, Google Drive, Dropbox, URL'den veya sayfa üzerinden sürükleyerek seçin.
maud ya da sonuç olarak ihtiyacınız olan diğer formatlardan birini seçin (200'den fazla format desteklenir)
Haydi dosyayı dönüştürün ve maud dosyanızı hemen sonra indirebilirsiniz
Formatlar hakkında
HTK, Cambridge Üniversitesi Mühendislik Bölümü'nde konuşma tanıma araştırmaları için geliştirilen bir yazılım paketi olan Hidden Markov Model Toolkit'ın yerel dalga formu kapsayıcısıdır. 1993'te i̇lk dağıtılan HTK, dünya genelinde hesaplamalı dilbilim laboratuvarlarında hızla referans platform haline gelmiş ve dosya formatı da aynı yolu izlemiştir. Her dosya, çerçeve sayısını, 100 ns birimlerinde çerçeve süresini, çerçeve başına bayt sayısını ve veri türünü belirten bir tür kodu içeren 12 baytlık bir başlık ile öncelenmiş parametre vektörleri veya ham örnekler dizisi depolar — dalga formu PCM'den Mel-frekans kepstral katsayılarına ve filtre bankası enerjilerine kadar seçenekler mevcuttur. Bu çok yönlülük, tek bir kapsayıcının hem kaynak sesi hem de çıkarılan özellikleri ayrıştırıcı değiştirmeden taşımasını sağlar. Kasıtlı olarak minimalist başlık, hizalama dolgusu veya isteğe bağlı yığınlardan kaçınarak formatı C, Python veya MATLAB'da birkaç satır i̇kili G/Ç ile okumayı kolaylaştırır. HTK'nın kalıcı önemini destekleyen üç avantaj: HTK eğitim ve tanıma hattıyla sıkı entegrasyon, ayrıştırıcı belirsizliğini ortadan kaldıran deterministik bayt düzeni ve akademik veri derlemlerinde yaygın benimseme.
MAUD, 1990'ların başında Commodore Amiga platformu için MacroSystem tarafından dijital video ve ses prodüksiyon araçlarının bir parçası olarak geliştirilen bir ses dosyası formatıdır. Amiga IFF (Interchange File Format) yığın mimarisi üzerine inşa edilen MAUD dosyaları, verileri net şekilde ayrılmış yığınlar halinde düzenler — başlık için MHDR, örnek verisi için MDAT ve üst veriler için isteğe bağlı açıklama yığınları. Format, 8 veya 16 bit derinliklerinde mono ve stereo düzenleri ile 48 kHz'e kadar örnekleme hızlarını destekler — bu özellikler Amiga donanımında profesyonel seviye spesifikasyonları temsil ediyordu. Hem işaretli doğrusal PCM hem de A-law/mü-law kodlamaları mevcut olup doğruluk ile dosya boyutu arasında seçim sunar. MAUD, MacroSystem Retina ve VLab Motion kartlarının standart 8SVX formatının karşılayamadığı senkronize ses gerektirdiği Amiga video prodüksiyon topluluğunda başlıca kullanım alanı bulmuştur. Günümüzde SoX ve libsndfile aracılığıyla dönüştürme desteği bulunmakta olup eski Amiga prodüksiyonlarının kurtarılabilirliği sağlanmaktadır. Üç belirgin avantaj öne çıkar: herhangi bir yığın farkındalığına sahip ayrıştırıcının gezinebileceği temiz IFF tabanlı yapı, tipik Amiga sesinin ötesinde 16 bit stereo yeteneği ve video oluşturmaya maksimum CPU payı bırakan hafif ek yük.