HTK'den IMA'ye dönüştürücü
htk dosyalarınızı ima'ye çevrimiçi & ücretsiz olarak dönüştürün
htk
ima
HTK'i IMA'ye dönüştürme yöntemi
Dosyaları bilgisayar, Google Drive, Dropbox, URL'den veya sayfa üzerinden sürükleyerek seçin.
ima ya da sonuç olarak ihtiyacınız olan diğer formatlardan birini seçin (200'den fazla format desteklenir)
Haydi dosyayı dönüştürün ve ima dosyanızı hemen sonra indirebilirsiniz
Formatlar hakkında
HTK, Cambridge Üniversitesi Mühendislik Bölümü'nde konuşma tanıma araştırmaları için geliştirilen bir yazılım paketi olan Hidden Markov Model Toolkit'ın yerel dalga formu kapsayıcısıdır. 1993'te i̇lk dağıtılan HTK, dünya genelinde hesaplamalı dilbilim laboratuvarlarında hızla referans platform haline gelmiş ve dosya formatı da aynı yolu izlemiştir. Her dosya, çerçeve sayısını, 100 ns birimlerinde çerçeve süresini, çerçeve başına bayt sayısını ve veri türünü belirten bir tür kodu içeren 12 baytlık bir başlık ile öncelenmiş parametre vektörleri veya ham örnekler dizisi depolar — dalga formu PCM'den Mel-frekans kepstral katsayılarına ve filtre bankası enerjilerine kadar seçenekler mevcuttur. Bu çok yönlülük, tek bir kapsayıcının hem kaynak sesi hem de çıkarılan özellikleri ayrıştırıcı değiştirmeden taşımasını sağlar. Kasıtlı olarak minimalist başlık, hizalama dolgusu veya isteğe bağlı yığınlardan kaçınarak formatı C, Python veya MATLAB'da birkaç satır i̇kili G/Ç ile okumayı kolaylaştırır. HTK'nın kalıcı önemini destekleyen üç avantaj: HTK eğitim ve tanıma hattıyla sıkı entegrasyon, ayrıştırıcı belirsizliğini ortadan kaldıran deterministik bayt düzeni ve akademik veri derlemlerinde yaygın benimseme.
IMA ADPCM (Adaptive Differential Pulse-Code Modulation), erken multimedya PC'lere ve gömülü cihazlara uygun hafif, telifsiz bir sıkıştırma şemasına duyulan ihtiyacı karşılamak üzere 1992'de Interactive Multimedia Association tarafından yayınlanan kompakt bir ses kodlama standardıdır. Algoritma, her örneği önceki örnekten nicelleştirilmiş farkı temsil eden 4 bitlik bir yarım bayt olarak kodlarken, uyarlanabilir adım boyutu tablosu sinyal genliğini izlemek için dinamik olarak ayarlanır — 16 bit PCM üzerinde sabit 4:1 sıkıştırma oranı sunar. Kod çözme, örnek başına yalnızca bir tam sayı çarpma-toplama ve küçük bir arama tablosu gerektirir, bu nedenle 1990'ların mütevazı CPU'ları bile özel DSP olmadan gerçek zamanlı sıkıştırma açabiliyordu. Format, multimedya dünyasına derinlemesine yerleşmiştir: Microsoft bunu WAV dosyaları için standart ACM kodeki olarak benimsemiş, oyun motorları ses efektleri için kullanmış ve telefon ekipmanları ses depolama için uygulamıştır. Avantajları kalıcıdır: öngörülebilir 4:1 boyut küçültme kısıtlı ortamlarda tampon tahsisini basitleştirir, kod çözme yolu 8 bit mikrodenetleyicilerde çalışır ve açık spesifikasyon IMA ADPCM'yı bilişim tarihinin en yaygın uygulanan ses kodeklerinden biri yapmıştır.