HTK'den SLN'ye dönüştürücü
htk dosyalarınızı sln'ye çevrimiçi & ücretsiz olarak dönüştürün
htk
sln
HTK'i SLN'ye dönüştürme yöntemi
Dosyaları bilgisayar, Google Drive, Dropbox, URL'den veya sayfa üzerinden sürükleyerek seçin.
sln ya da sonuç olarak ihtiyacınız olan diğer formatlardan birini seçin (200'den fazla format desteklenir)
Haydi dosyayı dönüştürün ve sln dosyanızı hemen sonra indirebilirsiniz
Formatlar hakkında
HTK, Cambridge Üniversitesi Mühendislik Bölümü'nde konuşma tanıma araştırmaları için geliştirilen bir yazılım paketi olan Hidden Markov Model Toolkit'ın yerel dalga formu kapsayıcısıdır. 1993'te i̇lk dağıtılan HTK, dünya genelinde hesaplamalı dilbilim laboratuvarlarında hızla referans platform haline gelmiş ve dosya formatı da aynı yolu izlemiştir. Her dosya, çerçeve sayısını, 100 ns birimlerinde çerçeve süresini, çerçeve başına bayt sayısını ve veri türünü belirten bir tür kodu içeren 12 baytlık bir başlık ile öncelenmiş parametre vektörleri veya ham örnekler dizisi depolar — dalga formu PCM'den Mel-frekans kepstral katsayılarına ve filtre bankası enerjilerine kadar seçenekler mevcuttur. Bu çok yönlülük, tek bir kapsayıcının hem kaynak sesi hem de çıkarılan özellikleri ayrıştırıcı değiştirmeden taşımasını sağlar. Kasıtlı olarak minimalist başlık, hizalama dolgusu veya isteğe bağlı yığınlardan kaçınarak formatı C, Python veya MATLAB'da birkaç satır i̇kili G/Ç ile okumayı kolaylaştırır. HTK'nın kalıcı önemini destekleyen üç avantaj: HTK eğitim ve tanıma hattıyla sıkı entegrasyon, ayrıştırıcı belirsizliğini ortadan kaldıran deterministik bayt düzeni ve akademik veri derlemlerinde yaygın benimseme.
SLN (Signed Linear), 8000 Hz mono olarak 16 bit işaretli doğrusal PCM örnekleri depolayan başlıksız bir ham ses formatıdır ve en yakından Digium (şimdi Sangoma Technologies) tarafından geliştirilen açık kaynak PBX çerçevesi Asterisk ile ilişkilidir. Asterisk içinde SLN, yerel dahili ses temsili olarak kullanılır: her kodek dönüştürme işlemi ara adım olarak işaretli doğrusaldan geçer. Bu durum SLN'yı Asterisk'ın kodek çeviri mimarisinin omurgası yapar. Format yalnızca ham örnekler içerir — başlık yok, üst veri yok, çerçeveleme yok — dolayısıyla parametrelerin önceden bilinmesi gerekir. Bu kendi kendini tanımlama eksikliği sınırlayıcı görünebilse de aslında bir avantajdır çünkü telefonda örnek formatı kural gereği sabittir ve binlerce eşzamanlı kanal boyunca her ek yük baytı önemlidir. 8000 Hz hızı, geleneksel telefonun tam 300-3400 Hz ses bandını yakalayan G.711 standardıyla uyumludur. Asterisk ayrıca geniş bant ses için genişletilmiş varyantları (sln16, sln32, sln48) destekler. SLN dosyaları kod çözme gerektirmez — yalnızca doğrudan bellek eşleme — bu da onları yüksek yoğunluklu VoIP ortamlarında gerçek zamanlı miksleme, konferans ve komut oynatma için ideal kılar.