HTK'den AMB'ye dönüştürücü

htk dosyalarınızı amb'ye çevrimiçi & ücretsiz olarak dönüştürün

Dosyaları buraya bırakın. 1 GB maksimum dosya boyutu veya Kaydol
için
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

HTK'i AMB'ye dönüştürme yöntemi

1

Dosyaları bilgisayar, Google Drive, Dropbox, URL'den veya sayfa üzerinden sürükleyerek seçin.

2

amb ya da sonuç olarak ihtiyacınız olan diğer formatlardan birini seçin (200'den fazla format desteklenir)

3

Haydi dosyayı dönüştürün ve amb dosyanızı hemen sonra indirebilirsiniz

Formatlar hakkında

HTK, Cambridge Üniversitesi Mühendislik Bölümü'nde konuşma tanıma araştırmaları için geliştirilen bir yazılım paketi olan Hidden Markov Model Toolkit'ın yerel dalga formu kapsayıcısıdır. 1993'te i̇lk dağıtılan HTK, dünya genelinde hesaplamalı dilbilim laboratuvarlarında hızla referans platform haline gelmiş ve dosya formatı da aynı yolu izlemiştir. Her dosya, çerçeve sayısını, 100 ns birimlerinde çerçeve süresini, çerçeve başına bayt sayısını ve veri türünü belirten bir tür kodu içeren 12 baytlık bir başlık ile öncelenmiş parametre vektörleri veya ham örnekler dizisi depolar — dalga formu PCM'den Mel-frekans kepstral katsayılarına ve filtre bankası enerjilerine kadar seçenekler mevcuttur. Bu çok yönlülük, tek bir kapsayıcının hem kaynak sesi hem de çıkarılan özellikleri ayrıştırıcı değiştirmeden taşımasını sağlar. Kasıtlı olarak minimalist başlık, hizalama dolgusu veya isteğe bağlı yığınlardan kaçınarak formatı C, Python veya MATLAB'da birkaç satır i̇kili G/Ç ile okumayı kolaylaştırır. HTK'nın kalıcı önemini destekleyen üç avantaj: HTK eğitim ve tanıma hattıyla sıkı entegrasyon, ayrıştırıcı belirsizliğini ortadan kaldıran deterministik bayt düzeni ve akademik veri derlemlerinde yaygın benimseme.
İlk yayın: 1993
AMB dosyaları, 1970'lerde Michael Gerzon tarafından geliştirilen tam küre surround ses tekniği olan Ambisonik B-format ile kodlanmış ses içerir. 5.1 veya 7.1 gibi kanal tabanlı sistemlerin aksine, Ambisonics küresel harmonikler kullanarak eksiksiz üç boyutlu bir ses alanı yakalar — birinci derece B-format dört kanaldan oluşur: W (omnidireksiyonel), X (ön-arka), Y (sol-sağ) ve Z (yukarı-aşağı). Bu temsil hoparlörden bağımsızdır, yani tek bir kayıt herhangi bir hoparlör düzenine veya binaural kulaklıklara yeniden miksaj gerekmeden çözümlenebilir. AMB dosyaları genellikle sıkıştırılmamış PCM verisi depolar ve SoX gibi araçlar veya özel eklentilerle işlenir. Temel avantajı uzamsal esnekliktir — içerik üreticileri stereo, surround veya immersif oynatmaya uyum sağlayan tek bir ana dosya üretir. Format aynı zamanda zarif biçimde ölçeklenir: daha yüksek dereceli Ambisonics, aynı matematiksel çerçeve üzerinde artırılmış uzamsal hassasiyet için kanallar ekler. Sanal gerçeklik, 360 derece video ve oyun için uzamsal ses teknolojilerinin büyümesiyle birlikte Ambisonics yeniden popülerlik kazanmış ve YouTube gibi platformlar tarafından immersif medya sunumu için benimsenmiştir.
İlk yayın: 1975