SOU'den HTK'ye dönüştürücü

sou dosyalarınızı htk'ye çevrimiçi & ücretsiz olarak dönüştürün

Dosyaları buraya bırakın. 1 GB maksimum dosya boyutu veya Kaydol
için
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

SOU'i HTK'ye dönüştürme yöntemi

1

Dosyaları bilgisayar, Google Drive, Dropbox, URL'den veya sayfa üzerinden sürükleyerek seçin.

2

htk ya da sonuç olarak ihtiyacınız olan diğer formatlardan birini seçin (200'den fazla format desteklenir)

3

Haydi dosyayı dönüştürün ve htk dosyanızı hemen sonra indirebilirsiniz

Formatlar hakkında

SOU, SoX ses işleme çerçevesinde işaretsiz 8 bit PCM verisi (ü8) için takma ad işlevi gören bir ham ses formatı tanımlamasıdır. .sou uzantılı dosyalar, her baytın 0 ile 255 arasında tek bir genlik değerini temsil ettiği ve 128'ın sessizlik orta noktası olduğu, işaretsiz 8 bit tam sayılar olarak depolanan başlıksız, sıkıştırılmamış ses örnekleri içerir. Başlık olmadığından örnekleme hızı ve kanal sayısı gibi oynatma parametreleri harici olarak belirtilmelidir. Varsayılan varsayım genellikle 8000 Hz'de monodur, ancak veri, kayıt donanımının desteklediği herhangi bir hızı temsil edebilir. SOU'nun takma adı olduğu ü8 kodlama, WAV ve AIFF gibi yapılandırılmış ses kapsayıcılarından önceki en basit dijital ses temsillerinden biridir. Ham işaretsiz PCM, 1980'lerin sonu ve 1990'ların başında depolama kısıtlamaları ve sınırlı işlem gücünün başlıksız formatları pratik bir tercih yaptığı dönemde erken ses kartları ve dijitalleştiriciler tarafından yaygın olarak üretiliyordu. Bir avantajı mutlak sadeliktir: SOU dosyaları kapsayıcı yapıları veya üst veri ayrıştırması gerektirmeden temel dosya G/Ç yeteneğine sahip herhangi bir program tarafından okunabilir — gömülü sistemler, donanım tanılama ve ses temellerinin keşfedildiği eğitim bağlamları için kullanışlıdır. Formatın minimum ek yükü ayrıca herhangi bir modern kapsayıcıya dönüştürmenin kayıpsız ve anlık olduğu anlamına gelir, çünkü ham PCM örnekleri herhangi bir dönüştürme kodlaması gerektirmeden WAV veya AIFF başlığına sarılabilir.
Geliştirici: SoX Contributors
İlk yayın: 1991
HTK, Cambridge Üniversitesi Mühendislik Bölümü'nde konuşma tanıma araştırmaları için geliştirilen bir yazılım paketi olan Hidden Markov Model Toolkit'ın yerel dalga formu kapsayıcısıdır. 1993'te i̇lk dağıtılan HTK, dünya genelinde hesaplamalı dilbilim laboratuvarlarında hızla referans platform haline gelmiş ve dosya formatı da aynı yolu izlemiştir. Her dosya, çerçeve sayısını, 100 ns birimlerinde çerçeve süresini, çerçeve başına bayt sayısını ve veri türünü belirten bir tür kodu içeren 12 baytlık bir başlık ile öncelenmiş parametre vektörleri veya ham örnekler dizisi depolar — dalga formu PCM'den Mel-frekans kepstral katsayılarına ve filtre bankası enerjilerine kadar seçenekler mevcuttur. Bu çok yönlülük, tek bir kapsayıcının hem kaynak sesi hem de çıkarılan özellikleri ayrıştırıcı değiştirmeden taşımasını sağlar. Kasıtlı olarak minimalist başlık, hizalama dolgusu veya isteğe bağlı yığınlardan kaçınarak formatı C, Python veya MATLAB'da birkaç satır i̇kili G/Ç ile okumayı kolaylaştırır. HTK'nın kalıcı önemini destekleyen üç avantaj: HTK eğitim ve tanıma hattıyla sıkı entegrasyon, ayrıştırıcı belirsizliğini ortadan kaldıran deterministik bayt düzeni ve akademik veri derlemlerinde yaygın benimseme.
İlk yayın: 1993