HTK'den PVF'ye dönüştürücü
htk dosyalarınızı pvf'ye çevrimiçi & ücretsiz olarak dönüştürün
htk
pvf
HTK'i PVF'ye dönüştürme yöntemi
Dosyaları bilgisayar, Google Drive, Dropbox, URL'den veya sayfa üzerinden sürükleyerek seçin.
pvf ya da sonuç olarak ihtiyacınız olan diğer formatlardan birini seçin (200'den fazla format desteklenir)
Haydi dosyayı dönüştürün ve pvf dosyanızı hemen sonra indirebilirsiniz
Formatlar hakkında
HTK, Cambridge Üniversitesi Mühendislik Bölümü'nde konuşma tanıma araştırmaları için geliştirilen bir yazılım paketi olan Hidden Markov Model Toolkit'ın yerel dalga formu kapsayıcısıdır. 1993'te i̇lk dağıtılan HTK, dünya genelinde hesaplamalı dilbilim laboratuvarlarında hızla referans platform haline gelmiş ve dosya formatı da aynı yolu izlemiştir. Her dosya, çerçeve sayısını, 100 ns birimlerinde çerçeve süresini, çerçeve başına bayt sayısını ve veri türünü belirten bir tür kodu içeren 12 baytlık bir başlık ile öncelenmiş parametre vektörleri veya ham örnekler dizisi depolar — dalga formu PCM'den Mel-frekans kepstral katsayılarına ve filtre bankası enerjilerine kadar seçenekler mevcuttur. Bu çok yönlülük, tek bir kapsayıcının hem kaynak sesi hem de çıkarılan özellikleri ayrıştırıcı değiştirmeden taşımasını sağlar. Kasıtlı olarak minimalist başlık, hizalama dolgusu veya isteğe bağlı yığınlardan kaçınarak formatı C, Python veya MATLAB'da birkaç satır i̇kili G/Ç ile okumayı kolaylaştırır. HTK'nın kalıcı önemini destekleyen üç avantaj: HTK eğitim ve tanıma hattıyla sıkı entegrasyon, ayrıştırıcı belirsizliğini ortadan kaldıran deterministik bayt düzeni ve akademik veri derlemlerinde yaygın benimseme.
PVF (Portable Voice Format), Linux tabanlı telefon sistemlerinde ses mesajı depolama için tasarlanmış basit bir ses dosyası formatıdır; en dikkat çekeni ISDN4Linux ve onun vbox sesli posta uygulamasıdır. Format, 1990'ların sonlarında Linux sunucuların dijital telefon hatları üzerinden PBX ve telesekreter görevlerini giderek daha fazla üstlendiği Avrupa ISDN ekosisteminden doğmuştur. PVF dosyaları, veri formatını ve bayt sıralamasını belirten minimal düz metin başlığın önüne eklenen ham işaretli 16 bit PCM örneklerini 8000 Hz mono olarak depolar. Bu kasıtlı basitlik, formatın başlıca güçlü yönlerinden biridir — sıkıştırma ve i̇nsan tarafından okunabilir başlık olmadan PVF dosyaları standart Unix araçlarıyla ayrıştırılması, yönlendirilmesi ve işlenmesi son derece kolay dosyalardır. 8 kHz hızı, telefon bant genişliğindeki konuşmanın (300-3400 Hz) Nyquist gereksinimini karşılayarak PVF'yı ses işleme hatları için doğal bir ara format yapar. Bir diğer avantajı çapraz mimari taşınabilirliktir: açık bayt sırası bildirimi, PVF dosyalarının büyük endian ve küçük endian sistemler arasında belirsizlik olmadan taşınmasını sağlar. SoX ses araç seti yerel PVF okuma/yazma desteği sunarak modern formatlara doğrudan dönüştürme imkanı tanır.