VOX'den NIST'ye dönüştürücü
vox dosyalarınızı nist'ye çevrimiçi & ücretsiz olarak dönüştürün
vox
nist
VOX'i NIST'ye dönüştürme yöntemi
Dosyaları bilgisayar, Google Drive, Dropbox, URL'den veya sayfa üzerinden sürükleyerek seçin.
nist ya da sonuç olarak ihtiyacınız olan diğer formatlardan birini seçin (200'den fazla format desteklenir)
Haydi dosyayı dönüştürün ve nist dosyanızı hemen sonra indirebilirsiniz
Formatlar hakkında
VOX, 1980'lerden bu yana telefon, etkileşimli sesli yanıt (IVR) sistemleri ve sesli posta platformlarında yaygın olarak benimsenen Dialogic ADPCM kodlaması üzerine kurulu başlıksız bir ses formatıdır. Her ses örneği, Oki Electric tarafından geliştirilen ve Dialogic Corporation'ın telefon arayüz kartlarında donanımsal olarak uygulanan bir algoritmayla 4 bite sıkıştırılır. VOX dosyaları genellikle 6000 veya 8000 Hz örnekleme hızı kullanarak müzikal kaliteden ziyade konuşma anlaşılırlığı için optimize edilmiş son derece kompakt kayıtlar üretir. Format başlık taşımadığından oynatma yazılımının örnekleme hızını ve kodlama parametrelerini önceden bilmesi gerekir — ek yükü azaltan ancak dikkatli dosya yönetimi gerektiren bir ödünleşim. VOX'un başlıca avantajı depolama verimliliğidir: 8 kHz'de bir dakikalık ses kaydı yaklaşık 240 KB yer kaplar ve bu özellik binlerce komut depolayan sistemler için pratiktir. Dialogic ADPCM, ITU-T G.726 standardına uygundur ve farklı üreticilerin telefon ekipmanları arasında birlikte çalışabilirlik sağlar. Modern çağrı merkezleri Opus) gibi kodeklerle IP tabanlı sistemlere geçse de eski IVR dağıtımlarında ve uyumluluk arşivlerinde geniş VOX kayıt kütüphaneleri dünya genelinde varlığını sürdürmektedir.
NIST SPHERE (SPeech HEader REsources), konuşma araştırmaları için özellikle DARPA tarafından finanse edilen projeler kapsamında Ulusal Standartlar ve Teknoloji Enstitüsü tarafından oluşturulmuş özel bir ses dosyası formatıdır. Format, ham ses örneklerini örnekleme hızı, kanal sayısı, kodlama türü, konuşmacı demografisi ve transkripsiyon açıklamaları gibi üst verileri kodlayan yapılandırılmış ASCII başlıkla sarar — bu özellik konuşma veri derlemleri dağıtımı için idealdir. NIST dosyaları genellikle telefon kalitesinde örnekleme hızlarında (8 kHz veya 16 kHz) sıkıştırılmamış PCM veya mü-law ses depolar, ancak kapsayıcı çeşitli kodlamaları barındıracak kadar esnektir. Önemli bir avantajı, araştırmacıların ayrıntılı veri derlemi üst verilerini doğrudan dosyaya gömmesine olanak tanıyan zengin, kendi kendini tanımlayan başlıktır ve ek dosyalara gerek kalmaz. SPHERE ayrıca TIMIT, Switchboard ve Fisher veri derlemi gibi büyük konuşma veritabanları için fiili standart haline gelmiştir ve akademik ile devlet laboratuvarlarında geniş tanınırlık sağlar. Açık spesifikasyon ve komut satırı araçlarının (sphere, h_strip, w_decode) erişilebilirliği, bu dosyaların konuşma işleme hatlarında programatik olarak dönüştürülmesini, incelenmesini ve işlenmesini kolaylaştırır.