SPH'den VOX'ye dönüştürücü

sph dosyalarınızı vox'ye çevrimiçi & ücretsiz olarak dönüştürün

Dosyaları buraya bırakın. 1 GB maksimum dosya boyutu veya Kaydol
için
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

SPH'i VOX'ye dönüştürme yöntemi

1

Dosyaları bilgisayar, Google Drive, Dropbox, URL'den veya sayfa üzerinden sürükleyerek seçin.

2

vox ya da sonuç olarak ihtiyacınız olan diğer formatlardan birini seçin (200'den fazla format desteklenir)

3

Haydi dosyayı dönüştürün ve vox dosyanızı hemen sonra indirebilirsiniz

Formatlar hakkında

SPH, 1990 civarında ABD Ulusal Standartlar ve Teknoloji Enstitüsü tarafından oluşturulan NIST SPHERE (SPeech HEader REsources) formatında depolanan sesin dosya uzantısıdır. Konuşma araştırması için tasarlanan SPH dosyaları, veritabanı tanımlayıcıları, kanal sayıları, örnekleme hızları, bayt sıralaması ve sıkıştırma türü gibi üst verilerle dolu 1024 baytlık ASCII başlık taşır — her kaydı kendi kendini tanımlayan hâle getirir. Temel ses genellikle 16 kHz'de örneklenmiş 16 bit doğrusal PCM'dır, ancak diğer yapılandırmalara da izin verilir. NIST, DARPA ve dünya genelindeki üniversitelerdeki araştırmacılar, modern otomatik konuşma tanıma sistemlerinin temelini oluşturan TIMIT, Switchboard ve LDC koleksiyonları gibi konuşma veri derlemlerini dağıtmak için SPH'ye güvenir. Önemli bir avantajı, i̇nsan tarafından okunabilir başlığın betiklerin i̇kili kod çözme olmadan kayıt üst verilerini ayrıştırmasına olanak tanımasıdır. Formatın sıkı standardizasyonu ayrıca kurumlar ve platformlar arasında veri setleri paylaşırken belirsizliği ortadan kaldırır. SPH dosyaları sıkıştırılmamış PCM depoladığından tam ses doğruluğunu korur — küçük artefaktların bile sonuçları çarpıtabileceği akustik modeller eğitilirken kritik bir özellik.
İlk yayın: 1990
VOX, 1980'lerden bu yana telefon, etkileşimli sesli yanıt (IVR) sistemleri ve sesli posta platformlarında yaygın olarak benimsenen Dialogic ADPCM kodlaması üzerine kurulu başlıksız bir ses formatıdır. Her ses örneği, Oki Electric tarafından geliştirilen ve Dialogic Corporation'ın telefon arayüz kartlarında donanımsal olarak uygulanan bir algoritmayla 4 bite sıkıştırılır. VOX dosyaları genellikle 6000 veya 8000 Hz örnekleme hızı kullanarak müzikal kaliteden ziyade konuşma anlaşılırlığı için optimize edilmiş son derece kompakt kayıtlar üretir. Format başlık taşımadığından oynatma yazılımının örnekleme hızını ve kodlama parametrelerini önceden bilmesi gerekir — ek yükü azaltan ancak dikkatli dosya yönetimi gerektiren bir ödünleşim. VOX'un başlıca avantajı depolama verimliliğidir: 8 kHz'de bir dakikalık ses kaydı yaklaşık 240 KB yer kaplar ve bu özellik binlerce komut depolayan sistemler için pratiktir. Dialogic ADPCM, ITU-T G.726 standardına uygundur ve farklı üreticilerin telefon ekipmanları arasında birlikte çalışabilirlik sağlar. Modern çağrı merkezleri Opus gibi kodeklerle IP tabanlı sistemlere geçse de eski IVR dağıtımlarında ve uyumluluk arşivlerinde geniş VOX kayıt kütüphaneleri dünya genelinde varlığını sürdürmektedir.
Geliştirici: Dialogic Corporation
İlk yayın: 1983