OGG'den SPH'ye Dönüştürücü

OGG'den SPHERE konuşma araştırma sesi üretin

Dosyaları buraya bırakın. 1 GB maksimum dosya boyutu veya Kaydol
için
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Konuşma Külliyatı Standardı

SPH, büyük konuşma veri kümelerinin arkasındaki formattır — OGG kayıtlarını düzgün biçimlendirilmiş araştırma sesine dönüştürün.

Veri Kümesi Hazırlama

Tüm OGG konuşma koleksiyonlarını tek işlemde SPH'ye dönüştürün — araştırma külliyatlarını tek seferde hazırlayın.

Çevrimiçi Dönüşüm

Konuşma araç seti kurulumu gerekmez — OGG'den doğrudan tarayıcınızda SPH dosyaları üretin.

OGG'i SPH'ye dönüştürme yöntemi

1

Dosyaları bilgisayar, Google Drive, Dropbox, URL'den veya sayfa üzerinden sürükleyerek seçin.

2

sph ya da sonuç olarak ihtiyacınız olan diğer formatlardan birini seçin (200'den fazla format desteklenir)

3

Haydi dosyayı dönüştürün ve sph dosyanızı hemen sonra indirebilirsiniz

Formatlar hakkında

OGG Vorbis, her i̇kisi de Xiph.Org Vakfı tarafından geliştirilen Ogg kapsayıcı formatı içindeki açık, telifsiz kayıplı ses kodekidir. Vorbis, MP3 ve AAC'ye patent içermeyen bir alternatif olarak tasarlanmıştır ve çerçeve başına sinyal karmaşıklığına uyum sağlayan değişken bit hızlı kodlama ile modifiye ayrık kosinüs dönüşümü (MDCT) kodlaması kullanır. Kör dinleme testleri, Vorbis'ın özellikle 96-192 kbps aralığında MP3 ile eşleşen veya onu aşan algısal kalite sunduğunu tutarlı olarak göstermiştir. Format, 8 kHz'den 192 kHz'e kadar örnekleme hızlarını ve 1 ile 255 arasında kanalı destekleyerek mono sesten surround mikslere kadar her şeyi kapsar. Öne çıkan avantajı lisans ücretlerinin tamamen bulunmamasıdır — oyun geliştiricileri, akış platformları ve donanım üreticileri telif kaygısı olmadan Vorbis uygulayabilir. Spotify tam da bu nedenle yıllarca birincil akış kodeki olarak Vorbis'e güvenmiştir. Format ayrıca düşük bit hızlarında kalite düşüşünü birçok rakibinden daha zarif biçimde yönetir — bu yüzden depolama alanının kısıtlı olduğu ve binlerce ses efektinin alan için yarıştığı video oyunlarında popülerliğini korumaktadır. VLC, Firefox, Chrome ve Android yerel Vorbis kod çözme desteği sunar.
Geliştirici: Xiph.Org Foundation
İlk yayın: 1 Mayıs 2000
SPH, 1990 civarında ABD Ulusal Standartlar ve Teknoloji Enstitüsü tarafından oluşturulan NIST SPHERE (SPeech HEader REsources) formatında depolanan sesin dosya uzantısıdır. Konuşma araştırması için tasarlanan SPH dosyaları, veritabanı tanımlayıcıları, kanal sayıları, örnekleme hızları, bayt sıralaması ve sıkıştırma türü gibi üst verilerle dolu 1024 baytlık ASCII başlık taşır — her kaydı kendi kendini tanımlayan hâle getirir. Temel ses genellikle 16 kHz'de örneklenmiş 16 bit doğrusal PCM'dır, ancak diğer yapılandırmalara da izin verilir. NIST, DARPA ve dünya genelindeki üniversitelerdeki araştırmacılar, modern otomatik konuşma tanıma sistemlerinin temelini oluşturan TIMIT, Switchboard ve LDC koleksiyonları gibi konuşma veri derlemlerini dağıtmak için SPH'ye güvenir. Önemli bir avantajı, i̇nsan tarafından okunabilir başlığın betiklerin i̇kili kod çözme olmadan kayıt üst verilerini ayrıştırmasına olanak tanımasıdır. Formatın sıkı standardizasyonu ayrıca kurumlar ve platformlar arasında veri setleri paylaşırken belirsizliği ortadan kaldırır. SPH dosyaları sıkıştırılmamış PCM depoladığından tam ses doğruluğunu korur — küçük artefaktların bile sonuçları çarpıtabileceği akustik modeller eğitilirken kritik bir özellik.
İlk yayın: 1990

Sık Sorulan Sorular

Neden OGG'yi SPH'ye dönüştürmeliyim?

SPH (SPHERE), konuşma araştırma veri kümeleri için NIST tarafından tanımlanan formattır. ASR eğitim iş akışları ve dilbilim araçları SPHERE formatında girdi bekler.

SPH dosyalarını ne kullanır?

Kaldi, HTK, NIST değerlendirme araçları ve TIMIT, Switchboard gibi akademik konuşma külliyatları ses formatı olarak SPHERE kullanır.

SPH ile NIST aynı mı?

SPH ve NIST her ikisi de SPHERE formatına atıfta bulunur — Ulusal Standartlar ve Teknoloji Enstitüsü tarafından tanımlanan SPeech HEader Resources.

SPH hangi örnekleme hızını kullanır?

Konuşma külliyatları genellikle 8 veya 16 kHz kullanır. Dönüştürücü OGG kaynağından yeniden örneklemeyi otomatik olarak yapar.

Tüm veri kümesini dönüştürebilir miyim?

Bir grup OGG konuşma kaydı yükleyin ve her dosya için tek seferde SPH çıktısı üretin — ASR araştırması için hazır.

OGG - SPH kalite değerlendirmesi

4.0 (1 oyları)
Geribildirim sağlamak için en az 1 dosya dönüştürmeniz ve indirmeniz gerekir!