OGG'den NIST'e Dönüştürücü

OGG sesinden NIST SPHERE konuşma araştırma dosyaları oluşturun

Dosyaları buraya bırakın. 1 GB maksimum dosya boyutu veya Kaydol
için
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Konuşma Araştırma Standardı

NIST SPHERE, başlıca konuşma işleme araç setleri tarafından gereklidir — OGG kayıtlarınızdan doğru formatta dosyalar üretin.

Külliyata Hazır Çıktı

Konuşma tanıma eğitimi ve dilbilimsel analiz için hazır, doğru başlıklara sahip SPHERE dosyaları oluşturun.

Çevrimiçi İşleme

Konuşma araç seti kurulumu gerekmez — OGG'den NIST SPHERE'e dönüşümü doğrudan tarayıcınızda yapın.

OGG'i NIST'ye dönüştürme yöntemi

1

Dosyaları bilgisayar, Google Drive, Dropbox, URL'den veya sayfa üzerinden sürükleyerek seçin.

2

nist ya da sonuç olarak ihtiyacınız olan diğer formatlardan birini seçin (200'den fazla format desteklenir)

3

Haydi dosyayı dönüştürün ve nist dosyanızı hemen sonra indirebilirsiniz

Formatlar hakkında

OGG Vorbis, her i̇kisi de Xiph.Org Vakfı tarafından geliştirilen Ogg kapsayıcı formatı içindeki açık, telifsiz kayıplı ses kodekidir. Vorbis, MP3 ve AAC'ye patent içermeyen bir alternatif olarak tasarlanmıştır ve çerçeve başına sinyal karmaşıklığına uyum sağlayan değişken bit hızlı kodlama ile modifiye ayrık kosinüs dönüşümü (MDCT) kodlaması kullanır. Kör dinleme testleri, Vorbis'ın özellikle 96-192 kbps aralığında MP3 ile eşleşen veya onu aşan algısal kalite sunduğunu tutarlı olarak göstermiştir. Format, 8 kHz'den 192 kHz'e kadar örnekleme hızlarını ve 1 ile 255 arasında kanalı destekleyerek mono sesten surround mikslere kadar her şeyi kapsar. Öne çıkan avantajı lisans ücretlerinin tamamen bulunmamasıdır — oyun geliştiricileri, akış platformları ve donanım üreticileri telif kaygısı olmadan Vorbis uygulayabilir. Spotify tam da bu nedenle yıllarca birincil akış kodeki olarak Vorbis'e güvenmiştir. Format ayrıca düşük bit hızlarında kalite düşüşünü birçok rakibinden daha zarif biçimde yönetir — bu yüzden depolama alanının kısıtlı olduğu ve binlerce ses efektinin alan için yarıştığı video oyunlarında popülerliğini korumaktadır. VLC, Firefox, Chrome ve Android yerel Vorbis kod çözme desteği sunar.
Geliştirici: Xiph.Org Foundation
İlk yayın: 1 Mayıs 2000
NIST SPHERE (SPeech HEader REsources), konuşma araştırmaları için özellikle DARPA tarafından finanse edilen projeler kapsamında Ulusal Standartlar ve Teknoloji Enstitüsü tarafından oluşturulmuş özel bir ses dosyası formatıdır. Format, ham ses örneklerini örnekleme hızı, kanal sayısı, kodlama türü, konuşmacı demografisi ve transkripsiyon açıklamaları gibi üst verileri kodlayan yapılandırılmış ASCII başlıkla sarar — bu özellik konuşma veri derlemleri dağıtımı için idealdir. NIST dosyaları genellikle telefon kalitesinde örnekleme hızlarında (8 kHz veya 16 kHz) sıkıştırılmamış PCM veya mü-law ses depolar, ancak kapsayıcı çeşitli kodlamaları barındıracak kadar esnektir. Önemli bir avantajı, araştırmacıların ayrıntılı veri derlemi üst verilerini doğrudan dosyaya gömmesine olanak tanıyan zengin, kendi kendini tanımlayan başlıktır ve ek dosyalara gerek kalmaz. SPHERE ayrıca TIMIT, Switchboard ve Fisher veri derlemi gibi büyük konuşma veritabanları için fiili standart haline gelmiştir ve akademik ile devlet laboratuvarlarında geniş tanınırlık sağlar. Açık spesifikasyon ve komut satırı araçlarının (sphere, h_strip, w_decode) erişilebilirliği, bu dosyaların konuşma işleme hatlarında programatik olarak dönüştürülmesini, incelenmesini ve işlenmesini kolaylaştırır.
İlk yayın: 1990

Sık Sorulan Sorular

Neden OGG'yi NIST'e dönüştürmeliyim?

NIST SPHERE, konuşma araştırma veri kümeleri için standart formattır. Dilbilimsel araştırma araçları ve ASR eğitim iş akışları SPHERE formatında ses bekler.

NIST dosyalarını ne kullanır?

HTK, Kaldi, NIST konuşma değerlendirme araçları ve akademik konuşma araştırma külliyatları birincil ses formatı olarak SPHERE kullanır.

NIST ile SPHERE aynı şey mi?

Evet — NIST SPHERE (SPeech HEader Resources), Ulusal Standartlar ve Teknoloji Enstitüsü tarafından konuşma araştırması için tanımlanmıştır.

NIST hangi örnekleme hızlarını destekler?

SPHERE dosyaları genellikle 8 veya 16 kHz kullanır — telefon ve geniş bant konuşma araştırması için standart hızlar.

OGG'yi NIST'e toplu dönüştürebilir miyim?

OGG konuşma veri kümenizin tamamını yükleyin ve hepsini tek seferde NIST SPHERE formatına dönüştürün — araştırma iş akışlarınız için hazır.