WMA'dan NIST'e Dönüştürücü

WMA sesinden NIST SPHERE konuşma dosyaları oluşturun

Dosyaları buraya bırakın. 1 GB maksimum dosya boyutu veya Kaydol
için
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Konuşma Araştırması

NIST SPHERE, ASR standardıdır — araştırma işlem hatları için WMA'yı dönüştürün.

Korpus Hazır

Konuşma tanıma eğitimi için doğru başlıklara sahip SPHERE dosyaları üretin.

Çevrimiçi İşlem

Araç takımı gerekmez — WMA'yı tarayıcınızda NIST'e dönüştürün.

WMA'i NIST'ye dönüştürme yöntemi

1

Dosyaları bilgisayar, Google Drive, Dropbox, URL'den veya sayfa üzerinden sürükleyerek seçin.

2

nist ya da sonuç olarak ihtiyacınız olan diğer formatlardan birini seçin (200'den fazla format desteklenir)

3

Haydi dosyayı dönüştürün ve nist dosyanızı hemen sonra indirebilirsiniz

Formatlar hakkında

WMA (Windows Media Audio), Microsoft tarafından geliştirilen ve i̇lk olarak 1999'da Windows Media çerçevesinin bir parçası olarak yayınlanan tescilli ses kodekleri ailesidir. MP3 ve AAC ile rekabet etmek için oluşturulan WMA Standard, Microsoft'un 64 kbps gibi düşük bit hızlarında CD'ye yakın kalite sunduğunu iddia ettiği algısal kodlama kullanır — MP3'ün karşılaştırılabilir sonuçlar için genellikle ihtiyaç duyduğu veri hızının yaklaşık yarısı. Kodek ailesi, surround ses ve yüksek çözünürlüklü ses için WMA Professional, bit düzeyinde mükemmel arşivsel sıkıştırma için WMA Lossless ve çok düşük bit hızlarında konuşma içeriği için optimize edilmiş WMA Voice içerecek şekilde genişlemiştir. Windows, Windows Media Player ve Zune ekosistemleriyle derin entegrasyon, 2000'li yıllar boyunca WMA'ya güçlü bir dağıtım avantajı sağlamıştır ve dijital haklar yönetimi (DRM) desteği onu dönemin çevrimiçi müzik mağazaları için cazip kılmıştır. Kodlama ve kod çözme, Windows tarafından yerel olarak gerçekleştirilir ve herhangi bir Windows makinesinde oynatma için üçüncü taraf yazılım gerektirmez. FFmpeg ve GStreamer gibi kütüphaneler aracılığıyla çapraz platform desteği gelişmiş olsa da WMA, Microsoft dışı cihazlarda MP3 veya AAC kadar evrensel uyumluluğa sahip değildir. Format hâlâ eski medya kütüphanelerinde karşımıza çıksa da daha yeni kodekler akış ve taşınabilir kullanım için büyük ölçüde yerini almıştır.
Geliştirici: Microsoft Corporation
İlk yayın: 1999
NIST SPHERE (SPeech HEader REsources), konuşma araştırmaları için özellikle DARPA tarafından finanse edilen projeler kapsamında Ulusal Standartlar ve Teknoloji Enstitüsü tarafından oluşturulmuş özel bir ses dosyası formatıdır. Format, ham ses örneklerini örnekleme hızı, kanal sayısı, kodlama türü, konuşmacı demografisi ve transkripsiyon açıklamaları gibi üst verileri kodlayan yapılandırılmış ASCII başlıkla sarar — bu özellik konuşma veri derlemleri dağıtımı için idealdir. NIST dosyaları genellikle telefon kalitesinde örnekleme hızlarında (8 kHz veya 16 kHz) sıkıştırılmamış PCM veya mü-law ses depolar, ancak kapsayıcı çeşitli kodlamaları barındıracak kadar esnektir. Önemli bir avantajı, araştırmacıların ayrıntılı veri derlemi üst verilerini doğrudan dosyaya gömmesine olanak tanıyan zengin, kendi kendini tanımlayan başlıktır ve ek dosyalara gerek kalmaz. SPHERE ayrıca TIMIT, Switchboard ve Fisher veri derlemi gibi büyük konuşma veritabanları için fiili standart haline gelmiştir ve akademik ile devlet laboratuvarlarında geniş tanınırlık sağlar. Açık spesifikasyon ve komut satırı araçlarının (sphere, h_strip, w_decode) erişilebilirliği, bu dosyaların konuşma işleme hatlarında programatik olarak dönüştürülmesini, incelenmesini ve işlenmesini kolaylaştırır.
İlk yayın: 1990

Sık Sorulan Sorular

Neden WMA'yı NIST'e dönüştürmeliyim?

NIST SPHERE, Kaldi ve HTK gibi konuşma tanıma araçları için zorunlu giriş formatıdır. Bu hatlar WMA'yı tamamen reddeder — eğitim veya değerlendirme öncesi SPHERE'ye dönüştürme gereklidir.

Hangi konuşma işleme araçları NIST SPHERE kullanır?

Kaldi, HTK, CMU Sphinx, NIST değerlendirme araçları ve birçok üniversite araştırma çerçevesi SPHERE girişi bekler. Format, dünya genelinde konuşma corpus dağıtımı için fiili standarttır.

NIST, SPH ve SPHERE aynı şey mi?

Evet — üçü de aynı formatı ifade eder: NIST tarafından geliştirilen SPeech HEader REsources. Dosya uzantısı değişebilir (.nist, .sph) ancak iç yapı aynıdır.

Dönüştürme ASR için ses kalitesini korur mu?

NIST SPHERE PCM ses depolar — çözülmüş WMA içeriği ek sıkıştırma olmadan aktarılır. Tanıma doğruluğu kaynak kalitesine bağlıdır ve bu dönüşüm sırasında korunur.

Tam bir WMA veri setini tek seferde NIST'e dönüştürebilir miyim?

Evet — tüm WMA kayıt setinizi yükleyin, Convertio her biri için eş zamanlı bir NIST SPHERE dosyası üretir. Araştırma hattınızda hemen kullanmak üzere tek tek veya arşiv olarak indirin.