OPUS'tan NIST'e Dönüştürücü

OPUS sesinden NIST SPHERE konuşma dosyaları oluşturun

Dosyaları buraya bırakın. 1 GB maksimum dosya boyutu veya Kaydol
için
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Konuşma Araştırma Standardı

NIST SPHERE, ASR araç setleri tarafından gereklidir — OPUS kayıtlarından düzgün formatlı dosyalar üretin.

Külliyata Hazır Çıktı

Konuşma tanıma eğitimi ve analizi için doğru başlıklara sahip SPHERE dosyaları oluşturun.

Çevrimiçi İşleme

Araç seti kurulumuna gerek yok — OPUS'u NIST SPHERE'ye tarayıcınızdan dönüştürün.

OPUS'i NIST'ye dönüştürme yöntemi

1

Dosyaları bilgisayar, Google Drive, Dropbox, URL'den veya sayfa üzerinden sürükleyerek seçin.

2

nist ya da sonuç olarak ihtiyacınız olan diğer formatlardan birini seçin (200'den fazla format desteklenir)

3

Haydi dosyayı dönüştürün ve nist dosyanızı hemen sonra indirebilirsiniz

Formatlar hakkında

Opus, IETF tarafından 2012'de RFC 6716 olarak standartlaştırılmış çok yönlü, açık bir ses kodekidir. İki kodlama yaklaşımını — konuşma için SILK ve müzik için CELT — içerik türüne ve bit hızına göre aralarında geçiş yapan tek bir algoritmada birleştirir. Bu hibrit tasarım, Opus'un geniş bir kullanım yelpazesinde neredeyse tüm diğer kodeklerden üstün performans göstermesini sağlar: 6 kbps'de düşük gecikmeli ses, 128 kbps'de yüksek kaliteli müzik ve aradaki her şey. 6 ile 510 kbps arasında bit hızlarını, 48 kHz'e kadar örnekleme hızlarını ve 2,5 ms'ye kadar küçük çerçeve boyutlarını destekleyerek ana akım ses kodekleri arasında en düşük algoritmik gecikmeye sahiptir. Opus'ü özellikle çekici kılan üç avantaj vardır. Tamamen telifsiz ve açık kaynaklıdır, tescilli kodekleri geride bırakan lisanslama engellerini ortadan kaldırır. MP3'ün yaklaşık yarısı bit hızında şeffaf kalite elde eder ve eşdeğer hızlarda AAC'yı geçer. Düşük gecikmesi, WebRTC için zorunlu kodek olmasını sağlar ve bu sayede her modern tarayıcı bir Opus kod çözücüyle birlikte gelir. WhatsApp, Discord, Zoom ve YouTube gerçek zamanlı ses için Opus'a güvenir.
İlk yayın: 11 Eylül 2012
NIST SPHERE (SPeech HEader REsources), konuşma araştırmaları için özellikle DARPA tarafından finanse edilen projeler kapsamında Ulusal Standartlar ve Teknoloji Enstitüsü tarafından oluşturulmuş özel bir ses dosyası formatıdır. Format, ham ses örneklerini örnekleme hızı, kanal sayısı, kodlama türü, konuşmacı demografisi ve transkripsiyon açıklamaları gibi üst verileri kodlayan yapılandırılmış ASCII başlıkla sarar — bu özellik konuşma veri derlemleri dağıtımı için idealdir. NIST dosyaları genellikle telefon kalitesinde örnekleme hızlarında (8 kHz veya 16 kHz) sıkıştırılmamış PCM veya mü-law ses depolar, ancak kapsayıcı çeşitli kodlamaları barındıracak kadar esnektir. Önemli bir avantajı, araştırmacıların ayrıntılı veri derlemi üst verilerini doğrudan dosyaya gömmesine olanak tanıyan zengin, kendi kendini tanımlayan başlıktır ve ek dosyalara gerek kalmaz. SPHERE ayrıca TIMIT, Switchboard ve Fisher veri derlemi gibi büyük konuşma veritabanları için fiili standart haline gelmiştir ve akademik ile devlet laboratuvarlarında geniş tanınırlık sağlar. Açık spesifikasyon ve komut satırı araçlarının (sphere, h_strip, w_decode) erişilebilirliği, bu dosyaların konuşma işleme hatlarında programatik olarak dönüştürülmesini, incelenmesini ve işlenmesini kolaylaştırır.
İlk yayın: 1990

Sık Sorulan Sorular

Neden OPUS'u NIST'e dönüştürmeliyim?

NIST SPHERE, büyük konuşma işleme araç setleri için gereklidir. Dilbilim araştırması ve ASR eğitimi SPHERE formatlı ses girişi gerektirir.

NIST formatını ne kullanır?

HTK, Kaldi, NIST konuşma değerlendirme araçları ve akademik külliyatlar birincil ses formatı olarak SPHERE kullanır.

NIST ile SPH aynı mı?

Evet — her ikisi de National Institute of Standards and Technology tarafından tanımlanan SPHERE'yi (SPeech HEader Resources) ifade eder.

Hangi örnekleme hızları?

SPHERE yaygın olarak 8 veya 16 kHz kullanır — standart telefon ve geniş bantlı konuşma araştırma hızları.

Toplu dönüştürme yapabilir miyim?

Tüm OPUS konuşma veri setinizi yükleyin ve tek seferde NIST SPHERE formatına dönüştürün.