NIST'den SOU'ye dönüştürücü

nist dosyalarınızı sou'ye çevrimiçi & ücretsiz olarak dönüştürün

Dosyaları buraya bırakın. 1 GB maksimum dosya boyutu veya Kaydol
için
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

NIST'i SOU'ye dönüştürme yöntemi

1

Dosyaları bilgisayar, Google Drive, Dropbox, URL'den veya sayfa üzerinden sürükleyerek seçin.

2

sou ya da sonuç olarak ihtiyacınız olan diğer formatlardan birini seçin (200'den fazla format desteklenir)

3

Haydi dosyayı dönüştürün ve sou dosyanızı hemen sonra indirebilirsiniz

Formatlar hakkında

NIST SPHERE (SPeech HEader REsources), konuşma araştırmaları için özellikle DARPA tarafından finanse edilen projeler kapsamında Ulusal Standartlar ve Teknoloji Enstitüsü tarafından oluşturulmuş özel bir ses dosyası formatıdır. Format, ham ses örneklerini örnekleme hızı, kanal sayısı, kodlama türü, konuşmacı demografisi ve transkripsiyon açıklamaları gibi üst verileri kodlayan yapılandırılmış ASCII başlıkla sarar — bu özellik konuşma veri derlemleri dağıtımı için idealdir. NIST dosyaları genellikle telefon kalitesinde örnekleme hızlarında (8 kHz veya 16 kHz) sıkıştırılmamış PCM veya mü-law ses depolar, ancak kapsayıcı çeşitli kodlamaları barındıracak kadar esnektir. Önemli bir avantajı, araştırmacıların ayrıntılı veri derlemi üst verilerini doğrudan dosyaya gömmesine olanak tanıyan zengin, kendi kendini tanımlayan başlıktır ve ek dosyalara gerek kalmaz. SPHERE ayrıca TIMIT, Switchboard ve Fisher veri derlemi gibi büyük konuşma veritabanları için fiili standart haline gelmiştir ve akademik ile devlet laboratuvarlarında geniş tanınırlık sağlar. Açık spesifikasyon ve komut satırı araçlarının (sphere, h_strip, w_decode) erişilebilirliği, bu dosyaların konuşma işleme hatlarında programatik olarak dönüştürülmesini, incelenmesini ve işlenmesini kolaylaştırır.
İlk yayın: 1990
SOU, SoX ses işleme çerçevesinde işaretsiz 8 bit PCM verisi (ü8) için takma ad işlevi gören bir ham ses formatı tanımlamasıdır. .sou uzantılı dosyalar, her baytın 0 ile 255 arasında tek bir genlik değerini temsil ettiği ve 128'ın sessizlik orta noktası olduğu, işaretsiz 8 bit tam sayılar olarak depolanan başlıksız, sıkıştırılmamış ses örnekleri içerir. Başlık olmadığından örnekleme hızı ve kanal sayısı gibi oynatma parametreleri harici olarak belirtilmelidir. Varsayılan varsayım genellikle 8000 Hz'de monodur, ancak veri, kayıt donanımının desteklediği herhangi bir hızı temsil edebilir. SOU'nun takma adı olduğu ü8 kodlama, WAV ve AIFF gibi yapılandırılmış ses kapsayıcılarından önceki en basit dijital ses temsillerinden biridir. Ham işaretsiz PCM, 1980'lerin sonu ve 1990'ların başında depolama kısıtlamaları ve sınırlı işlem gücünün başlıksız formatları pratik bir tercih yaptığı dönemde erken ses kartları ve dijitalleştiriciler tarafından yaygın olarak üretiliyordu. Bir avantajı mutlak sadeliktir: SOU dosyaları kapsayıcı yapıları veya üst veri ayrıştırması gerektirmeden temel dosya G/Ç yeteneğine sahip herhangi bir program tarafından okunabilir — gömülü sistemler, donanım tanılama ve ses temellerinin keşfedildiği eğitim bağlamları için kullanışlıdır. Formatın minimum ek yükü ayrıca herhangi bir modern kapsayıcıya dönüştürmenin kayıpsız ve anlık olduğu anlamına gelir, çünkü ham PCM örnekleri herhangi bir dönüştürme kodlaması gerektirmeden WAV veya AIFF başlığına sarılabilir.
Geliştirici: SoX Contributors
İlk yayın: 1991