WAV'dan NIST'e Dönüştürücü

WAV sesini araştırma için NIST Sphere olarak yeniden biçimlendirin

Dosyaları buraya bırakın. 1 GB maksimum dosya boyutu veya Kaydol
için
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Araştırma Standardı

NIST Sphere, konuşma külliyatları için altın standarttır — WAV kayıtlarınızı ASR ve dilbilimsel araştırmalarda doğrudan kullanmak için dönüştürün.

Külliyat Meta Verisi

NIST başlıkları, konuşma araştırma veri kümelerini düzenlemek ve yönetmek için temel olan konuşmacı, kanal ve koşul meta verilerini taşır.

Veri Kümesi Hazırlama

WAV konuşma külliyatının tamamını aynı anda NIST formatına dönüştürün — araştırma veri hattınızı kolaylaştırın.

WAV'i NIST'ye dönüştürme yöntemi

1

Dosyaları bilgisayar, Google Drive, Dropbox, URL'den veya sayfa üzerinden sürükleyerek seçin.

2

nist ya da sonuç olarak ihtiyacınız olan diğer formatlardan birini seçin (200'den fazla format desteklenir)

3

Haydi dosyayı dönüştürün ve nist dosyanızı hemen sonra indirebilirsiniz

Formatlar hakkında

WAV (Waveform Audio File Format), Microsoft ve IBM tarafından ortaklaşa geliştirilen ve i̇lk olarak Ağustos 1991'de Windows 3.1 ile birlikte yayınlanan sıkıştırılmamış bir ses kapsayıcısıdır. Resource Interchange File Format (RIFF) üzerine inşa edilen WAV, ses verilerini — en yaygın olarak doğrusal darbe-kod modülasyonu (LPCM) olarak — örnekleme hızı, bit derinliği ve kanal sayısını tanımlayan üst verilerle birlikte depolar. Bu doğrudan yapı, WAV'ı Windows üzerinde sıkıştırılmamış ses için fiili standart ve mevcut neredeyse tüm işletim sistemleri, ses editörleri ve medya oynatıcılar genelinde evrensel olarak kabul gören bir değişim formatı yapmıştır. CD kalitesinde WAV dosyaları 44,1 kHz stereo'da 16 bit örnekler kullanırken, profesyonel iş akışları düzenli olarak 192 kHz'e kadar hızlarda 24 bit veya 32 bit kayan nokta örnekleri kullanır. Büyük avantajı sıfır kayıplı doğruluktur: standart WAV sıkıştırma uygulamadığından, depolanan veri orijinal kaydın tam dijital bir temsilidir ve bu özellik onu mastering ve arşivleme için tercih edilen seçenek yapar. WAV ayrıca INFO ve BWF yığınları aracılığıyla gömülü üst verileri destekleyerek zaman damgaları ve prodüksiyon notlarına olanak tanır. Temel ödünleşim dosya boyutudur — bir dakikalık CD kalitesinde stereo yaklaşık 10 MB yer kaplar — ve 32 bit RIFF yapısı 4 GB sınırı getirirken RF64 bu tavanı kaldırmaktadır.
Geliştirici: Microsoft and IBM
İlk yayın: Ağustos 1991
NIST SPHERE (SPeech HEader REsources), konuşma araştırmaları için özellikle DARPA tarafından finanse edilen projeler kapsamında Ulusal Standartlar ve Teknoloji Enstitüsü tarafından oluşturulmuş özel bir ses dosyası formatıdır. Format, ham ses örneklerini örnekleme hızı, kanal sayısı, kodlama türü, konuşmacı demografisi ve transkripsiyon açıklamaları gibi üst verileri kodlayan yapılandırılmış ASCII başlıkla sarar — bu özellik konuşma veri derlemleri dağıtımı için idealdir. NIST dosyaları genellikle telefon kalitesinde örnekleme hızlarında (8 kHz veya 16 kHz) sıkıştırılmamış PCM veya mü-law ses depolar, ancak kapsayıcı çeşitli kodlamaları barındıracak kadar esnektir. Önemli bir avantajı, araştırmacıların ayrıntılı veri derlemi üst verilerini doğrudan dosyaya gömmesine olanak tanıyan zengin, kendi kendini tanımlayan başlıktır ve ek dosyalara gerek kalmaz. SPHERE ayrıca TIMIT, Switchboard ve Fisher veri derlemi gibi büyük konuşma veritabanları için fiili standart haline gelmiştir ve akademik ile devlet laboratuvarlarında geniş tanınırlık sağlar. Açık spesifikasyon ve komut satırı araçlarının (sphere, h_strip, w_decode) erişilebilirliği, bu dosyaların konuşma işleme hatlarında programatik olarak dönüştürülmesini, incelenmesini ve işlenmesini kolaylaştırır.
İlk yayın: 1990

Sık Sorulan Sorular

WAV'ı neden NIST'e dönüştürmeliyim?

NIST Sphere, ASR araştırmalarında kullanılan konuşma külliyatları için standart formattır. TIMIT, Switchboard ve LDC yayınları gibi veri kümeleri NIST formatını kullanır.

NIST dosyalarını hangi programlar okur?

Kaldi, HTK, Praat, SoX ve tüm büyük konuşma tanıma araç setleri NIST Sphere dosyalarını doğal olarak destekler.

NIST hangi meta verileri taşır?

NIST başlıkları, konuşma külliyatı yönetimi için temel olan konuşmacı kimliği, kayıt koşulları, kanal bilgisi ve diğer alanları içerir.

NIST kayıpsız mıdır?

NIST Sphere, zengin meta veri başlığıyla PCM ses depolar. WAV'dan ses dönüşümü tamamen kayıpsızdır.

Tüm bir veri kümesini dönüştürebilir miyim?

Tüm WAV konuşma kayıtlarınızı yükleyerek toplu olarak NIST Sphere'e dönüştürün — eksiksiz bir araştırma külliyatını verimli biçimde hazırlayın.

WAV - NIST kalite değerlendirmesi

5.0 (5 oyları)
Geribildirim sağlamak için en az 1 dosya dönüştürmeniz ve indirmeniz gerekir!