Konverter NIST ke IRCAM

Konversikan file nist ke ircam secara online & gratis

Taruh file di sini. 1 GB Ukuran file maksimum atau Daftar
untuk
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Bagaimana cara mengubah NIST ke IRCAM

1

Pilih file dari Komputer, Google Drive, Dropbox, URL, atau dengan menyeret ke halaman ini.

2

Pilih ircam atau format lainnya yang Anda inginkan (mendukung lebih dari 200 format)

3

Tunggu proses konversi selesai dan Anda dapat mengunduh ircam setelahnya

Tentang format

NIST SPHERE (SPeech HEader REsources) adalah format file audio khusus yang dibuat oleh National Institute of Standards and Technology untuk penelitian ucapan, khususnya proyek yang didanai DARPA. Format ini membungkus sampel audio mentah dengan header ASCII terstruktur yang mengkodekan metadata seperti sample rate, jumlah channel, tipe encoding, demografi pembicara, dan anotasi transkripsi — menjadikannya ideal untuk mendistribusikan korpora ucapan. File NIST biasanya menyimpan audio PCM tanpa kompresi atau mu-law pada sample rate kualitas telepon (8 kHz atau 16 kHz), meskipun kontainernya cukup fleksibel untuk menampung berbagai encoding. Keunggulan utamanya adalah header self-documenting yang kaya yang memungkinkan peneliti menyematkan metadata korpus yang detail langsung dalam file, menghilangkan file pendamping. SPHERE juga telah menjadi standar de facto untuk database ucapan utama seperti TIMIT, Switchboard, dan korpus Fisher, memastikan pengakuan yang luas di seluruh laboratorium akademik dan pemerintah. Spesifikasi terbuka dan ketersediaan tool command-line (sphere, h_strip, w_decode) membuatnya mudah untuk mengonversi, memeriksa, dan memproses file-file ini secara programatis dalam pipeline pemrosesan ucapan.
Rilis awal: 1990
File suara IRCAM berasal dari Institut de Recherche et Coordination Acoustique/Musique — salah satu laboratorium musik komputer terkemuka di dunia, didirikan oleh komposer Pierre Boulez di Paris. Format ini dibuat pada awal 1980-an untuk melayani kebutuhan penelitian IRCAM dan sejak itu diadopsi oleh komunitas akademik dan artistik yang bekerja di persimpangan ilmu pengetahuan dan suara. File IRCAM dimulai dengan header 1024-byte yang berisi magic number, sample rate, jumlah channel, dan field tipe encoding yang mendukung PCM linear (integer 16/32-bit dan float 32-bit), mu-law, dan varian A-law. Blok header juga mengakomodasi teks anotasi bentuk bebas, memungkinkan peneliti menyematkan metadata eksperimen langsung dalam file audio. Karena payload-nya tanpa kompresi secara default, rekaman mempertahankan fidelitas penuh melalui siklus analisis dan resintesis yang berulang — esensial dalam eksperimen psikoakustik. Perangkat lunak seperti Csound, libsndfile, dan SoX membaca dan menulis format ini secara native. Keunggulan utamanya meliputi header yang terdefinisi dengan baik yang menghilangkan ambiguitas parsing, dukungan untuk sampel floating-point yang esensial dalam pekerjaan DSP ilmiah, dan akar yang dalam di komunitas musik komputer yang memastikan dukungan tooling yang berkelanjutan.
Pengembang: IRCAM
Rilis awal: 1983