Konverter NIST ke SOU

Konversikan file nist ke sou secara online & gratis

Taruh file di sini. 1 GB Ukuran file maksimum atau Daftar
untuk
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Bagaimana cara mengubah NIST ke SOU

1

Pilih file dari Komputer, Google Drive, Dropbox, URL, atau dengan menyeret ke halaman ini.

2

Pilih sou atau format lainnya yang Anda inginkan (mendukung lebih dari 200 format)

3

Tunggu proses konversi selesai dan Anda dapat mengunduh sou setelahnya

Tentang format

NIST SPHERE (SPeech HEader REsources) adalah format file audio khusus yang dibuat oleh National Institute of Standards and Technology untuk penelitian ucapan, khususnya proyek yang didanai DARPA. Format ini membungkus sampel audio mentah dengan header ASCII terstruktur yang mengkodekan metadata seperti sample rate, jumlah channel, tipe encoding, demografi pembicara, dan anotasi transkripsi — menjadikannya ideal untuk mendistribusikan korpora ucapan. File NIST biasanya menyimpan audio PCM tanpa kompresi atau mu-law pada sample rate kualitas telepon (8 kHz atau 16 kHz), meskipun kontainernya cukup fleksibel untuk menampung berbagai encoding. Keunggulan utamanya adalah header self-documenting yang kaya yang memungkinkan peneliti menyematkan metadata korpus yang detail langsung dalam file, menghilangkan file pendamping. SPHERE juga telah menjadi standar de facto untuk database ucapan utama seperti TIMIT, Switchboard, dan korpus Fisher, memastikan pengakuan yang luas di seluruh laboratorium akademik dan pemerintah. Spesifikasi terbuka dan ketersediaan tool command-line (sphere, h_strip, w_decode) membuatnya mudah untuk mengonversi, memeriksa, dan memproses file-file ini secara programatis dalam pipeline pemrosesan ucapan.
Rilis awal: 1990
SOU adalah designasi format audio mentah yang berfungsi sebagai alias untuk data PCM unsigned 8-bit (u8) dalam kerangka pemrosesan audio SoX. File dengan ekstensi .sou berisi sampel audio tanpa header dan tanpa kompresi yang disimpan sebagai integer unsigned 8-bit — setiap byte mewakili satu nilai amplitudo dari 0 hingga 255, dengan 128 sebagai titik tengah keheningan. Karena tidak ada header, parameter pemutaran seperti sample rate dan jumlah channel harus ditentukan secara eksternal. Asumsi default biasanya mono pada 8000 Hz, meskipun data dapat mewakili rate apa pun yang didukung perangkat keras perekaman. Encoding u8 yang di-alias-kan SOU adalah salah satu representasi audio digital paling sederhana yang mungkin, mendahului kontainer audio terstruktur seperti WAV dan AIFF. PCM unsigned mentah umumnya dihasilkan oleh kartu suara dan digitizer awal pada akhir 1980-an dan awal 1990-an, ketika keterbatasan penyimpanan dan daya pemrosesan yang terbatas membuat format tanpa header menjadi pilihan praktis. Salah satu keunggulannya adalah kesederhanaan absolut: file SOU dapat dibaca oleh program apa pun yang mampu melakukan I/O file dasar, tanpa parsing struktur kontainer atau decoding metadata — berguna untuk sistem embedded, diagnostik perangkat keras, dan konteks edukasi di mana dasar-dasar audio sedang dipelajari. Overhead minimal format ini juga berarti konversi ke kontainer modern apa pun bersifat lossless dan instan, karena sampel PCM mentah dapat dibungkus dalam header WAV atau AIFF tanpa transcoding apa pun.
Pengembang: SoX Contributors
Rilis awal: 1991