Konverter MPEG ke NIST

Buat audio NIST SPHERE dari file video MPEG secara online

Taruh file di sini. 1 GB Ukuran file maksimum atau Daftar
untuk
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Sesuai Standar

Output NIST SPHERE mengikuti spesifikasi National Institute of Standards and Technology — kompatibel dengan semua framework penelitian ASR utama.

MPEG ke NIST Langsung

Langsung dari video MPEG ke audio ucapan NIST dalam satu langkah. Tanpa ekstraksi audio manual atau konversi format perantara.

Berbasis Browser

Tidak perlu toolkit SPHERE atau dekoder MPEG secara lokal. Konversi MPEG ke NIST melalui browser web di perangkat atau platform apa pun.

Bagaimana cara mengubah MPEG ke NIST

1

Pilih file dari Komputer, Google Drive, Dropbox, URL, atau dengan menyeret ke halaman ini.

2

Pilih nist atau format lainnya yang Anda inginkan (mendukung lebih dari 200 format)

3

Tunggu proses konversi selesai dan Anda dapat mengunduh nist setelahnya

Tentang format

MPEG (MPEG-1) adalah standar kompresi video dan audio fundamental yang dipublikasikan pada Agustus 1993 oleh Moving Picture Experts Group sebagai ISO/IEC 11172. Ini adalah standar internasional pertama untuk kompresi lossy gambar bergerak dan audio terkait, menetapkan prinsip dan teknik yang akan mempengaruhi hampir semua codec video berikutnya. Video MPEG-1 mencapai kompresi melalui kombinasi prediksi terkompensasi gerakan, pengodean discrete cosine transform, dan pengodean entropi panjang variabel, yang diorganisir dalam tiga tipe frame: I-frame (intra-coded), P-frame (predicted), dan B-frame (bidirectionally predicted). Standar ini menargetkan bit rate sekitar 1,5 Mbps untuk gabungan audio dan video, menghasilkan kualitas yang sebanding dengan kaset VHS pada resolusi SIF (352x240 untuk NTSC). Tingkat kompresi ini secara khusus dipilih untuk menyamai throughput data dari drive CD-ROM kecepatan 1x, memungkinkan format Video CD yang membawa video digital kepada konsumen pada awal 1990-an. Komponen audionya, khususnya Layer III (MP3), kemudian menjadi format audio paling berpengaruh dalam sejarah. Struktur frame I/P/B, pendekatan estimasi gerakan, dan pengodean transformasi berbasis blok menetapkan template arsitektur yang diikuti oleh setiap codec video utama sejak saat itu, dari MPEG-2 hingga H.264 dan seterusnya. Meskipun sudah lama terlampaui dalam efisiensi kompresi, MPEG-1 tetap didukung oleh hampir semua perangkat lunak media.
Rilis awal: Agustus 1993
NIST SPHERE (SPeech HEader REsources) adalah format file audio khusus yang dibuat oleh National Institute of Standards and Technology untuk penelitian ucapan, khususnya proyek yang didanai DARPA. Format ini membungkus sampel audio mentah dengan header ASCII terstruktur yang mengkodekan metadata seperti sample rate, jumlah channel, tipe encoding, demografi pembicara, dan anotasi transkripsi — menjadikannya ideal untuk mendistribusikan korpora ucapan. File NIST biasanya menyimpan audio PCM tanpa kompresi atau mu-law pada sample rate kualitas telepon (8 kHz atau 16 kHz), meskipun kontainernya cukup fleksibel untuk menampung berbagai encoding. Keunggulan utamanya adalah header self-documenting yang kaya yang memungkinkan peneliti menyematkan metadata korpus yang detail langsung dalam file, menghilangkan file pendamping. SPHERE juga telah menjadi standar de facto untuk database ucapan utama seperti TIMIT, Switchboard, dan korpus Fisher, memastikan pengakuan yang luas di seluruh laboratorium akademik dan pemerintah. Spesifikasi terbuka dan ketersediaan tool command-line (sphere, h_strip, w_decode) membuatnya mudah untuk mengonversi, memeriksa, dan memproses file-file ini secara programatis dalam pipeline pemrosesan ucapan.
Rilis awal: 1990

Pertanyaan yang Sering Diajukan

Mengapa mengonversi MPEG ke NIST?

NIST SPHERE adalah format acuan untuk mendistribusikan data ucapan. Dialog video MPEG menjadi audio terstandarisasi untuk penelitian pengenalan.

Apa bedanya NIST dengan SPH?

Keduanya format yang sama — SPHERE oleh National Institute of Standards and Technology. NIST dan SPH adalah ekstensi yang dapat dipertukarkan.

Apakah NIST mendukung kualitas MPEG?

NIST menyimpan PCM tanpa kompresi. Audio yang diekstrak dari MPEG dipertahankan pada kualitas penuh, terlepas dari encoding MPEG asli.

Alat ASR apa yang menerima NIST?

Kaldi, HTK, framework evaluasi NIST, dan sebagian besar lab ucapan akademis bekerja dengan audio NIST SPHERE sebagai format input standar mereka.

Apakah pemrosesan batch tersedia?

Ya — unggah beberapa video MPEG dan konversi semuanya ke NIST sekaligus. Praktis untuk membangun korpus dari arsip video.