Convertitore da NIST ad VOC
Converti i tuoi file nist in voc online e gratis
nist
voc
Impostazioni
PCM_S16LE (Non compresso)
Il codec per codificare la traccia audio. Il codec "Senza ricodifica" copia il flusso audio dal file di input ad output senza ricodifica, se possibile.
Auto (Nessuna modifica)
Imposta il numero di canali audio. Questa impostazione è particolarmente utile quando si esegue il downmix dei canali (es. da 5.1 a stereo).
Auto (Nessuna modifica)
Imposta la frequenza di campionamento dell'audio. La musica con uno spettro completo (20 Hz - 20 kHz) richiede valori non inferiori a 44.1 kHz per ottenere la trasparenza. Ulteriori informazioni sono disponibili sul wiki.
nist
NIST SPHERE (SPeech HEader REsources) è un formato audio specializzato creato dal National Institute of Standards and Technology per la ricerca vocale, in particolare per progetti finanziati dal DARPA. Il formato avvolge i campioni audio grezzi con un'intestazione ASCII strutturata che codifica metadati come frequenza di campionamento, numero di canali, tipo di codifica, dati demografici degli speaker e annotazioni di trascrizione — rendendolo ideale per la distribuzione di corpora vocali. I file NIST memorizzano tipicamente PCM non compresso o audio mu-law a frequenze di campionamento di qualità telefonica (8 kHz o 16 kHz), sebbene il contenitore sia sufficientemente flessibile da ospitare diverse codifiche. Un vantaggio fondamentale è la ricca intestazione auto-descrittiva che consente ai ricercatori di incorporare metadati dettagliati del corpus direttamente nel file, eliminando la necessità di file separati. SPHERE è inoltre diventato lo standard de facto per importanti database vocali come TIMIT, Switchboard e il corpus Fisher, garantendo un ampio riconoscimento nei laboratori accademici e governativi. La specifica aperta e la disponibilità di strumenti a riga di comando (sphere, h_strip, w_decode) rendono semplice convertire, ispezionare e elaborare questi file a livello programmatico nelle pipeline di elaborazione del parlato.
leggi tutto
voc
VOC (Creative Voice) è un contenitore audio digitale sviluppato da Creative Technology e introdotto insieme alla scheda Sound Blaster originale nel 1989. Ha servito come formato audio nativo per la famiglia Sound Blaster durante l'era DOS, quando l'hardware Creative dominava l'audio su PC. I file VOC sono strutturati a blocchi: ogni file consiste in blocchi dati tipizzati che possono trasportare PCM a 8 bit senza segno, Creative ADPCM a 4 bit e 2,6 bit, PCM a 16 bit con segno, nonchè audio codificato in A-law e mu-law. Questa struttura a blocchi supporta anche intervalli di silenzio, loop di ripetizione e punti marcatore, dando agli sviluppatori di giochi un controllo dettagliato sulla riproduzione sonora. Un vantaggio notevole era la decodifica a livello hardware — le schede Sound Blaster potevano riprodurre i dati VOC direttamente tramite trasferimento DMA, liberando la CPU per altri compiti in un'epoca in cui i cicli del processore erano preziosi. Il formato ha visto un uso estensivo nei giochi DOS di id Software, Sierra e LucasArts. Con l'avvento di Windows e del formato WAV, VOC è gradualmente uscito dall'uso mainstream, ma resta importante per la preservazione del retrogaming e per chiunque lavori con archivi audio vintage per PC.
leggi tutto
Come convertire NIST in VOC
Seleziona file dal Computer, Google Drive, Dropbox, URL o trascinandoli sulla pagina.
Scegli voc o qualsiasi altro formato che ti serva come destinazione (più di 200 formati supportati)
Lascia convertire il file e potrai scaricare il tuo voc subito dopo
Informazioni sui formati
NIST SPHERE (SPeech HEader REsources) è un formato audio specializzato creato dal National Institute of Standards and Technology per la ricerca vocale, in particolare per progetti finanziati dal DARPA. Il formato avvolge i campioni audio grezzi con un'intestazione ASCII strutturata che codifica metadati come frequenza di campionamento, numero di canali, tipo di codifica, dati demografici degli speaker e annotazioni di trascrizione — rendendolo ideale per la distribuzione di corpora vocali. I file NIST memorizzano tipicamente PCM non compresso o audio mu-law a frequenze di campionamento di qualità telefonica (8 kHz o 16 kHz), sebbene il contenitore sia sufficientemente flessibile da ospitare diverse codifiche. Un vantaggio fondamentale è la ricca intestazione auto-descrittiva che consente ai ricercatori di incorporare metadati dettagliati del corpus direttamente nel file, eliminando la necessità di file separati. SPHERE è inoltre diventato lo standard de facto per importanti database vocali come TIMIT, Switchboard e il corpus Fisher, garantendo un ampio riconoscimento nei laboratori accademici e governativi. La specifica aperta e la disponibilità di strumenti a riga di comando (sphere, h_strip, w_decode) rendono semplice convertire, ispezionare e elaborare questi file a livello programmatico nelle pipeline di elaborazione del parlato.
VOC (Creative Voice) è un contenitore audio digitale sviluppato da Creative Technology e introdotto insieme alla scheda Sound Blaster originale nel 1989. Ha servito come formato audio nativo per la famiglia Sound Blaster durante l'era DOS, quando l'hardware Creative dominava l'audio su PC. I file VOC sono strutturati a blocchi: ogni file consiste in blocchi dati tipizzati che possono trasportare PCM a 8 bit senza segno, Creative ADPCM a 4 bit e 2,6 bit, PCM a 16 bit con segno, nonchè audio codificato in A-law e mu-law. Questa struttura a blocchi supporta anche intervalli di silenzio, loop di ripetizione e punti marcatore, dando agli sviluppatori di giochi un controllo dettagliato sulla riproduzione sonora. Un vantaggio notevole era la decodifica a livello hardware — le schede Sound Blaster potevano riprodurre i dati VOC direttamente tramite trasferimento DMA, liberando la CPU per altri compiti in un'epoca in cui i cicli del processore erano preziosi. Il formato ha visto un uso estensivo nei giochi DOS di id Software, Sierra e LucasArts. Con l'avvento di Windows e del formato WAV, VOC è gradualmente uscito dall'uso mainstream, ma resta importante per la preservazione del retrogaming e per chiunque lavori con archivi audio vintage per PC.