Convertitore da VOX ad NIST

Converti i tuoi file vox in nist online e gratis

Rilascia i file qui. 1 GB dimensione massima del file oppure Registrati
in
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Come convertire VOX in NIST

1

Seleziona file dal Computer, Google Drive, Dropbox, URL o trascinandoli sulla pagina.

2

Scegli nist o qualsiasi altro formato che ti serva come destinazione (più di 200 formati supportati)

3

Lascia convertire il file e potrai scaricare il tuo nist subito dopo

Informazioni sui formati

VOX è un formato audio senza intestazione basato sulla codifica Dialogic ADPCM, ampiamente adottato in telefonia, sistemi di risposta vocale interattiva (IVR) e piattaforme di segreteria telefonica dagli anni '80. Ogni campione audio viene compresso in 4 bit utilizzando un algoritmo sviluppato da Oki Electric e implementato in hardware sulle schede di interfaccia telefonica della Dialogic Corporation. I file VOX utilizzano tipicamente una frequenza di campionamento di 6000 o 8000 Hz, producendo registrazioni estremamente compatte ottimizzate per l'intelligibilità del parlato piuttosto che per la fedeltà musicale. Poichè il formato non contiene intestazione, il software di riproduzione deve conoscere in anticipo la frequenza di campionamento e i parametri di codifica — un compromesso che riduce l'overhead ma richiede una gestione attenta dei file. Il vantaggio principale di VOX è l'efficienza di archiviazione: una registrazione vocale di un minuto a 8 kHz occupa circa 240 KB, rendendolo pratico per sistemi che archiviano migliaia di prompt. Il formato Dialogic ADPCM è conforme allo standard ITU-T G.726, garantendo l'interoperabilità tra apparecchiature telefoniche di diversi produttori. Anche se i moderni call center migrano verso sistemi basati su IP con codec come Opus), vaste librerie di registrazioni VOX persistono nei deployment IVR legacy e negli archivi di conformità in tutto il mondo.
Sviluppatore: Dialogic Corporation
Prima versione: 1983
NIST SPHERE (SPeech HEader REsources) è un formato audio specializzato creato dal National Institute of Standards and Technology per la ricerca vocale, in particolare per progetti finanziati dal DARPA. Il formato avvolge i campioni audio grezzi con un'intestazione ASCII strutturata che codifica metadati come frequenza di campionamento, numero di canali, tipo di codifica, dati demografici degli speaker e annotazioni di trascrizione — rendendolo ideale per la distribuzione di corpora vocali. I file NIST memorizzano tipicamente PCM non compresso o audio mu-law a frequenze di campionamento di qualità telefonica (8 kHz o 16 kHz), sebbene il contenitore sia sufficientemente flessibile da ospitare diverse codifiche. Un vantaggio fondamentale è la ricca intestazione auto-descrittiva che consente ai ricercatori di incorporare metadati dettagliati del corpus direttamente nel file, eliminando la necessità di file separati. SPHERE è inoltre diventato lo standard de facto per importanti database vocali come TIMIT, Switchboard e il corpus Fisher, garantendo un ampio riconoscimento nei laboratori accademici e governativi. La specifica aperta e la disponibilità di strumenti a riga di comando (sphere, h_strip, w_decode) rendono semplice convertire, ispezionare e elaborare questi file a livello programmatico nelle pipeline di elaborazione del parlato.
Prima versione: 1990

VOX alla valutazione di qualità NIST

5.0 (1 voti)
Devi convertire e scaricare almeno 1 file per fornire feedback!