VOB in SPH Converter

Estrai audio DVD come dati vocali NIST SPHERE online

Rilascia i file qui. 1 GB dimensione massima del file oppure Registrati
in
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Da DVD a Corpus Vocale

Estrai dialoghi dai contenuti DVD VOB e confezionali come NIST SPHERE — pronti per l'addestramento e la valutazione del riconoscimento vocale.

Qualità Adatta alla Ricerca

L'audio DVD dal VOB fornisce materiale sorgente pulito. L'output SPH preserva quella qualità per applicazioni di ricerca vocale serie.

File Sicuri

I file VOB caricati vengono rimossi dopo la conversione. Gli output SPH vengono eliminati entro 24 ore — i tuoi materiali di ricerca restano riservati.

Come convertire VOB in SPH

1

Seleziona file dal Computer, Google Drive, Dropbox, URL o trascinandoli sulla pagina.

2

Scegli sph o qualsiasi altro formato che ti serva come destinazione (più di 200 formati supportati)

3

Lascia convertire il file e potrai scaricare il tuo sph subito dopo

Informazioni sui formati

VOB (Video Object) è il formato contenitore principale utilizzato sui dischi DVD-Video, definito come parte delle specifiche DVD sviluppate dal DVD Forum. Il formato è apparso per la prima volta con lo standard DVD finalizzato nel settembre 1996 ed è stato da allora utilizzato su miliardi di dischi DVD prodotti in tutto il mondo. I file VOB si basano sul formato program stream MPEG-2, contenendo video MPEG-2 multiplexato insieme ad audio in formato AC-3 (Dolby Digital), DTS, MPEG-1 Layer II o LPCM. Oltre ad audio e video, i file VOB trasportano anche flussi di sottotitoli DVD come sovrapposizioni bitmap, dati di navigazione per l'interazione con i menu e informazioni sui punti dei capitoli. I file risiedono nella directory VIDEO_TS di un disco DVD, con convenzioni di denominazione (VTS_01_1.VOB, ecc.) che riflettono la struttura di titoli e parti del contenuto. I singoli file VOB sono limitati a circa 1 GB per soddisfare i requisiti del file system UDF, con i contenuti più lunghi che si estendono su più file in modo trasparente. Il formato supporta risoluzioni video sia NTSC (720x480) che PAL (720x576) a bitrate fino a 9,8 Mbps per audio e video combinati. L'integrazione di video, audio multi-traccia, sottotitoli e navigazione in un singolo program stream ha reso VOB una soluzione completa per la distribuzione cinematografica consumer. Sebbene lo streaming e i formati disco più recenti abbiano soppiantato il DVD per i nuovi contenuti, VOB resta enormemente rilevante per l'accesso alla vasta libreria di contenuti DVD esistenti.
Sviluppatore: DVD Forum
Prima versione: Settembre 1996
SPH è l'estensione file per l'audio memorizzato nel formato NIST SPHERE (SPeech HEader REsources), uno standard creato dal National Institute of Standards and Technology statunitense intorno al 1990. Progettato per la ricerca vocale, i file SPH portano un'intestazione ASCII di 1024 byte ricca di metadati — identificatori di database, conteggi dei canali, frequenze di campionamento, ordine dei byte e tipo di compressione — rendendo ogni registrazione autodescrittiva. L'audio sottostante è tipicamente PCM lineare a 16 bit campionato a 16 kHz, sebbene siano ammesse altre configurazioni. Ricercatori del NIST, del DARPA e di università in tutto il mondo si affidano a SPH per la distribuzione di corpora vocali come TIMIT, Switchboard e le collezioni LDC che sostengono i moderni sistemi di riconoscimento vocale automatico. Un vantaggio fondamentale è che l'intestazione leggibile dall'uomo consente agli script di analizzare i metadati della registrazione senza decodifica binaria. La rigorosa standardizzazione del formato elimina inoltre l'ambiguità nella condivisione di dataset tra istituzioni e piattaforme diverse. Poichè i file SPH memorizzano PCM non compresso, preservano la piena fedeltà audio — aspetto critico quando si addestrano modelli acustici dove anche piccoli artefatti possono distorcere i risultati.
Prima versione: 1990

Domande frequenti

Perché convertire VOB in SPH?

SPH è lo standard NIST per l'audio di ricerca vocale. I dialoghi DVD diventano dati strutturati per l'addestramento ASR e l'analisi linguistica.

Quali framework leggono SPH?

Kaldi, HTK, Praat e il toolkit NIST SPHERE supportano tutti SPH nativamente. È il formato di riferimento per la distribuzione di corpus vocali.

SPH preserva la qualità DVD?

SPH archivia PCM senza compressione. I dialoghi dai file DVD VOB raggiungono i tuoi strumenti di ricerca a piena qualità per un'analisi accurata.

I sottotitoli DVD possono aiutare?

I sottotitoli nel VOB sono separati dall'audio. Converti l'audio in SPH per il segnale vocale — poi abbina i dati di trascrizione separatamente.

È disponibile l'elaborazione in blocco?

Carica più capitoli VOB e convertili in blocco in SPH. Costruisci un corpus vocale da un intero DVD in modo efficiente.