Convertitore da OGG a SPH

Produci audio SPHERE per la ricerca vocale da OGG

Rilascia i file qui. 1 GB dimensione massima del file oppure Registrati
in
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Standard per corpus vocali

SPH è il formato dietro i principali dataset vocali — converti le registrazioni OGG in audio di ricerca correttamente formattato.

Preparazione dataset

Elabora intere collezioni di registrazioni vocali OGG in SPH contemporaneamente — prepara corpus di ricerca in una sola operazione.

Conversione online

Nessun toolkit vocale da installare — genera file SPH da OGG direttamente tramite il tuo browser.

Come convertire OGG in SPH

1

Seleziona file dal Computer, Google Drive, Dropbox, URL o trascinandoli sulla pagina.

2

Scegli sph o qualsiasi altro formato che ti serva come destinazione (più di 200 formati supportati)

3

Lascia convertire il file e potrai scaricare il tuo sph subito dopo

Informazioni sui formati

OGG Vorbis è un codec audio lossy aperto e privo di royalty all'interno del formato contenitore Ogg, entrambi sviluppati dalla Xiph.Org Foundation. Vorbis è stato progettato come alternativa priva di brevetti a MP3 e AAC, utilizzando la codifica con trasformata discreta del coseno modificata (MDCT) e una codifica a bitrate variabile che si adatta alla complessità del segnale frame per frame. Test d'ascolto alla cieca hanno costantemente dimostrato che Vorbis offre una qualità percettiva pari o superiore all'MP3, soprattutto nella fascia 96-192 kbps. Il formato supporta frequenze di campionamento da 8 kHz a 192 kHz e da 1 a 255 canali, coprendo tutto dalla voce mono ai mix surround. Un vantaggio di spicco è la totale assenza di costi di licenza — gli sviluppatori di giochi, le piattaforme di streaming e i produttori hardware possono implementare Vorbis senza preoccupazioni riguardo alle royalty. Spotify ha fatto affidamento su Vorbis per anni come codec di streaming primario proprio per questo motivo. Il formato gestisce inoltre il degrado qualitativo a bassi bitrate in modo più elegante rispetto a molti concorrenti, motivo per cui resta popolare nei videogiochi dove lo spazio è limitato e migliaia di effetti sonori competono per lo spazio disponibile. VLC, Firefox, Chrome e Android forniscono tutti la decodifica nativa di Vorbis.
Sviluppatore: Xiph.Org Foundation
Prima versione: 01 maggio 2000
SPH è l'estensione file per l'audio memorizzato nel formato NIST SPHERE (SPeech HEader REsources), uno standard creato dal National Institute of Standards and Technology statunitense intorno al 1990. Progettato per la ricerca vocale, i file SPH portano un'intestazione ASCII di 1024 byte ricca di metadati — identificatori di database, conteggi dei canali, frequenze di campionamento, ordine dei byte e tipo di compressione — rendendo ogni registrazione autodescrittiva. L'audio sottostante è tipicamente PCM lineare a 16 bit campionato a 16 kHz, sebbene siano ammesse altre configurazioni. Ricercatori del NIST, del DARPA e di università in tutto il mondo si affidano a SPH per la distribuzione di corpora vocali come TIMIT, Switchboard e le collezioni LDC che sostengono i moderni sistemi di riconoscimento vocale automatico. Un vantaggio fondamentale è che l'intestazione leggibile dall'uomo consente agli script di analizzare i metadati della registrazione senza decodifica binaria. La rigorosa standardizzazione del formato elimina inoltre l'ambiguità nella condivisione di dataset tra istituzioni e piattaforme diverse. Poichè i file SPH memorizzano PCM non compresso, preservano la piena fedeltà audio — aspetto critico quando si addestrano modelli acustici dove anche piccoli artefatti possono distorcere i risultati.
Prima versione: 1990

Domande frequenti

Perché convertire OGG in SPH?

SPH (SPHERE) è il formato definito dal NIST per i dataset di ricerca vocale. Le pipeline di addestramento ASR e gli strumenti linguistici richiedono input in formato SPHERE.

Quali strumenti usano i file SPH?

Kaldi, HTK, gli strumenti di valutazione del NIST e i corpus accademici come TIMIT e Switchboard utilizzano SPHERE come formato audio.

SPH è lo stesso di NIST?

SPH e NIST si riferiscono entrambi al formato SPHERE — SPeech HEader Resources definito dal National Institute of Standards and Technology.

Quale frequenza di campionamento usa SPH?

I corpus vocali usano tipicamente 8 o 16 kHz. Il convertitore gestisce il ricampionamento dalla sorgente OGG automaticamente.

Posso convertire un intero dataset?

Carica un gruppo di registrazioni vocali OGG e produci output SPH per ogni file in una volta — pronto per la ricerca ASR.

OGG alla valutazione di qualità SPH

4.0 (1 voti)
Devi convertire e scaricare almeno 1 file per fornire feedback!