Convertitore da AV1 a SPH

Estrai audio NIST Sphere da video AV1 online

Rilascia i file qui. 1 GB dimensione massima del file oppure Registrati
in
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Standard Ricerca Vocale

SPH è il formato per i principali corpus vocali — la conversione da AV1 prepara audio per ricerca linguistica e analisi.

Compatibile con Corpus

I file SPH si integrano con strumenti standard di ricerca vocale come Kaldi, HTK e utility di scoring NIST.

File Privati

I caricamenti AV1 vengono cancellati subito dopo la conversione e i file SPH vengono eliminati entro 24 ore.

Come convertire AV1 in SPH

1

Seleziona file dal Computer, Google Drive, Dropbox, URL o trascinandoli sulla pagina.

2

Scegli sph o qualsiasi altro formato che ti serva come destinazione (più di 200 formati supportati)

3

Lascia convertire il file e potrai scaricare il tuo sph subito dopo

Informazioni sui formati

AV1 (AOMedia Video 1) è un formato di codifica video aperto e privo di royalty sviluppato dalla Alliance for Open Media, un consorzio i cui membri fondatori includono Google, Mozilla, Microsoft, Amazon, Netflix e Intel, tra gli altri. La specifica è stata finalizzata nel giugno 2018 con l'obiettivo di fornire un codec video di nuova generazione che superi l'efficienza di compressione di H.264 e HEVC restando libero da costi di licenza. AV1 raggiunge una compressione migliore del 30-50% circa rispetto a HEVC a qualità visiva equivalente, rendendolo particolarmente interessante per le piattaforme di streaming che cercano di ridurre i costi di banda senza sacrificare l'esperienza dello spettatore. Il codec supporta un'ampia gamma di funzionalità tra cui sintesi del grain filmico, tiling flessibile per l'elaborazione parallela, commutazione adattiva della risoluzione in base al contenuto e un ricco set di modalità di predizione intra e inter. Il supporto per la decodifica hardware si è espanso rapidamente tra processori mobili, GPU e smart TV, rispondendo alle preoccupazioni iniziali sulle richieste computazionali in fase di codifica. AV1 ha visto un'ampia adozione da parte dei principali servizi di streaming per la distribuzione di contenuti 4K e HDR, e serve come componente video del contenitore WebM per la riproduzione web. Lo status royalty-free rende AV1 particolarmente importante per gli standard web aperti e la distribuzione accessibile dei media.
Prima versione: 25 giugno 2018
SPH è l'estensione file per l'audio memorizzato nel formato NIST SPHERE (SPeech HEader REsources), uno standard creato dal National Institute of Standards and Technology statunitense intorno al 1990. Progettato per la ricerca vocale, i file SPH portano un'intestazione ASCII di 1024 byte ricca di metadati — identificatori di database, conteggi dei canali, frequenze di campionamento, ordine dei byte e tipo di compressione — rendendo ogni registrazione autodescrittiva. L'audio sottostante è tipicamente PCM lineare a 16 bit campionato a 16 kHz, sebbene siano ammesse altre configurazioni. Ricercatori del NIST, del DARPA e di università in tutto il mondo si affidano a SPH per la distribuzione di corpora vocali come TIMIT, Switchboard e le collezioni LDC che sostengono i moderni sistemi di riconoscimento vocale automatico. Un vantaggio fondamentale è che l'intestazione leggibile dall'uomo consente agli script di analizzare i metadati della registrazione senza decodifica binaria. La rigorosa standardizzazione del formato elimina inoltre l'ambiguità nella condivisione di dataset tra istituzioni e piattaforme diverse. Poichè i file SPH memorizzano PCM non compresso, preservano la piena fedeltà audio — aspetto critico quando si addestrano modelli acustici dove anche piccoli artefatti possono distorcere i risultati.
Prima versione: 1990

Domande frequenti

Perché convertire AV1 in SPH?

SPH (NIST Sphere) è il formato standard per corpus di ricerca vocale — usato da dataset linguistici come TIMIT e Switchboard.

Cosa apre i file SPH?

Strumenti NIST Sphere, Kaldi, HTK e SoX gestiscono file SPH. È standard nella ricerca accademica su parlato e linguaggio.

SPH è lo stesso di NIST?

SPH usa il formato header NIST Sphere — i termini sono spesso usati in modo intercambiabile nei contesti di ricerca vocale.

Quale frequenza di campionamento è tipica?

La maggior parte dei corpus vocali usa 8 kHz o 16 kHz mono — frequenze standard per dati di telefonia e riconoscimento vocale.

La conversione è sicura?

I caricamenti AV1 vengono eliminati immediatamente. I file SPH vengono rimossi entro 24 ore.