Convertitore da AV1 a NIST

Estrai audio NIST Sphere da video AV1 online

Rilascia i file qui. 1 GB dimensione massima del file oppure Registrati
in
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Standard di Ricerca

NIST Sphere è lo standard governativo per lo scambio di dati vocali — la conversione da AV1 produce audio pronto per la ricerca.

Impostazioni Corpus

Configura frequenza di campionamento e codifica per i requisiti esatti del tuo corpus di valutazione o addestramento vocale.

Conversione Sicura

I caricamenti AV1 vengono cancellati subito dopo l'elaborazione e i file NIST vengono eliminati entro 24 ore.

Come convertire AV1 in NIST

1

Seleziona file dal Computer, Google Drive, Dropbox, URL o trascinandoli sulla pagina.

2

Scegli nist o qualsiasi altro formato che ti serva come destinazione (più di 200 formati supportati)

3

Lascia convertire il file e potrai scaricare il tuo nist subito dopo

Informazioni sui formati

AV1 (AOMedia Video 1) è un formato di codifica video aperto e privo di royalty sviluppato dalla Alliance for Open Media, un consorzio i cui membri fondatori includono Google, Mozilla, Microsoft, Amazon, Netflix e Intel, tra gli altri. La specifica è stata finalizzata nel giugno 2018 con l'obiettivo di fornire un codec video di nuova generazione che superi l'efficienza di compressione di H.264 e HEVC restando libero da costi di licenza. AV1 raggiunge una compressione migliore del 30-50% circa rispetto a HEVC a qualità visiva equivalente, rendendolo particolarmente interessante per le piattaforme di streaming che cercano di ridurre i costi di banda senza sacrificare l'esperienza dello spettatore. Il codec supporta un'ampia gamma di funzionalità tra cui sintesi del grain filmico, tiling flessibile per l'elaborazione parallela, commutazione adattiva della risoluzione in base al contenuto e un ricco set di modalità di predizione intra e inter. Il supporto per la decodifica hardware si è espanso rapidamente tra processori mobili, GPU e smart TV, rispondendo alle preoccupazioni iniziali sulle richieste computazionali in fase di codifica. AV1 ha visto un'ampia adozione da parte dei principali servizi di streaming per la distribuzione di contenuti 4K e HDR, e serve come componente video del contenitore WebM per la riproduzione web. Lo status royalty-free rende AV1 particolarmente importante per gli standard web aperti e la distribuzione accessibile dei media.
Prima versione: 25 giugno 2018
NIST SPHERE (SPeech HEader REsources) è un formato audio specializzato creato dal National Institute of Standards and Technology per la ricerca vocale, in particolare per progetti finanziati dal DARPA. Il formato avvolge i campioni audio grezzi con un'intestazione ASCII strutturata che codifica metadati come frequenza di campionamento, numero di canali, tipo di codifica, dati demografici degli speaker e annotazioni di trascrizione — rendendolo ideale per la distribuzione di corpora vocali. I file NIST memorizzano tipicamente PCM non compresso o audio mu-law a frequenze di campionamento di qualità telefonica (8 kHz o 16 kHz), sebbene il contenitore sia sufficientemente flessibile da ospitare diverse codifiche. Un vantaggio fondamentale è la ricca intestazione auto-descrittiva che consente ai ricercatori di incorporare metadati dettagliati del corpus direttamente nel file, eliminando la necessità di file separati. SPHERE è inoltre diventato lo standard de facto per importanti database vocali come TIMIT, Switchboard e il corpus Fisher, garantendo un ampio riconoscimento nei laboratori accademici e governativi. La specifica aperta e la disponibilità di strumenti a riga di comando (sphere, h_strip, w_decode) rendono semplice convertire, ispezionare e elaborare questi file a livello programmatico nelle pipeline di elaborazione del parlato.
Prima versione: 1990

Domande frequenti

Perché convertire AV1 in NIST?

NIST Sphere è il formato standard di interscambio per dati di ricerca vocale — usato da programmi governativi e accademici di valutazione del parlato.

Cosa apre i file NIST?

Strumenti vocali NIST, SoX, Kaldi e HTK gestiscono audio NIST Sphere per scopi di ricerca e valutazione.

Che differenza c'è tra NIST e SPH?

NIST e SPH si riferiscono allo stesso formato NIST Sphere — diverse estensioni file per specifiche contenitore audio identiche.

Quali impostazioni funzionano meglio?

La ricerca vocale richiede tipicamente 8 kHz o 16 kHz, 16 bit mono — conformati a queste specifiche del corpus.

I miei dati sono privati?

I caricamenti AV1 vengono eliminati immediatamente. I file NIST vengono rimossi entro 24 ore.