Convertitore da NIST ad HTK

Converti i tuoi file nist in htk online e gratis

Scegli i file

Rilascia i file qui. 1 GB dimensione massima del file oppure Registrati

Come convertire NIST in HTK

Seleziona file dal Computer, Google Drive, Dropbox, URL o trascinandoli sulla pagina.

Scegli htk o qualsiasi altro formato che ti serva come destinazione (più di 200 formati supportati)

Lascia convertire il file e potrai scaricare il tuo htk subito dopo

Informazioni sui formati

NIST SPHERE (SPeech HEader REsources) è un formato audio specializzato creato dal National Institute of Standards and Technology per la ricerca vocale, in particolare per progetti finanziati dal DARPA. Il formato avvolge i campioni audio grezzi con un'intestazione ASCII strutturata che codifica metadati come frequenza di campionamento, numero di canali, tipo di codifica, dati demografici degli speaker e annotazioni di trascrizione — rendendolo ideale per la distribuzione di corpora vocali. I file NIST memorizzano tipicamente PCM non compresso o audio mu-law a frequenze di campionamento di qualità telefonica (8 kHz o 16 kHz), sebbene il contenitore sia sufficientemente flessibile da ospitare diverse codifiche. Un vantaggio fondamentale è la ricca intestazione auto-descrittiva che consente ai ricercatori di incorporare metadati dettagliati del corpus direttamente nel file, eliminando la necessità di file separati. SPHERE è inoltre diventato lo standard de facto per importanti database vocali come TIMIT, Switchboard e il corpus Fisher, garantendo un ampio riconoscimento nei laboratori accademici e governativi. La specifica aperta e la disponibilità di strumenti a riga di comando (sphere, h_strip, w_decode) rendono semplice convertire, ispezionare e elaborare questi file a livello programmatico nelle pipeline di elaborazione del parlato.

Sviluppatore: National Institute of Standards and Technology

Prima versione: 1990

HTK è il contenitore nativo di forme d'onda per l'Hidden Markov Model Toolkit, una suite software sviluppata presso il dipartimento di Ingegneria dell'Università di Cambridge per la ricerca sul riconoscimento vocale. Distribuito per la prima volta nel 1993, HTK è diventato rapidamente una piattaforma di riferimento nei laboratori di linguistica computazionale in tutto il mondo, e il suo formato file ha seguito la stessa traiettoria. Ogni file memorizza una sequenza di vettori di parametri o campioni grezzi preceduti da un'intestazione di 12 byte che specifica il numero di frame, il periodo del frame in unità di 100 ns, il conteggio dei byte per frame e un codice di tipo che indica la natura dei dati — le opzioni spaziano dal PCM a forma d'onda ai coefficienti cepstrali su scala di Mel e alle energie dei banchi di filtri. Questa versatilità consente a un unico contenitore di trasportare sia l'audio sorgente che le feature estratte senza cambiare parser. L'intestazione deliberatamente minimale evita il padding di allineamento o chunk opzionali, rendendo il formato banale da leggere da C, Python o MATLAB con poche righe di I/O binario. Tre vantaggi sostengono la rilevanza duratura di HTK: l'integrazione stretta con la pipeline di addestramento e riconoscimento HTK, un layout di byte deterministico che elimina l'ambiguità del parser e un'adozione capillare nei corpora accademici.

Sviluppatore: Cambridge University Engineering Department

Prima versione: 1993

Conversioni correlate

NIST a MP3

NIST a WAV

NIST a AAC

NIST a AC3

NIST a FLAC

NIST a OGG

NIST a AIFF

NIST a AMR

NIST a M4A

NIST a M4R

NIST a WMA

NIST a DTS

NIST a OPUS

NIST a SPX

NIST a CAF

NIST a W64

NIST a WV

NIST a VOC

NIST a TTA

NIST a RA

NIST a MP2

NIST a OGA

NIST a PVF

NIST a PRC

NIST a MAUD

NIST a 8SVX

NIST a AMB

NIST a AU

NIST a SND

NIST a SNDR

NIST a SNDT

NIST a AVR

NIST a CDDA

NIST a CVS

NIST a CVSD

NIST a CVU

NIST a DVMS

NIST a VMS

NIST a FAP

NIST a PAF

NIST a FSSD

NIST a SOU

NIST a GSRT

NIST a GSM

NIST a HCOM

NIST a HTK

NIST a IMA

NIST a IRCAM

NIST a SLN

NIST a SPH

NIST a SMP

NIST a TXW

NIST a VOX

NIST a WVE

NIST a SD2

Convertitori specifici

MP3 a HTK

WAV a HTK

MP4 a HTK

FLAC a HTK

M4A a HTK

OGG a HTK

MPG a HTK

ASF a HTK

AAC a HTK

3G2 a HTK

3GP a HTK

AAF a HTK

AV1 a HTK

AVCHD a HTK

AVI a HTK

CAVS a HTK

DIVX a HTK

DV a HTK

F4V a HTK

FLV a HTK

HEVC a HTK

M2TS a HTK

M2V a HTK

M4V a HTK

MJPEG a HTK

MKV a HTK

MOD a HTK

MOV a HTK

MPEG a HTK

MPEG-2 a HTK