Convertitore da HTK ad HCOM

Converti i tuoi file htk in hcom online e gratis

Rilascia i file qui. 1 GB dimensione massima del file oppure Registrati
in
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Come convertire HTK in HCOM

1

Seleziona file dal Computer, Google Drive, Dropbox, URL o trascinandoli sulla pagina.

2

Scegli hcom o qualsiasi altro formato che ti serva come destinazione (più di 200 formati supportati)

3

Lascia convertire il file e potrai scaricare il tuo hcom subito dopo

Informazioni sui formati

HTK è il contenitore nativo di forme d'onda per l'Hidden Markov Model Toolkit, una suite software sviluppata presso il dipartimento di Ingegneria dell'Università di Cambridge per la ricerca sul riconoscimento vocale. Distribuito per la prima volta nel 1993, HTK è diventato rapidamente una piattaforma di riferimento nei laboratori di linguistica computazionale in tutto il mondo, e il suo formato file ha seguito la stessa traiettoria. Ogni file memorizza una sequenza di vettori di parametri o campioni grezzi preceduti da un'intestazione di 12 byte che specifica il numero di frame, il periodo del frame in unità di 100 ns, il conteggio dei byte per frame e un codice di tipo che indica la natura dei dati — le opzioni spaziano dal PCM a forma d'onda ai coefficienti cepstrali su scala di Mel e alle energie dei banchi di filtri. Questa versatilità consente a un unico contenitore di trasportare sia l'audio sorgente che le feature estratte senza cambiare parser. L'intestazione deliberatamente minimale evita il padding di allineamento o chunk opzionali, rendendo il formato banale da leggere da C, Python o MATLAB con poche righe di I/O binario. Tre vantaggi sostengono la rilevanza duratura di HTK: l'integrazione stretta con la pipeline di addestramento e riconoscimento HTK, un layout di byte deterministico che elimina l'ambiguità del parser e un'adozione capillare nei corpora accademici.
Prima versione: 1993
HCOM è un formato audio codificato con Huffman dell'era dei primi Macintosh, progettato per ridurre le dimensioni del suono digitalizzato per la distribuzione su floppy disk e BBS, quando lo spazio era prezioso e i modem erano lenti. Il codificatore prende l'input PCM a 8 bit senza segno, calcola una tabella di frequenza dei valori delta tra campioni e costruisce un albero di Huffman ottimale che sostituisce i delta più comuni con sequenze di bit brevi. Rapporti di compressione di 2:1 o superiori erano tipici per le registrazioni vocali, un risparmio significativo quando un floppy da 3,5 pollici conteneva solo 800 KB. I file venivano distribuiti come resource fork Macintosh e riprodotti tramite utilità come SoundApp e l'ecosistema BinHex che definiva lo scambio di software Mac alla fine degli anni '80. Il formato supportava frequenze di campionamento fino a 22,255 kHz, corrispondenti alle capacità di output dell'hardware audio del Macintosh originale. Strumenti come SoX mantengono il supporto per la decodifica HCOM, assicurando che le registrazioni archiviate restino accessibili a decenni di distanza. HCOM offre tre vantaggi pratici per il lavoro di conservazione: compressione lossless che recupera i campioni originali in modo esatto, una tabella di Huffman autonoma incorporata in ogni file per la decodifica senza dipendenze e una diffusione storica capillare in migliaia di archivi audio vintage del Mac.
Sviluppatore: Apple Computer
Prima versione: 1985