Convertitore da NIST ad FSSD
Converti i tuoi file nist in fssd online e gratis
nist
fssd
Come convertire NIST in FSSD
Seleziona file dal Computer, Google Drive, Dropbox, URL o trascinandoli sulla pagina.
Scegli fssd o qualsiasi altro formato che ti serva come destinazione (più di 200 formati supportati)
Lascia convertire il file e potrai scaricare il tuo fssd subito dopo
Informazioni sui formati
NIST SPHERE (SPeech HEader REsources) è un formato audio specializzato creato dal National Institute of Standards and Technology per la ricerca vocale, in particolare per progetti finanziati dal DARPA. Il formato avvolge i campioni audio grezzi con un'intestazione ASCII strutturata che codifica metadati come frequenza di campionamento, numero di canali, tipo di codifica, dati demografici degli speaker e annotazioni di trascrizione — rendendolo ideale per la distribuzione di corpora vocali. I file NIST memorizzano tipicamente PCM non compresso o audio mu-law a frequenze di campionamento di qualità telefonica (8 kHz o 16 kHz), sebbene il contenitore sia sufficientemente flessibile da ospitare diverse codifiche. Un vantaggio fondamentale è la ricca intestazione auto-descrittiva che consente ai ricercatori di incorporare metadati dettagliati del corpus direttamente nel file, eliminando la necessità di file separati. SPHERE è inoltre diventato lo standard de facto per importanti database vocali come TIMIT, Switchboard e il corpus Fisher, garantendo un ampio riconoscimento nei laboratori accademici e governativi. La specifica aperta e la disponibilità di strumenti a riga di comando (sphere, h_strip, w_decode) rendono semplice convertire, ispezionare e elaborare questi file a livello programmatico nelle pipeline di elaborazione del parlato.
FSSD è un formato audio grezzo originario dell'ecosistema Macintosh classico, dove l'hardware MacRecorder di Farallon Computing (1988) memorizzava il suono digitalizzato come PCM a 8 bit senza segno nelle voci del resource fork contrassegnate con il codice tipo 'FSSD'. Negli strumenti moderni di elaborazione audio come SoX, FSSD è trattato come un alias per il formato raw u8 (8 bit senza segno) — file senza intestazione contenenti un flusso piatto di campioni di ampiezza a singolo byte, dove ogni valore da 0 a 255 rappresenta un livello audio con 128 come punto centrale. Poichè non c'è intestazione, i parametri di riproduzione come frequenza di campionamento e numero di canali devono essere forniti esternamente. Il MacRecorder originale acquisiva tipicamente a frequenze fino a 22 kHz in mono, sebbene qualsiasi frequenza di campionamento sia valida nell'interpretazione dei dati grezzi. FSSD e il suo formato compagno compresso HCOM (che aggiunge compressione Huffman agli stessi dati sottostanti) erano i formati audio standard per il multimedia su Mac: gli stack HyperCard, i CD-ROM educativi e i suoni di avviso di sistema della fine degli anni '80 e dell'inizio degli anni '90 si basavano ampiamente su questa codifica. Un vantaggio del formato FSSD grezzo è la semplicità di analisi — senza overhead di contenitore, i dati audio iniziano dal byte zero e possono essere letti da qualsiasi strumento in grado di elaborare PCM a 8 bit senza segno. Il suo significato storico lo rende rilevante anche per gli archivisti digitali: la conversione delle registrazioni FSSD in contenitori moderni come WAV preserva il contenuto audio originale senza perdita, poichè ai campioni grezzi serve solo aggiungere un'intestazione, senza alcuna forma di transcodifica.