Convertitore da NIST ad SOU
Converti i tuoi file nist in sou online e gratis
nist
sou
Come convertire NIST in SOU
Seleziona file dal Computer, Google Drive, Dropbox, URL o trascinandoli sulla pagina.
Scegli sou o qualsiasi altro formato che ti serva come destinazione (più di 200 formati supportati)
Lascia convertire il file e potrai scaricare il tuo sou subito dopo
Informazioni sui formati
NIST SPHERE (SPeech HEader REsources) è un formato audio specializzato creato dal National Institute of Standards and Technology per la ricerca vocale, in particolare per progetti finanziati dal DARPA. Il formato avvolge i campioni audio grezzi con un'intestazione ASCII strutturata che codifica metadati come frequenza di campionamento, numero di canali, tipo di codifica, dati demografici degli speaker e annotazioni di trascrizione — rendendolo ideale per la distribuzione di corpora vocali. I file NIST memorizzano tipicamente PCM non compresso o audio mu-law a frequenze di campionamento di qualità telefonica (8 kHz o 16 kHz), sebbene il contenitore sia sufficientemente flessibile da ospitare diverse codifiche. Un vantaggio fondamentale è la ricca intestazione auto-descrittiva che consente ai ricercatori di incorporare metadati dettagliati del corpus direttamente nel file, eliminando la necessità di file separati. SPHERE è inoltre diventato lo standard de facto per importanti database vocali come TIMIT, Switchboard e il corpus Fisher, garantendo un ampio riconoscimento nei laboratori accademici e governativi. La specifica aperta e la disponibilità di strumenti a riga di comando (sphere, h_strip, w_decode) rendono semplice convertire, ispezionare e elaborare questi file a livello programmatico nelle pipeline di elaborazione del parlato.
SOU è un formato audio grezzo che funziona come alias per dati PCM a 8 bit senza segno (u8) nel framework di elaborazione audio SoX. I file con estensione .sou contengono campioni audio senza intestazione e non compressi, memorizzati come interi a 8 bit senza segno — ogni byte rappresenta un singolo valore di ampiezza da 0 a 255, con 128 come punto di silenzio. Poichè non è presente alcuna intestazione, i parametri di riproduzione come frequenza di campionamento e numero di canali devono essere specificati esternamente. L'impostazione predefinita è tipicamente mono a 8000 Hz, sebbene i dati possano rappresentare qualsiasi frequenza supportata dall'hardware di registrazione. La codifica u8 di cui SOU è alias è una delle rappresentazioni audio digitali più semplici possibili, antecedente ai contenitori audio strutturati come WAV e AIFF. Il PCM grezzo senza segno veniva comunemente prodotto dalle prime schede audio e digitalizzatori alla fine degli anni '80 e all'inizio degli anni '90, quando i vincoli di archiviazione e la potenza di elaborazione limitata rendevano i formati senza intestazione una scelta pratica. Un vantaggio è la semplicità assoluta: i file SOU possono essere letti da qualsiasi programma capace di I/O basico su file, senza necessità di analizzare strutture di contenitore o decodificare metadati — utile per sistemi embedded, diagnostica hardware e contesti educativi in cui si esplorano i fondamenti dell'audio. L'overhead minimo del formato significa inoltre che la conversione verso qualsiasi contenitore moderno è lossless e istantanea, poichè i campioni PCM grezzi possono essere avvolti in un'intestazione WAV o AIFF senza alcuna transcodifica.