Convertitore da IRCAM ad NIST

Converti i tuoi file ircam in nist online e gratis

Rilascia i file qui. 1 GB dimensione massima del file oppure Registrati
in
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Come convertire IRCAM in NIST

1

Seleziona file dal Computer, Google Drive, Dropbox, URL o trascinandoli sulla pagina.

2

Scegli nist o qualsiasi altro formato che ti serva come destinazione (più di 200 formati supportati)

3

Lascia convertire il file e potrai scaricare il tuo nist subito dopo

Informazioni sui formati

I file sonori IRCAM hanno origine dall'Institut de Recherche et Coordination Acoustique/Musique — uno dei laboratori di musica elettronica più prestigiosi al mondo, fondato dal compositore Pierre Boulez a Parigi. Il formato è stato creato nei primi anni '80 per servire le esigenze di ricerca dell'IRCAM ed è stato successivamente adottato dalle comunità accademiche e artistiche che operano all'intersezione tra scienza e suono. Un file IRCAM inizia con un'intestazione di 1024 byte contenente un magic number, la frequenza di campionamento, il numero di canali e un campo di tipo di codifica che supporta PCM lineare (intero a 16/32 bit e virgola mobile a 32 bit), mu-law e varianti A-law. Il blocco di intestazione ospita anche testo di annotazione libera, consentendo ai ricercatori di incorporare i metadati sperimentali direttamente nel file audio. Poichè il payload è non compresso per impostazione predefinita, le registrazioni mantengono la piena fedeltà attraverso successivi cicli di analisi e risintesi — essenziale nella sperimentazione psicoacustica. Software come Csound, libsndfile e SoX leggono e scrivono il formato nativamente. I vantaggi principali includono un'intestazione ben definita che elimina le ambiguità di analisi, il supporto per campioni in virgola mobile essenziali nel lavoro di DSP scientifico e radici profonde nella comunità della musica elettronica che garantiscono un supporto continuo degli strumenti.
Sviluppatore: IRCAM
Prima versione: 1983
NIST SPHERE (SPeech HEader REsources) è un formato audio specializzato creato dal National Institute of Standards and Technology per la ricerca vocale, in particolare per progetti finanziati dal DARPA. Il formato avvolge i campioni audio grezzi con un'intestazione ASCII strutturata che codifica metadati come frequenza di campionamento, numero di canali, tipo di codifica, dati demografici degli speaker e annotazioni di trascrizione — rendendolo ideale per la distribuzione di corpora vocali. I file NIST memorizzano tipicamente PCM non compresso o audio mu-law a frequenze di campionamento di qualità telefonica (8 kHz o 16 kHz), sebbene il contenitore sia sufficientemente flessibile da ospitare diverse codifiche. Un vantaggio fondamentale è la ricca intestazione auto-descrittiva che consente ai ricercatori di incorporare metadati dettagliati del corpus direttamente nel file, eliminando la necessità di file separati. SPHERE è inoltre diventato lo standard de facto per importanti database vocali come TIMIT, Switchboard e il corpus Fisher, garantendo un ampio riconoscimento nei laboratori accademici e governativi. La specifica aperta e la disponibilità di strumenti a riga di comando (sphere, h_strip, w_decode) rendono semplice convertire, ispezionare e elaborare questi file a livello programmatico nelle pipeline di elaborazione del parlato.
Prima versione: 1990