Convertitore da SPH ad IRCAM

Converti i tuoi file sph in ircam online e gratis

Rilascia i file qui. 1 GB dimensione massima del file oppure Registrati
in
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Come convertire SPH in IRCAM

1

Seleziona file dal Computer, Google Drive, Dropbox, URL o trascinandoli sulla pagina.

2

Scegli ircam o qualsiasi altro formato che ti serva come destinazione (più di 200 formati supportati)

3

Lascia convertire il file e potrai scaricare il tuo ircam subito dopo

Informazioni sui formati

SPH è l'estensione file per l'audio memorizzato nel formato NIST SPHERE (SPeech HEader REsources), uno standard creato dal National Institute of Standards and Technology statunitense intorno al 1990. Progettato per la ricerca vocale, i file SPH portano un'intestazione ASCII di 1024 byte ricca di metadati — identificatori di database, conteggi dei canali, frequenze di campionamento, ordine dei byte e tipo di compressione — rendendo ogni registrazione autodescrittiva. L'audio sottostante è tipicamente PCM lineare a 16 bit campionato a 16 kHz, sebbene siano ammesse altre configurazioni. Ricercatori del NIST, del DARPA e di università in tutto il mondo si affidano a SPH per la distribuzione di corpora vocali come TIMIT, Switchboard e le collezioni LDC che sostengono i moderni sistemi di riconoscimento vocale automatico. Un vantaggio fondamentale è che l'intestazione leggibile dall'uomo consente agli script di analizzare i metadati della registrazione senza decodifica binaria. La rigorosa standardizzazione del formato elimina inoltre l'ambiguità nella condivisione di dataset tra istituzioni e piattaforme diverse. Poichè i file SPH memorizzano PCM non compresso, preservano la piena fedeltà audio — aspetto critico quando si addestrano modelli acustici dove anche piccoli artefatti possono distorcere i risultati.
Prima versione: 1990
I file sonori IRCAM hanno origine dall'Institut de Recherche et Coordination Acoustique/Musique — uno dei laboratori di musica elettronica più prestigiosi al mondo, fondato dal compositore Pierre Boulez a Parigi. Il formato è stato creato nei primi anni '80 per servire le esigenze di ricerca dell'IRCAM ed è stato successivamente adottato dalle comunità accademiche e artistiche che operano all'intersezione tra scienza e suono. Un file IRCAM inizia con un'intestazione di 1024 byte contenente un magic number, la frequenza di campionamento, il numero di canali e un campo di tipo di codifica che supporta PCM lineare (intero a 16/32 bit e virgola mobile a 32 bit), mu-law e varianti A-law. Il blocco di intestazione ospita anche testo di annotazione libera, consentendo ai ricercatori di incorporare i metadati sperimentali direttamente nel file audio. Poichè il payload è non compresso per impostazione predefinita, le registrazioni mantengono la piena fedeltà attraverso successivi cicli di analisi e risintesi — essenziale nella sperimentazione psicoacustica. Software come Csound, libsndfile e SoX leggono e scrivono il formato nativamente. I vantaggi principali includono un'intestazione ben definita che elimina le ambiguità di analisi, il supporto per campioni in virgola mobile essenziali nel lavoro di DSP scientifico e radici profonde nella comunità della musica elettronica che garantiscono un supporto continuo degli strumenti.
Sviluppatore: IRCAM
Prima versione: 1983