Convertitore da NIST ad PVF

Converti i tuoi file nist in pvf online e gratis

Rilascia i file qui. 1 GB dimensione massima del file oppure Registrati
in
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Come convertire NIST in PVF

1

Seleziona file dal Computer, Google Drive, Dropbox, URL o trascinandoli sulla pagina.

2

Scegli pvf o qualsiasi altro formato che ti serva come destinazione (più di 200 formati supportati)

3

Lascia convertire il file e potrai scaricare il tuo pvf subito dopo

Informazioni sui formati

NIST SPHERE (SPeech HEader REsources) è un formato audio specializzato creato dal National Institute of Standards and Technology per la ricerca vocale, in particolare per progetti finanziati dal DARPA. Il formato avvolge i campioni audio grezzi con un'intestazione ASCII strutturata che codifica metadati come frequenza di campionamento, numero di canali, tipo di codifica, dati demografici degli speaker e annotazioni di trascrizione — rendendolo ideale per la distribuzione di corpora vocali. I file NIST memorizzano tipicamente PCM non compresso o audio mu-law a frequenze di campionamento di qualità telefonica (8 kHz o 16 kHz), sebbene il contenitore sia sufficientemente flessibile da ospitare diverse codifiche. Un vantaggio fondamentale è la ricca intestazione auto-descrittiva che consente ai ricercatori di incorporare metadati dettagliati del corpus direttamente nel file, eliminando la necessità di file separati. SPHERE è inoltre diventato lo standard de facto per importanti database vocali come TIMIT, Switchboard e il corpus Fisher, garantendo un ampio riconoscimento nei laboratori accademici e governativi. La specifica aperta e la disponibilità di strumenti a riga di comando (sphere, h_strip, w_decode) rendono semplice convertire, ispezionare e elaborare questi file a livello programmatico nelle pipeline di elaborazione del parlato.
Prima versione: 1990
PVF (Portable Voice Format) è un formato audio semplice progettato per l'archiviazione di messaggi vocali in sistemi di telefonia basati su Linux, in particolare ISDN4Linux e la sua applicazione di segreteria telefonica vbox. Il formato è emerso dall'ecosistema ISDN europeo della fine degli anni '90, quando i server Linux gestivano sempre più spesso funzioni di PBX e segreteria telefonica su linee telefoniche digitali. I file PVF memorizzano campioni PCM grezzi con segno a 16 bit a 8000 Hz mono, preceduti da un'intestazione minimale in testo semplice che specifica il formato dei dati e l'ordine dei byte. Questa semplicità deliberata è uno dei punti di forza principali del formato — senza compressione e con un'intestazione leggibile dall'uomo, i file PVF sono estremamente facili da analizzare, inviare in pipe e manipolare utilizzando gli strumenti Unix standard. La frequenza di 8 kHz corrisponde al requisito di Nyquist per il parlato in banda telefonica (300-3400 Hz), rendendo PVF un formato intermedio naturale per le pipeline di elaborazione vocale. Un altro vantaggio è la portabilità tra architetture diverse: la dichiarazione esplicita dell'ordine dei byte significa che i file PVF si spostano tra sistemi big-endian e little-endian senza ambiguità. Il toolkit audio SoX fornisce supporto nativo per lettura e scrittura PVF, consentendo una conversione immediata verso formati moderni.
Sviluppatore: ISDN4Linux Project
Prima versione: 1997