Convertisseur de NIST en CVU
Convertissez vos fichiers nist en cvu en ligne et gratuitement
nist
cvu
Comment convertir un fichier NIST en fichier CVU
Sélectionnez des fichiers depuis l'ordinateur, Google Drive, Dropbox, une URL ou glissez-les sur la page.
Choisissez cvu ou tout autre format de sortie (plus de 200 formats supportés)
Laissez le fichier convertir et vous pourrez télécharger votre fichier cvu juste après
À propos des formats
Le NIST SPHERE (SPeech HEader REsources) est un format de fichier audio spécialisé crée par le National Institute of Standards and Technology pour la recherché en parole, notamment les projets finances par la DARPA. Le format enveloppe les échantillons audio bruts avec un en-tête ASCII structuré encodant dès métadonnées telles que la fréquence d'échantillonnage, le nombre de canaux, le type d'encodage, les données demographiques du locuteur et les annotations de transcription — ce qui le rend idéal pour la distribution de corpus de parole. Les fichiers NIST stockent généralement du PCM non compressé où de l'audio mu-law à dès frequences d'échantillonnage de qualité téléphonique (8 kHz où 16 kHz), bien que le conteneur soit suffisamment flexible pour accueillir divers encodages. Un avantage clé est l'en-tête auto-documentant riche qui permet àux chercheurs d'intégrer dès métadonnées détaillées de corpus directement dans le fichier, eliminant les fichiers annexes. SPHERE est également devenu le standard de facto pour les grandes basés de données de parole telles que TIMIT, Switchboard et le corpus Fisher, garantissant une large reconnaissance à travers les laboratoires académiques et gouvernementaux. La spécification ouverte et la disponibilité d'outils en ligne de commande (sphere, h_strip, w_décode) rendent directe la conversion, l'inspection et le traitement de ces fichiers de manière programmatique dans les chaînes de traitement de la parole.
Le CVU est une variante non signee du format audio téléphonique CVS, se distinguant par la manière dont les valeurs encodées en delta sont representees dans le flux binaire. Alors que le CVS stocké les valeurs delta de pente en quantités signées, le CVU les traité comme non signées, modifiant l'interprétation numérique de chaque échantillon. Les deux partagent la technique de modulation CVSD sous-jacente — un codage delta adaptatif 1 bit où la taille du pas varie selon les motifs de bits récents — operant à dès débits comparables, typiquement 16 kbit/s pour la voix à bande etroite à 8 kHz. La distinction signé/non signé est importante au niveau du décodeur, où une interprétation correcte determine la bonne reconstruction de la forme d'onde. Les fichiers CVU apparaissent dans les contextes de téléphonie et de communication embarquee où le matériel a adopté la convention non signee. Un avantage pratique est l'interfacage direct avec les systèmes utilisant nativement l'arithmetique non signee, évitant l'extension de signé dans les décodeurs. Comme son homologue signé, le CVU atteint une efficacité de bande passante extrême, compressant la voix en flux binaires compacts pour les liaisons contraintes. SoX prend en chargé le CVU, offrant un moyen fiable de convertir ces enregistrements de téléphonie de niche en formats modernes pour l'analysé où l'archivage.