Convertisseur de NIST en CVSD
Convertissez vos fichiers nist en cvsd en ligne et gratuitement
nist
cvsd
Comment convertir un fichier NIST en fichier CVSD
Sélectionnez des fichiers depuis l'ordinateur, Google Drive, Dropbox, une URL ou glissez-les sur la page.
Choisissez cvsd ou tout autre format de sortie (plus de 200 formats supportés)
Laissez le fichier convertir et vous pourrez télécharger votre fichier cvsd juste après
À propos des formats
Le NIST SPHERE (SPeech HEader REsources) est un format de fichier audio spécialisé crée par le National Institute of Standards and Technology pour la recherché en parole, notamment les projets finances par la DARPA. Le format enveloppe les échantillons audio bruts avec un en-tête ASCII structuré encodant dès métadonnées telles que la fréquence d'échantillonnage, le nombre de canaux, le type d'encodage, les données demographiques du locuteur et les annotations de transcription — ce qui le rend idéal pour la distribution de corpus de parole. Les fichiers NIST stockent généralement du PCM non compressé où de l'audio mu-law à dès frequences d'échantillonnage de qualité téléphonique (8 kHz où 16 kHz), bien que le conteneur soit suffisamment flexible pour accueillir divers encodages. Un avantage clé est l'en-tête auto-documentant riche qui permet àux chercheurs d'intégrer dès métadonnées détaillées de corpus directement dans le fichier, eliminant les fichiers annexes. SPHERE est également devenu le standard de facto pour les grandes basés de données de parole telles que TIMIT, Switchboard et le corpus Fisher, garantissant une large reconnaissance à travers les laboratoires académiques et gouvernementaux. La spécification ouverte et la disponibilité d'outils en ligne de commande (sphere, h_strip, w_décode) rendent directe la conversion, l'inspection et le traitement de ces fichiers de manière programmatique dans les chaînes de traitement de la parole.
Le CVSD (Continuously Variable Slope Delta modulation) est une méthode de numérisation vocale normalisee pour un usage militaire et téléphonique par l'OTAN et le CCITT dans les années 1970. Il encodé les différences entre échantillons consecutifs sous forme d'un seul bit — 1 si l'échantillon courant dépasse la prediction, 0 sinon — tandis qu'un filtre de compression syllabique ajuste la taille du pas en surveillant les séquences de bits identiques. Fonctionnant à 16-64 kbit/s, le CVSD équilibre l'intelligibilite vocale et la bande passante, ce qui en fait le codage de prédilection pour les liaisons militaires sécurisées et les systèmes radio tactiques. Le flux binaire peut être décode avec un matériel simple, initialement intègre dans dès circuits intégrés dédiés. Un avantage est la simplicité de mise en oeuvre — les encodeurs et décodeurs nécessitent un minimum de ressources, permettant un traitement en temps réel sûr du matériel embarqué basse consommation. La robustesse en conditions bruitees est un autre atout, car les erreurs sûr un seul bit n'affectent que les échantillons locaux sans corrompre dès trames entières. SoX fournit un support d'encodage et de décodage logiciel, permettant àux systèmes modernes de travailler avec les enregistrements CVSD hérités dès archivés militaires et dès anciennes infrastructures de télécommunications.