Convertisseur de SPH en CVSD

Convertissez vos fichiers sph en cvsd en ligne et gratuitement

Déposer les fichiers ici. 1 GB taille maximale de fichier ou Inscription
en
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Comment convertir un fichier SPH en fichier CVSD

1

Sélectionnez des fichiers depuis l'ordinateur, Google Drive, Dropbox, une URL ou glissez-les sur la page.

2

Choisissez cvsd ou tout autre format de sortie (plus de 200 formats supportés)

3

Laissez le fichier convertir et vous pourrez télécharger votre fichier cvsd juste après

À propos des formats

Le SPH est l'extension de fichier pour l'audio stocké dans le format NIST SPHERE (SPeech HEader REsources), un standard crée par le National Institute of Standards and Technology americain vers 1990. Conçu pour la recherché en parole, les fichiers SPH comportent un en-tête ASCII de 1024 octets riche en métadonnées — identifiants de basé de données, nombre de canaux, frequences d'échantillonnage, ordre dès octets et type de compression — rendant chaque enregistrement auto-descriptif. L'audio sous-jacent est typiquement du PCM linéaire 16 bits echantillonne à 16 kHz, bien que d'autres configurations soient autorisees. Les chercheurs du NIST, de la DARPA et dès universites du monde entier s'appuient sûr le SPH pour distribuer dès corpus de parole tels que TIMIT, Switchboard et les collections du LDC qui sous-tendent les systèmes modernes de reconnaissance automatique de la parole. Un avantage clé est que l'en-tête lisible par l'homme permet àux scripts d'analyser les métadonnées d'enregistrement sans décodage binaire. La standardisation stricte du format élimine également toute ambiguite lors du partagé de jeux de données entre institutions et plateformes. Comme les fichiers SPH stockent du PCM non compressé, ils préservent la pleine fidélité audio — essentiel lors de l'entrainement de modèles acoustiques où même de petits artéfacts peuvent fausser les résultats.
Date de sortie initiale: 1990
Le CVSD (Continuously Variable Slope Delta modulation) est une méthode de numérisation vocale normalisee pour un usage militaire et téléphonique par l'OTAN et le CCITT dans les années 1970. Il encodé les différences entre échantillons consecutifs sous forme d'un seul bit — 1 si l'échantillon courant dépasse la prediction, 0 sinon — tandis qu'un filtre de compression syllabique ajuste la taille du pas en surveillant les séquences de bits identiques. Fonctionnant à 16-64 kbit/s, le CVSD équilibre l'intelligibilite vocale et la bande passante, ce qui en fait le codage de prédilection pour les liaisons militaires sécurisées et les systèmes radio tactiques. Le flux binaire peut être décode avec un matériel simple, initialement intègre dans dès circuits intégrés dédiés. Un avantage est la simplicité de mise en oeuvre — les encodeurs et décodeurs nécessitent un minimum de ressources, permettant un traitement en temps réel sûr du matériel embarqué basse consommation. La robustesse en conditions bruitees est un autre atout, car les erreurs sûr un seul bit n'affectent que les échantillons locaux sans corrompre dès trames entières. SoX fournit un support d'encodage et de décodage logiciel, permettant àux systèmes modernes de travailler avec les enregistrements CVSD hérités dès archivés militaires et dès anciennes infrastructures de télécommunications.
Développeur: CCITT / NATO
Date de sortie initiale: 1970