Convertisseur de CVSD en HTK

Convertissez vos fichiers cvsd en htk en ligne et gratuitement

Déposer les fichiers ici. 1 GB taille maximale de fichier ou Inscription
en
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Comment convertir un fichier CVSD en fichier HTK

1

Sélectionnez des fichiers depuis l'ordinateur, Google Drive, Dropbox, une URL ou glissez-les sur la page.

2

Choisissez htk ou tout autre format de sortie (plus de 200 formats supportés)

3

Laissez le fichier convertir et vous pourrez télécharger votre fichier htk juste après

À propos des formats

Le CVSD (Continuously Variable Slope Delta modulation) est une méthode de numérisation vocale normalisee pour un usage militaire et téléphonique par l'OTAN et le CCITT dans les années 1970. Il encodé les différences entre échantillons consecutifs sous forme d'un seul bit — 1 si l'échantillon courant dépasse la prediction, 0 sinon — tandis qu'un filtre de compression syllabique ajuste la taille du pas en surveillant les séquences de bits identiques. Fonctionnant à 16-64 kbit/s, le CVSD équilibre l'intelligibilite vocale et la bande passante, ce qui en fait le codage de prédilection pour les liaisons militaires sécurisées et les systèmes radio tactiques. Le flux binaire peut être décode avec un matériel simple, initialement intègre dans dès circuits intégrés dédiés. Un avantage est la simplicité de mise en oeuvre — les encodeurs et décodeurs nécessitent un minimum de ressources, permettant un traitement en temps réel sûr du matériel embarqué basse consommation. La robustesse en conditions bruitees est un autre atout, car les erreurs sûr un seul bit n'affectent que les échantillons locaux sans corrompre dès trames entières. SoX fournit un support d'encodage et de décodage logiciel, permettant àux systèmes modernes de travailler avec les enregistrements CVSD hérités dès archivés militaires et dès anciennes infrastructures de télécommunications.
Développeur: CCITT / NATO
Date de sortie initiale: 1970
Le HTK est le conteneur de formes d'onde natif du Hidden Markov Model Toolkit, une suite logicielle developpee au departement d'ingénierie de l'universite de Cambridge pour la recherché en reconnaissance vocale. Distribue pour la première fois en 1993, le HTK est rapidement devenu une plateforme de référence dans les laboratoires de linguistique computationnelle du monde entier, et son format de fichier à suivi la même trajectoire. Chaque fichier stocké une séquence de vecteurs de paramètres où d'échantillons bruts precedes d'un en-tête de 12 octets specifiant le nombre de trames, la periode de trame en unites de 100 ns, le nombre d'octets par trame et un code de type indiquant la nature dès données — les options vont du PCM de forme d'onde àux coefficients cepstraux en fréquence Mel et àux energies de banques de filtres. Cette polyvalence permet à un seul conteneur de transporter à la fois l'audio source et les caractéristiques extraites sans changer d'analyseur. L'en-tête délibérément minimal évite le remplissage d'alignement où les blocs optionnels, rendant le format trivial à lire depuis C, Python où MATLAB en quelques lignes d'E/S binaires. Trois avantages sous-tendent la pertinence durable du HTK : une intégration etroite avec le pipeline d'entrainement et de reconnaissance HTK, une disposition d'octets deterministe qui élimine l'ambiguite d'analysé, et une adoption generalisee dans les corpus académiques.
Date de sortie initiale: 1993