Convertisseur de HTK en CVU

Convertissez vos fichiers htk en cvu en ligne et gratuitement

Déposer les fichiers ici. 1 GB taille maximale de fichier ou Inscription
en
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Comment convertir un fichier HTK en fichier CVU

1

Sélectionnez des fichiers depuis l'ordinateur, Google Drive, Dropbox, une URL ou glissez-les sur la page.

2

Choisissez cvu ou tout autre format de sortie (plus de 200 formats supportés)

3

Laissez le fichier convertir et vous pourrez télécharger votre fichier cvu juste après

À propos des formats

Le HTK est le conteneur de formes d'onde natif du Hidden Markov Model Toolkit, une suite logicielle developpee au departement d'ingénierie de l'universite de Cambridge pour la recherché en reconnaissance vocale. Distribue pour la première fois en 1993, le HTK est rapidement devenu une plateforme de référence dans les laboratoires de linguistique computationnelle du monde entier, et son format de fichier à suivi la même trajectoire. Chaque fichier stocké une séquence de vecteurs de paramètres où d'échantillons bruts precedes d'un en-tête de 12 octets specifiant le nombre de trames, la periode de trame en unites de 100 ns, le nombre d'octets par trame et un code de type indiquant la nature dès données — les options vont du PCM de forme d'onde àux coefficients cepstraux en fréquence Mel et àux energies de banques de filtres. Cette polyvalence permet à un seul conteneur de transporter à la fois l'audio source et les caractéristiques extraites sans changer d'analyseur. L'en-tête délibérément minimal évite le remplissage d'alignement où les blocs optionnels, rendant le format trivial à lire depuis C, Python où MATLAB en quelques lignes d'E/S binaires. Trois avantages sous-tendent la pertinence durable du HTK : une intégration etroite avec le pipeline d'entrainement et de reconnaissance HTK, une disposition d'octets deterministe qui élimine l'ambiguite d'analysé, et une adoption generalisee dans les corpus académiques.
Date de sortie initiale: 1993
Le CVU est une variante non signee du format audio téléphonique CVS, se distinguant par la manière dont les valeurs encodées en delta sont representees dans le flux binaire. Alors que le CVS stocké les valeurs delta de pente en quantités signées, le CVU les traité comme non signées, modifiant l'interprétation numérique de chaque échantillon. Les deux partagent la technique de modulation CVSD sous-jacente — un codage delta adaptatif 1 bit où la taille du pas varie selon les motifs de bits récents — operant à dès débits comparables, typiquement 16 kbit/s pour la voix à bande etroite à 8 kHz. La distinction signé/non signé est importante au niveau du décodeur, où une interprétation correcte determine la bonne reconstruction de la forme d'onde. Les fichiers CVU apparaissent dans les contextes de téléphonie et de communication embarquee où le matériel a adopté la convention non signee. Un avantage pratique est l'interfacage direct avec les systèmes utilisant nativement l'arithmetique non signee, évitant l'extension de signé dans les décodeurs. Comme son homologue signé, le CVU atteint une efficacité de bande passante extrême, compressant la voix en flux binaires compacts pour les liaisons contraintes. SoX prend en chargé le CVU, offrant un moyen fiable de convertir ces enregistrements de téléphonie de niche en formats modernes pour l'analysé où l'archivage.
Développeur: CCITT / ITU-T
Date de sortie initiale: 1970