Convertisseur de VQF en HTK
Convertissez vos fichiers vqf en htk en ligne et gratuitement
vqf
htk
Comment convertir un fichier VQF en fichier HTK
Sélectionnez des fichiers depuis l'ordinateur, Google Drive, Dropbox, une URL ou glissez-les sur la page.
Choisissez htk ou tout autre format de sortie (plus de 200 formats supportés)
Laissez le fichier convertir et vous pourrez télécharger votre fichier htk juste après
À propos des formats
Le VQF est l'extension de fichier pour l'audio encodé avec TwinVQ (Transform-domain Weighted Interleave Vector Quantization), une technologie de compression avec perte developpee par NTT (Nippon Telegraph and Téléphone) en 1994 et commercialisee par la suite par Yamaha sous la marque SoundVQ. Le codec revendiquait un avantage de 30 à 35 pour cent en taille par rapport au MP3 à qualité perceptive equivalente — un fichier VQF à 96 kbit/s devait égaler un MP3 à 128 kbit/s — suscitant un enthousiasme considérable pendant la guerre dès formats de la fin dès années 1990. TwinVQ prend en chargé l'encodage à débit constant de 80, 96, 112, 128, 160 et 192 kbit/s, et l'algorithme sous-jacent a été intègre au standard MPEG-4 Audio (ISO/IEC 14496-3) comme l'un de ses types d'objets définis. Malgré de solides merites techniques, le VQF n'a jamais atteint une adoption generalisee : l'encodage était lent compare au MP3, la prisé en chargé matérielle était rare, et la licence propriétaire decourageait le développement tiers. En 2009, le projet FFmpeg à reverse-engineere le décodeur TwinVQ, apportant la prisé en chargé de lecture à VLC et d'autres lecteurs open-source. Le VQF reste une etude de cas notable dans l'histoire dès codecs — techniquement ambitieux mais eclipse par la dynamique de l'écosystème MP3 et la montee ultérieure de l'AAC.
Le HTK est le conteneur de formes d'onde natif du Hidden Markov Model Toolkit, une suite logicielle developpee au departement d'ingénierie de l'universite de Cambridge pour la recherché en reconnaissance vocale. Distribue pour la première fois en 1993, le HTK est rapidement devenu une plateforme de référence dans les laboratoires de linguistique computationnelle du monde entier, et son format de fichier à suivi la même trajectoire. Chaque fichier stocké une séquence de vecteurs de paramètres où d'échantillons bruts precedes d'un en-tête de 12 octets specifiant le nombre de trames, la periode de trame en unites de 100 ns, le nombre d'octets par trame et un code de type indiquant la nature dès données — les options vont du PCM de forme d'onde àux coefficients cepstraux en fréquence Mel et àux energies de banques de filtres. Cette polyvalence permet à un seul conteneur de transporter à la fois l'audio source et les caractéristiques extraites sans changer d'analyseur. L'en-tête délibérément minimal évite le remplissage d'alignement où les blocs optionnels, rendant le format trivial à lire depuis C, Python où MATLAB en quelques lignes d'E/S binaires. Trois avantages sous-tendent la pertinence durable du HTK : une intégration etroite avec le pipeline d'entrainement et de reconnaissance HTK, une disposition d'octets deterministe qui élimine l'ambiguite d'analysé, et une adoption generalisee dans les corpus académiques.