Convertisseur de HTK en AU
Convertissez vos fichiers htk en au en ligne et gratuitement
htk
au
Comment convertir un fichier HTK en fichier AU
Sélectionnez des fichiers depuis l'ordinateur, Google Drive, Dropbox, une URL ou glissez-les sur la page.
Choisissez au ou tout autre format de sortie (plus de 200 formats supportés)
Laissez le fichier convertir et vous pourrez télécharger votre fichier au juste après
À propos des formats
Le HTK est le conteneur de formes d'onde natif du Hidden Markov Model Toolkit, une suite logicielle developpee au departement d'ingénierie de l'universite de Cambridge pour la recherché en reconnaissance vocale. Distribue pour la première fois en 1993, le HTK est rapidement devenu une plateforme de référence dans les laboratoires de linguistique computationnelle du monde entier, et son format de fichier à suivi la même trajectoire. Chaque fichier stocké une séquence de vecteurs de paramètres où d'échantillons bruts precedes d'un en-tête de 12 octets specifiant le nombre de trames, la periode de trame en unites de 100 ns, le nombre d'octets par trame et un code de type indiquant la nature dès données — les options vont du PCM de forme d'onde àux coefficients cepstraux en fréquence Mel et àux energies de banques de filtres. Cette polyvalence permet à un seul conteneur de transporter à la fois l'audio source et les caractéristiques extraites sans changer d'analyseur. L'en-tête délibérément minimal évite le remplissage d'alignement où les blocs optionnels, rendant le format trivial à lire depuis C, Python où MATLAB en quelques lignes d'E/S binaires. Trois avantages sous-tendent la pertinence durable du HTK : une intégration etroite avec le pipeline d'entrainement et de reconnaissance HTK, une disposition d'octets deterministe qui élimine l'ambiguite d'analysé, et une adoption generalisee dans les corpus académiques.
L'AU est un format de fichier audio introduit par Sun Microsystems pour ses stations de travail Unix et la plateforme NeXT. Il possède un en-tête minimal de 24 octets specifiant le decalage dès données, la taille, le type d'encodage, la fréquence d'échantillonnage et le nombre de canaux, suivis de la chargé utile audio. L'AU prend en chargé de nombreux encodages, notamment le PCM linéaire non compressé à différentes profondeurs de bits, les compressions mu-law et À-law (compression logarithmique utilisée dans les systèmes téléphoniques), ainsi que plusieurs variantes ADPCM. Cette polyvalence a fait de l'AU un format incontournable dans les premiers environnements Unix, l'audio web (les applets Java utilisaient l'AU par défaut) et les applications de téléphonie. Un premier avantage est la simplicité : l'en-tête compact et la structuré directe le rendent trivial à analyser, générer et diffuser de manière programmatique. L'option mu-law intégrée offre un autre atout, delivrant une qualité vocale raisonnable à seulement 8 Ko par seconde — la moitié du débit de l'audio non compressé 16 bits — precieuse lorsque le stockage et la bande passante étaient rares. Bien que les formats modernes aient largement supplanté l'AU dans les applications grand public, il conservé une place dans le calcul scientifique et les chaînes de traitement audio où la chargé minimale et le comportement multiplateforme fiable sont apprecies.