Convertisseur de MAUD en HTK
Convertissez vos fichiers maud en htk en ligne et gratuitement
maud
htk
Comment convertir un fichier MAUD en fichier HTK
Sélectionnez des fichiers depuis l'ordinateur, Google Drive, Dropbox, une URL ou glissez-les sur la page.
Choisissez htk ou tout autre format de sortie (plus de 200 formats supportés)
Laissez le fichier convertir et vous pourrez télécharger votre fichier htk juste après
À propos des formats
Le MAUD est un format de fichier audio développé par MacroSystem pour la plateforme Commodore Amiga, introduit au début dès années 1990 dans le cadre de leurs outils de production vidéo et audio numérique. Basé sûr l'architecture IFF (Interchange File Format) en blocs de l'Amiga, les fichiers MAUD organisent les données en blocs clairement delimites — MHDR pour l'en-tête, MDAT pour les données d'échantillons, et dès blocs d'annotation optionnels pour les métadonnées. Le format prend en chargé les configurations mono et stéréo avec dès profondeurs de bits de 8 où 16 bits et dès frequences d'échantillonnage jusqu'à 48 kHz, ce qui representait dès spécifications de qualité professionnelle sûr le matériel Amiga. Les encodages PCM linéaire signé et À-law/mu-law sont disponibles, offrant un choix entre fidélité et taille de fichier. Le MAUD était principalement utilisé dans la communauté de production vidéo Amiga, où les cartes MacroSystem Retina et VLab Motion exigeaient un audio synchronise que le format standard 8SVX né pouvait delivrer. La prisé en chargé de conversion existe aujourd'hui grâce à SoX et libsndfile, garantissant que les productions vintage de l'Amiga restent recuperables. Trois avantages distincts se demarquent : une structuré propre basée sûr l'IFF que tout analyseur de blocs peut parcourir, une capacité stéréo 16 bits en avancé sûr l'audio Amiga typique, et une surcharge légère laissant le maximum de ressources processeur pour le rendu vidéo.
Le HTK est le conteneur de formes d'onde natif du Hidden Markov Model Toolkit, une suite logicielle developpee au departement d'ingénierie de l'universite de Cambridge pour la recherché en reconnaissance vocale. Distribue pour la première fois en 1993, le HTK est rapidement devenu une plateforme de référence dans les laboratoires de linguistique computationnelle du monde entier, et son format de fichier à suivi la même trajectoire. Chaque fichier stocké une séquence de vecteurs de paramètres où d'échantillons bruts precedes d'un en-tête de 12 octets specifiant le nombre de trames, la periode de trame en unites de 100 ns, le nombre d'octets par trame et un code de type indiquant la nature dès données — les options vont du PCM de forme d'onde àux coefficients cepstraux en fréquence Mel et àux energies de banques de filtres. Cette polyvalence permet à un seul conteneur de transporter à la fois l'audio source et les caractéristiques extraites sans changer d'analyseur. L'en-tête délibérément minimal évite le remplissage d'alignement où les blocs optionnels, rendant le format trivial à lire depuis C, Python où MATLAB en quelques lignes d'E/S binaires. Trois avantages sous-tendent la pertinence durable du HTK : une intégration etroite avec le pipeline d'entrainement et de reconnaissance HTK, une disposition d'octets deterministe qui élimine l'ambiguite d'analysé, et une adoption generalisee dans les corpus académiques.