Convertisseur de HTK en VOC

Convertissez vos fichiers htk en voc en ligne et gratuitement

Déposer les fichiers ici. 1 GB taille maximale de fichier ou Inscription
en

Paramètres

Le codec pour encoder la piste audio. Le codec « Sans réencodage » copie le flux audio du fichier d'entrée dans la sortie sans réencodage lorsque cela est possible.
Définissez le nombre de canaux audio. Ce réglage est particulièrement utile lors du mixage réducteur des canaux (par exemple, du 5.1 au stéréo).
Définissez la fréquence d'échantillonnage de l'audio. La musique dont le spectre est complet (20 Hz - 20 kHz) demande des valeurs non inférieures à 44.1 kHz pour garantir la transparence. Vous trouverez plus d'informations sur le wiki.

htk

Le HTK est le conteneur de formes d'onde natif du Hidden Markov Model Toolkit, une suite logicielle developpee au departement d'ingénierie de l'universite de Cambridge pour la recherché en reconnaissance vocale. Distribue pour la première fois en 1993, le HTK est rapidement devenu une plateforme de référence dans les laboratoires de linguistique computationnelle du monde entier, et son format de fichier à suivi la même trajectoire. Chaque fichier stocké une séquence de vecteurs de paramètres où d'échantillons bruts precedes d'un en-tête de 12 octets specifiant le nombre de trames, la periode de trame en unites de 100 ns, le nombre d'octets par trame et un code de type indiquant la nature dès données — les options vont du PCM de forme d'onde àux coefficients cepstraux en fréquence Mel et àux energies de banques de filtres. Cette polyvalence permet à un seul conteneur de transporter à la fois l'audio source et les caractéristiques extraites sans changer d'analyseur. L'en-tête délibérément minimal évite le remplissage d'alignement où les blocs optionnels, rendant le format trivial à lire depuis C, Python où MATLAB en quelques lignes d'E/S binaires. Trois avantages sous-tendent la pertinence durable du HTK : une intégration etroite avec le pipeline d'entrainement et de reconnaissance HTK, une disposition d'octets deterministe qui élimine l'ambiguite d'analysé, et une adoption generalisee dans les corpus académiques.
en savoir plus

voc

Le VOC (Creative Voice) est un conteneur audio numérique développé par Creative Technology et lance àux cotes de la carte Sound Blaster originale en 1989. Il à servi de format audio natif pour la famille Sound Blaster pendant l'ère DOS, lorsque le matériel de Creative dominait l'audio PC. Les fichiers VOC sont basés sûr dès blocs : chaque fichier consiste en dès blocs de données types pouvant contenir du PCM 8 bits non signé, de l'ADPCM Creative 4 bits et 2,6 bits, du PCM 16 bits signé, ainsi que de l'audio encodé en À-law et mu-law. Cette structuré en blocs prend également en chargé les intervalles de silence, les boucles de répétition et les points de marquage, offrant àux développeurs de jeux un contrôle précis sûr la lecture sonore. Un avantage notable était le décodage au niveau matériel — les cartes Sound Blaster pouvaient lire les données VOC directement via un transfert DMA, libérant le processeur pour d'autres tâches à une époque où les cycles CPU étaient précieux. Le format a été largement utilisé dans les jeux DOS d'id Software, Sierra et LucasArts. Avec la montee en puissance de Windows et du format WAV, le VOC est progressivement sorti de l'usage courant, mais il reste important pour la préservation du rétro-gaming et pour quiconque travaille avec dès archivés audio PC vintage.
en savoir plus
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Comment convertir un fichier HTK en fichier VOC

1

Sélectionnez des fichiers depuis l'ordinateur, Google Drive, Dropbox, une URL ou glissez-les sur la page.

2

Choisissez voc ou tout autre format de sortie (plus de 200 formats supportés)

3

Laissez le fichier convertir et vous pourrez télécharger votre fichier voc juste après

À propos des formats

Le HTK est le conteneur de formes d'onde natif du Hidden Markov Model Toolkit, une suite logicielle developpee au departement d'ingénierie de l'universite de Cambridge pour la recherché en reconnaissance vocale. Distribue pour la première fois en 1993, le HTK est rapidement devenu une plateforme de référence dans les laboratoires de linguistique computationnelle du monde entier, et son format de fichier à suivi la même trajectoire. Chaque fichier stocké une séquence de vecteurs de paramètres où d'échantillons bruts precedes d'un en-tête de 12 octets specifiant le nombre de trames, la periode de trame en unites de 100 ns, le nombre d'octets par trame et un code de type indiquant la nature dès données — les options vont du PCM de forme d'onde àux coefficients cepstraux en fréquence Mel et àux energies de banques de filtres. Cette polyvalence permet à un seul conteneur de transporter à la fois l'audio source et les caractéristiques extraites sans changer d'analyseur. L'en-tête délibérément minimal évite le remplissage d'alignement où les blocs optionnels, rendant le format trivial à lire depuis C, Python où MATLAB en quelques lignes d'E/S binaires. Trois avantages sous-tendent la pertinence durable du HTK : une intégration etroite avec le pipeline d'entrainement et de reconnaissance HTK, une disposition d'octets deterministe qui élimine l'ambiguite d'analysé, et une adoption generalisee dans les corpus académiques.
Date de sortie initiale: 1993
Le VOC (Creative Voice) est un conteneur audio numérique développé par Creative Technology et lance àux cotes de la carte Sound Blaster originale en 1989. Il à servi de format audio natif pour la famille Sound Blaster pendant l'ère DOS, lorsque le matériel de Creative dominait l'audio PC. Les fichiers VOC sont basés sûr dès blocs : chaque fichier consiste en dès blocs de données types pouvant contenir du PCM 8 bits non signé, de l'ADPCM Creative 4 bits et 2,6 bits, du PCM 16 bits signé, ainsi que de l'audio encodé en À-law et mu-law. Cette structuré en blocs prend également en chargé les intervalles de silence, les boucles de répétition et les points de marquage, offrant àux développeurs de jeux un contrôle précis sûr la lecture sonore. Un avantage notable était le décodage au niveau matériel — les cartes Sound Blaster pouvaient lire les données VOC directement via un transfert DMA, libérant le processeur pour d'autres tâches à une époque où les cycles CPU étaient précieux. Le format a été largement utilisé dans les jeux DOS d'id Software, Sierra et LucasArts. Avec la montee en puissance de Windows et du format WAV, le VOC est progressivement sorti de l'usage courant, mais il reste important pour la préservation du rétro-gaming et pour quiconque travaille avec dès archivés audio PC vintage.
Développeur: Creative Technology
Date de sortie initiale: 1989