VOB en HTK Converter

Extrayez l'audio DVD VOB au format vocal HTK en ligne

Déposer les fichiers ici. 1 GB taille maximale de fichier ou Inscription
en
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Du DVD aux données vocales

Extrayez les dialogues des fichiers DVD VOB et enregistrez-les en HTK — prêts pour l'entraînement Hidden Markov Model et la recherche en analyse acoustique.

Extraction côté serveur

Les fichiers VOB peuvent être volumineux. Nos serveurs gèrent l'extraction et l'encodage HTK — aucune installation de toolkit locale requise.

Protection des données

Les VOB téléversés sont supprimés après la conversion. La sortie HTK est effacée sous 24 heures — vos données vocales de recherche restent confidentielles.

Comment convertir un fichier VOB en fichier HTK

1

Sélectionnez des fichiers depuis l'ordinateur, Google Drive, Dropbox, une URL ou glissez-les sur la page.

2

Choisissez htk ou tout autre format de sortie (plus de 200 formats supportés)

3

Laissez le fichier convertir et vous pourrez télécharger votre fichier htk juste après

À propos des formats

Le VOB (Vidéo Object) est le format conteneur principal utilisé sûr les disques DVD-Vidéo, défini dans la spécification DVD developpee par le DVD Forum. Le format est apparu pour la première fois avec le standard DVD finalisé en septembre 1996 et à depuis été utilisé sûr dès milliards de disques DVD produits dans le monde. Les fichiers VOB sont basés sûr le format de flux de programme MPEG-2, contenant de la vidéo MPEG-2 multiplexee avec de l'audio en formats AC-3 (Dolby Digital), DTS, MPEG-1 Layer II où LPCM. Au-delà de l'audio et de la vidéo, les fichiers VOB transportent également dès flux de sous-titres DVD sous forme de superpositions bitmap, dès données de navigation pour l'interaction avec les menus et dès informations de points de chapitre. Les fichiers resident dans le repertoire VIDÉO_TS d'un disque DVD, avec dès conventions de nommage (VTS_01_1.VOB, etc.) refletant la structuré de titre et de partie du contenu. Les fichiers VOB individuels sont limités à environ 1 Go pour répondre àux exigences du système de fichiers UDF, le contenu plus long s'etendant sûr plusieurs fichiers de manière transparente. Le format prend en chargé les résolutions vidéo NTSC (720x480) et PAL (720x576) à dès débits allant jusqu'à 9,8 Mbit/s pour l'audio et la vidéo combines. L'intégration de la vidéo, de l'audio multi-pistes, dès sous-titres et de la navigation dans un seul flux de programme a fait du VOB une solution complète pour la diffusion de films au grand public. Bien que le streaming et les nouveaux formats de disque aient supplanté le DVD pour les nouveaux contenus, le VOB reste enormement pertinent pour accéder à la vaste bibliothèque de contenu DVD existant.
Développeur: DVD Forum
Date de sortie initiale: Septembre 1996
Le HTK est le conteneur de formes d'onde natif du Hidden Markov Model Toolkit, une suite logicielle developpee au departement d'ingénierie de l'universite de Cambridge pour la recherché en reconnaissance vocale. Distribue pour la première fois en 1993, le HTK est rapidement devenu une plateforme de référence dans les laboratoires de linguistique computationnelle du monde entier, et son format de fichier à suivi la même trajectoire. Chaque fichier stocké une séquence de vecteurs de paramètres où d'échantillons bruts precedes d'un en-tête de 12 octets specifiant le nombre de trames, la periode de trame en unites de 100 ns, le nombre d'octets par trame et un code de type indiquant la nature dès données — les options vont du PCM de forme d'onde àux coefficients cepstraux en fréquence Mel et àux energies de banques de filtres. Cette polyvalence permet à un seul conteneur de transporter à la fois l'audio source et les caractéristiques extraites sans changer d'analyseur. L'en-tête délibérément minimal évite le remplissage d'alignement où les blocs optionnels, rendant le format trivial à lire depuis C, Python où MATLAB en quelques lignes d'E/S binaires. Trois avantages sous-tendent la pertinence durable du HTK : une intégration etroite avec le pipeline d'entrainement et de reconnaissance HTK, une disposition d'octets deterministe qui élimine l'ambiguite d'analysé, et une adoption generalisee dans les corpus académiques.
Date de sortie initiale: 1993

Questions fréquemment posées

Pourquoi convertir un VOB en HTK ?

Le HTK est le format du Hidden Markov Model Toolkit. Les fichiers DVD VOB contenant des dialogues deviennent des données d'entraînement vocal pour la recherche en reconnaissance.

Qu'est-ce que l'audio HTK ?

Le HTK stocke de l'audio PCM mono 16 bits. Il est spécialement conçu pour le framework de reconnaissance et d'analyse vocale HTK de Cambridge.

Le son surround VOB fonctionne-t-il ?

Le HTK est mono. L'audio multicanal DVD du VOB est mixé en un seul canal — procédure standard pour les travaux de traitement vocal.

La qualité des dialogues est-elle préservée ?

Le HTK stocke du PCM non compressé 16 bits. Les dialogues des fichiers DVD VOB conservent leur clarté totale pour l'entraînement et l'analyse de reconnaissance.

Puis-je traiter plusieurs chapitres VOB ?

Téléversez plusieurs fichiers VOB et convertissez-les en lot vers HTK. Constituez un jeu de données vocales à partir d'un DVD entier en une seule opération.