VOB para HTK Converter

Extraia áudio de DVD VOB no formato de fala HTK online

Solte os arquivos aqui. 1 GB tamanho máximo do ficheiro ou Registar-se
para
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

DVD para Dados de Fala

Extraia diálogos de VOBs de DVD e salve como HTK — pronto para treinamento de Hidden Markov Model e pesquisa de análise acústica.

Extração no Servidor

VOBs podem ser grandes. Nossos servidores realizam a extração e codificação HTK — nenhuma instalação local de toolkit necessária.

Proteção de Dados

Os VOBs enviados são removidos após a conversão. A saída HTK é excluída em até 24 horas — seus dados de fala de pesquisa permanecem privados.

Como converter VOB para HTK

1

Selecione os arquivos do seu computador, Google Drive, Dropbox ou adicione um URL. Você também pode simplesmente arrastá-lo para esta página.

2

Escolha htk ou qualquer outro formato de saída desejado (mais de 200 formatos compatíveis)

3

Espere o arquivo ser convertido e você poderá, então, baixar o seu arquivo htk

Sobre os formatos

VOB (Vídeo Object) é o formato de container primario usado em discos DVD-Vídeo, definido como parte da especificação DVD desenvolvida pelo DVD Forum. O formato apareceu pela primeira vez com o padrão DVD finalizado em setembro de 1996 é desde então têm sido usado em bilhoes de discos DVD produzidos em todo o mundo. Os arquivos VOB são baseados no formato de program stream MPEG-2, contendo vídeo MPEG-2 multiplexado junto com áudio nos formatos AC-3 (Dolby Digital), DTS, MPEG-1 Layer II ou LPCM. Além de áudio é vídeo, os arquivos VOB também carregam fluxos de legendas de DVD como sobreposições bitmap, dados de navegação para interação com menus é informações de pontos de capitulo. Os arquivos residem no diretorio VÍDEO_TS em um disco DVD, com convencoes de nomenclatura (VTS_01_1.VOB, etc.) refletindo a estrutura de titulo é parte do conteúdo. Arquivos VOB individuais são limitados a aproximadamente 1 GB para acomodar os requisitos do sistema de arquivos UDF, com conteúdo mais longo abrangendo múltiplos arquivos de forma contínua. O formato suporta resoluções de vídeo NTSC (720x480) é PAL (720x576) em taxas de bits de até 9,8 Mbps para áudio é vídeo combinados. A integração de vídeo, áudio multifaixa, legendas é navegação em um único program stream tornou o VOB uma solução completa para entrega de filmes ao consumidor. Embora streaming é formatos de disco mais novos tenham substituído o DVD para conteúdo novo, o VOB permanece extremamente relevante para acessar a vasta biblioteca de conteúdo DVD existente.
Desenvolvedor: DVD Forum
Lançamento inicial: Setembro 1996
HTK é o container de forma de onda nativo do Hidden Markov Model Toolkit, um pacote de software desenvolvido no Departamento de Engenharia da Universidade de Cambridge para pesquisa em reconhecimento de fala. Distribuido pela primeira vez em 1993, o HTK rapidamente se tornou uma plataforma de referência em laboratorios de linguística computacional em todo o mundo, e seu formato de arquivo seguiu o mesmo caminho. Cada arquivo armazena uma sequência de vetores de parâmetros ou amostras brutas precedidos por um cabecalho de 12 bytes especificando o número de quadros, o periodo do quadro em unidades de 100 ns, a contagem de bytes por quadro é um código de tipo indicando o tipo de dado — às opções vão desde PCM de forma de onda até coeficientes cepstrais de frequência Mel é energias de banco de filtros. Essa versatilidade permite que um único container carregue tanto áudio fonte quanto features extraidas sem alterar os analisadores. O cabecalho deliberadamente mínimo evita preenchimento de alinhamento ou blocos opcionais, tornando o formato trivial de ler a partir de C, Python ou MATLAB com poucas linhas de É/S binária. Três vantagens sustentam a relevancia duradoura do HTK: integração estreita com o pipeline de treinamento é reconhecimento HTK, layout de bytes deterministico que elimina ambiguidade no analisador é ampla adoção em corpora acadêmicos.
Lançamento inicial: 1993

Perguntas Frequentes

Por que converter VOB para HTK?

O HTK é o formato do Hidden Markov Model Toolkit. VOBs de DVD com diálogos tornam-se dados de treinamento de fala para pesquisa de reconhecimento.

O que é áudio HTK?

O HTK armazena áudio PCM de 16 bits em canal único. É feito especificamente para o framework de reconhecimento e análise de fala HTK de Cambridge.

O áudio surround do VOB funciona?

O HTK é mono. O áudio multicanal de DVD do VOB é mixado para um único canal — procedimento padrão para trabalhos de processamento de fala.

A qualidade do diálogo é preservada?

O HTK armazena PCM não comprimido de 16 bits. O diálogo de VOBs de DVD mantém clareza total para treinamento e análise de reconhecimento.

Posso processar vários capítulos VOB?

Envie múltiplos VOBs e converta-os em lote para HTK. Construa um dataset de fala de um DVD inteiro em uma operação.