Conversor de DVMS para HTK
Converta seus arquivos dvms para htk online e grátis
dvms
htk
Como converter DVMS para HTK
Selecione os arquivos do seu computador, Google Drive, Dropbox ou adicione um URL. Você também pode simplesmente arrastá-lo para esta página.
Escolha htk ou qualquer outro formato de saída desejado (mais de 200 formatos compatíveis)
Espere o arquivo ser convertido e você poderá, então, baixar o seu arquivo htk
Sobre os formatos
DVMS (Dutch Voice Messaging System) é uma codificação de áudio para telefonia nascida do impulso inicial da Holanda em direção a infraestrutura de correio de voz digital. Implantado por meio da KPN (antiga PTT Telecom) em meados dos anos 1980, o formato armazena dados de voz mono a uma taxa de amostragem estreita de 8 kHz, priorizando o tamanho compacto da mensagem em detrimento da amplitude sonica. O áudio é comprimido com uma variante proprietária de companding logaritmico semelhante a codificação A-law europeia, comprimindo gravações para aproximadamente 8 kbit/s enquanto mantém a fala inteligivel. Cada arquivo carregá um pequeno cabecalho identificando taxa de amostragem, tipo de compressão é metadados da mensagem, o que tornava o roteamento automatizado em sistemas PBX é de correio de voz antigos bastante simples. Embora o DVMS nunca tenha ganhado tracao fora dos circulos de telecomunicações holandeses, ele influenciou a forma como às operadoras europeias projetaram protocolos de mensagens de voz posteriores. Ferramentas como SoX é várias bibliotecas de telefonia legada ainda leem é escrevem arquivos DVMS, permitindo a reprodução de arquivo de mensagens com décadas de idade. Entre suas vantagens práticas: tamanhos de arquivo extremamente pequenos (uma mensagem de um minuto ocupa aproximadamente 60 KB), clareza de fala confiável apesar da compressão agressiva é um layout de container simples que é fácil de analisar programaticamente.
HTK é o container de forma de onda nativo do Hidden Markov Model Toolkit, um pacote de software desenvolvido no Departamento de Engenharia da Universidade de Cambridge para pesquisa em reconhecimento de fala. Distribuido pela primeira vez em 1993, o HTK rapidamente se tornou uma plataforma de referência em laboratorios de linguística computacional em todo o mundo, e seu formato de arquivo seguiu o mesmo caminho. Cada arquivo armazena uma sequência de vetores de parâmetros ou amostras brutas precedidos por um cabecalho de 12 bytes especificando o número de quadros, o periodo do quadro em unidades de 100 ns, a contagem de bytes por quadro é um código de tipo indicando o tipo de dado — às opções vão desde PCM de forma de onda até coeficientes cepstrais de frequência Mel é energias de banco de filtros. Essa versatilidade permite que um único container carregue tanto áudio fonte quanto features extraidas sem alterar os analisadores. O cabecalho deliberadamente mínimo evita preenchimento de alinhamento ou blocos opcionais, tornando o formato trivial de ler a partir de C, Python ou MATLAB com poucas linhas de É/S binária. Três vantagens sustentam a relevancia duradoura do HTK: integração estreita com o pipeline de treinamento é reconhecimento HTK, layout de bytes deterministico que elimina ambiguidade no analisador é ampla adoção em corpora acadêmicos.