Conversor de DSS para HTK

Converta seus arquivos dss para htk online e grátis

Solte os arquivos aqui. 1 GB tamanho máximo do ficheiro ou Registar-se
para
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Como converter DSS para HTK

1

Selecione os arquivos do seu computador, Google Drive, Dropbox ou adicione um URL. Você também pode simplesmente arrastá-lo para esta página.

2

Escolha htk ou qualquer outro formato de saída desejado (mais de 200 formatos compatíveis)

3

Espere o arquivo ser convertido e você poderá, então, baixar o seu arquivo htk

Sobre os formatos

DSS (Digital Speech Standard) é um formato proprietário de gravação de voz desenvolvido pela Olympus, Philips é Grundig em 1994 por meio da International Voice Association. Projetado para fluxos de trabalho de ditado, o DSS aplica compressão otimizada para fala em taxas de bits muito baixas — o padrão original codifica a aproximadamente 13,7 kbps, enquanto o DSS Pro alcança cerca de 28 kbps com clareza melhorada. O codec concentra seu orcamento nas faixas de frequência características da fala humana em vez do áudio de espectro completo, produzindo arquivos excepcionalmente compactos. Gravadores profissionais da Olympus é Philips usam DSS nativamente, integrando-se com software de transcrição que suporta sinalizadores de prioridade, marcadores é identificacao de autor nos metadados do arquivo. Uma vantagem é a eficiência de tamanho de arquivo: uma hora de ditado ocupa apenas 6-12 MB, prático para ambientes de alto volume como hospitais, escritorios de advocacia é tribunais. Os metadados integrados permitem roteamento perfeito pelas filas de transcrição com classificacao automática de prioridade. Embora o DSS seja um formato fechado com reprodução limitada a software compatível, seu dominio no ditado profissional garante suporte contínuo das principais plataformas de transcrição.
Lançamento inicial: 1994
HTK é o container de forma de onda nativo do Hidden Markov Model Toolkit, um pacote de software desenvolvido no Departamento de Engenharia da Universidade de Cambridge para pesquisa em reconhecimento de fala. Distribuido pela primeira vez em 1993, o HTK rapidamente se tornou uma plataforma de referência em laboratorios de linguística computacional em todo o mundo, e seu formato de arquivo seguiu o mesmo caminho. Cada arquivo armazena uma sequência de vetores de parâmetros ou amostras brutas precedidos por um cabecalho de 12 bytes especificando o número de quadros, o periodo do quadro em unidades de 100 ns, a contagem de bytes por quadro é um código de tipo indicando o tipo de dado — às opções vão desde PCM de forma de onda até coeficientes cepstrais de frequência Mel é energias de banco de filtros. Essa versatilidade permite que um único container carregue tanto áudio fonte quanto features extraidas sem alterar os analisadores. O cabecalho deliberadamente mínimo evita preenchimento de alinhamento ou blocos opcionais, tornando o formato trivial de ler a partir de C, Python ou MATLAB com poucas linhas de É/S binária. Três vantagens sustentam a relevancia duradoura do HTK: integração estreita com o pipeline de treinamento é reconhecimento HTK, layout de bytes deterministico que elimina ambiguidade no analisador é ampla adoção em corpora acadêmicos.
Lançamento inicial: 1993