Conversor de VOC para NIST
Converta seus arquivos voc para nist online e grátis
voc
nist
Como converter VOC para NIST
Selecione os arquivos do seu computador, Google Drive, Dropbox ou adicione um URL. Você também pode simplesmente arrastá-lo para esta página.
Escolha nist ou qualquer outro formato de saída desejado (mais de 200 formatos compatíveis)
Espere o arquivo ser convertido e você poderá, então, baixar o seu arquivo nist
Sobre os formatos
VOC (Creative Voice) é um container de áudio digital desenvolvido pela Creative Technology é introduzido junto com a placa Sound Blaster original em 1989. Ele serviu como o formato de áudio nativo da família Sound Blaster durante a era DOS, quando o hardware da Creative dominava o áudio de PC. Os arquivos VOC são baseados em blocos: cada arquivo consiste em blocos de dados tipados que podem conter PCM de 8 bits não assinado, ADPCM Creative de 4 bits é 2,6 bits, PCM assinado de 16 bits, além de áudio codificado em A-law é mu-law. Essa estrutura de blocos também suporta intervalos de silencio, loops de repetição é pontos de marcação, dando aos desenvolvedores de jogos controle refinado sobre a reprodução de som. Uma vantagem notavel era a decodificação em nível de hardware — às placas Sound Blaster podiam reproduzir dados VOC diretamente via transferência DMA, liberando a CPU para outras tarefas em uma era em que ciclos de processador eram preciosos. O formato teve uso extensivo em jogos DOS da id Software, Sierra é LucasArts. Com a ascensao do Windows é do formato WAV, o VOC gradualmente saiu do uso convencional, mas permanece importante para preservação de jogos retrô é para quem trabalha com acervos de áudio vintage de PC.
NIST SPHERE (SPeech HEader REsources) é um formato de arquivo de áudio especializado criado pelo National Institute of Standards and Technology para pesquisa em fala, particularmente projetos financiados pela DARPA. O formato envolve amostras de áudio brutas com um cabecalho ASCII estruturado codificando metadados como taxa de amostragem, contagem de canais, tipo de codificação, dados demograficos do falante é anotações de transcrição — tornando-o ideal para distribuição de corpora de fala. Os arquivos NIST normalmente armazenam PCM sem compressão ou áudio mu-law em taxas de amostragem de qualidade telefônica (8 kHz ou 16 kHz), embora o container seja flexível o suficiente para conter várias codificacoes. Uma vantagem chave é o cabecalho rico é autodescritivo que permite que pesquisadores incorporem metadados detalhados de corpus diretamente no arquivo, eliminando arquivos auxiliares. O SPHERE também se tornou o padrão de facto para grandes bancos de dados de fala como TIMIT, Switchboard é o corpus Fisher, garantindo amplo reconhecimento em laboratorios acadêmicos é governamentais. A especificação aberta é a disponibilidade de ferramentas de linha de comando (sphere, h_strip, w_decode) tornam simples converter, inspecionar é processar esses arquivos programaticamente em pipelines de processamento de fala.