Conversor de NIST para CVU
Converta seus arquivos nist para cvu online e grátis
nist
cvu
Como converter NIST para CVU
Selecione os arquivos do seu computador, Google Drive, Dropbox ou adicione um URL. Você também pode simplesmente arrastá-lo para esta página.
Escolha cvu ou qualquer outro formato de saída desejado (mais de 200 formatos compatíveis)
Espere o arquivo ser convertido e você poderá, então, baixar o seu arquivo cvu
Sobre os formatos
NIST SPHERE (SPeech HEader REsources) é um formato de arquivo de áudio especializado criado pelo National Institute of Standards and Technology para pesquisa em fala, particularmente projetos financiados pela DARPA. O formato envolve amostras de áudio brutas com um cabecalho ASCII estruturado codificando metadados como taxa de amostragem, contagem de canais, tipo de codificação, dados demograficos do falante é anotações de transcrição — tornando-o ideal para distribuição de corpora de fala. Os arquivos NIST normalmente armazenam PCM sem compressão ou áudio mu-law em taxas de amostragem de qualidade telefônica (8 kHz ou 16 kHz), embora o container seja flexível o suficiente para conter várias codificacoes. Uma vantagem chave é o cabecalho rico é autodescritivo que permite que pesquisadores incorporem metadados detalhados de corpus diretamente no arquivo, eliminando arquivos auxiliares. O SPHERE também se tornou o padrão de facto para grandes bancos de dados de fala como TIMIT, Switchboard é o corpus Fisher, garantindo amplo reconhecimento em laboratorios acadêmicos é governamentais. A especificação aberta é a disponibilidade de ferramentas de linha de comando (sphere, h_strip, w_decode) tornam simples converter, inspecionar é processar esses arquivos programaticamente em pipelines de processamento de fala.
CVU é uma variante não assinada do formato de áudio telefônico CVS, diferindo na forma como os valores codificados em delta são representados no fluxo binário. Enquanto o CVS armazena valores de inclinacao delta como quantidades assinadas, o CVU os trata como não assinados, alterando a interpretação numerica de cada amostra. Ambos compartilham a técnica subjacente de modulação CVSD — codificação delta adaptativa de 1 bit onde o tamanho do passo varia de acordo com padrões recentes de bits de saída — operando em taxas comparaveis, tipicamente 16 kbps para voz de banda estreita a 8 kHz. A distincao entre assinado é não assinado importá no decodificador, onde a interpretação correta determina a reconstrucao adequada da forma de onda. Arquivos CVU aparecem em contextos de telefonia é comunicação embarcada onde o hardware adotou a convencao não assinada. Uma vantagem prática é a interface direta com sistemas que usam aritmetica não assinada nativamente, evitando extensão de sinal nos decodificadores. Assim como sua contraparte assinada, o CVU alcança eficiência extrema de largura de banda, comprimindo voz em fluxos de bits compactos para enlaces restritos. O SoX suporta CVU, fornecendo um caminho confiável para converter essas gravações telefônicas de nicho em formatos modernos para análise ou arquivo.