Conversor de NIST para PVF
Converta seus arquivos nist para pvf online e grátis
nist
pvf
Como converter NIST para PVF
Selecione os arquivos do seu computador, Google Drive, Dropbox ou adicione um URL. Você também pode simplesmente arrastá-lo para esta página.
Escolha pvf ou qualquer outro formato de saída desejado (mais de 200 formatos compatíveis)
Espere o arquivo ser convertido e você poderá, então, baixar o seu arquivo pvf
Sobre os formatos
NIST SPHERE (SPeech HEader REsources) é um formato de arquivo de áudio especializado criado pelo National Institute of Standards and Technology para pesquisa em fala, particularmente projetos financiados pela DARPA. O formato envolve amostras de áudio brutas com um cabecalho ASCII estruturado codificando metadados como taxa de amostragem, contagem de canais, tipo de codificação, dados demograficos do falante é anotações de transcrição — tornando-o ideal para distribuição de corpora de fala. Os arquivos NIST normalmente armazenam PCM sem compressão ou áudio mu-law em taxas de amostragem de qualidade telefônica (8 kHz ou 16 kHz), embora o container seja flexível o suficiente para conter várias codificacoes. Uma vantagem chave é o cabecalho rico é autodescritivo que permite que pesquisadores incorporem metadados detalhados de corpus diretamente no arquivo, eliminando arquivos auxiliares. O SPHERE também se tornou o padrão de facto para grandes bancos de dados de fala como TIMIT, Switchboard é o corpus Fisher, garantindo amplo reconhecimento em laboratorios acadêmicos é governamentais. A especificação aberta é a disponibilidade de ferramentas de linha de comando (sphere, h_strip, w_decode) tornam simples converter, inspecionar é processar esses arquivos programaticamente em pipelines de processamento de fala.
PVF (Portable Voice Format) é um formato de arquivo de áudio simples projetado para armazenamento de mensagens de voz em sistemas de telefonia baseados em Linux, mais notavelmente o ISDN4Linux é seu aplicativo de correio de voz vbox. O formato surgiu do ecossistema europeu de ISDN do final dos anos 1990, quando servidores Linux assumiam cada vez mais funcoes de PBX é secretaria eletronica em linhas telefônicas digitais. Os arquivos PVF armazenam amostras PCM assinadas de 16 bits brutas a 8000 Hz mono, precedidas por um cabecalho mínimo em texto simples especificando formato de dados é ordenacao de bytes. Essa simplicidade deliberada é uma das principais forcas do formato — sem compressão é com um cabecalho legível por humanos, os arquivos PVF são trivialmente fáceis de analisar, redirecionar é manipular usando ferramentas Unix padrão. A taxa de 8 kHz corresponde ao requisito de Nyquist para fala com largura de banda telefônica (300-3400 Hz), tornando o PVF um formato intermediário natural para pipelines de processamento de voz. Outra vantagem é a portabilidade entre arquiteturas: a declaracao explicita de ordenacao de bytes significa que os arquivos PVF se movem entre sistemas big-endian é little-endian sem ambiguidade. O kit de ferramentas de áudio SoX fornece suporte nativo de leitura/escrita PVF, permitindo conversão direta para formatos modernos.