Conversor de NIST para SOU
Converta seus arquivos nist para sou online e grátis
nist
sou
Como converter NIST para SOU
Selecione os arquivos do seu computador, Google Drive, Dropbox ou adicione um URL. Você também pode simplesmente arrastá-lo para esta página.
Escolha sou ou qualquer outro formato de saída desejado (mais de 200 formatos compatíveis)
Espere o arquivo ser convertido e você poderá, então, baixar o seu arquivo sou
Sobre os formatos
NIST SPHERE (SPeech HEader REsources) é um formato de arquivo de áudio especializado criado pelo National Institute of Standards and Technology para pesquisa em fala, particularmente projetos financiados pela DARPA. O formato envolve amostras de áudio brutas com um cabecalho ASCII estruturado codificando metadados como taxa de amostragem, contagem de canais, tipo de codificação, dados demograficos do falante é anotações de transcrição — tornando-o ideal para distribuição de corpora de fala. Os arquivos NIST normalmente armazenam PCM sem compressão ou áudio mu-law em taxas de amostragem de qualidade telefônica (8 kHz ou 16 kHz), embora o container seja flexível o suficiente para conter várias codificacoes. Uma vantagem chave é o cabecalho rico é autodescritivo que permite que pesquisadores incorporem metadados detalhados de corpus diretamente no arquivo, eliminando arquivos auxiliares. O SPHERE também se tornou o padrão de facto para grandes bancos de dados de fala como TIMIT, Switchboard é o corpus Fisher, garantindo amplo reconhecimento em laboratorios acadêmicos é governamentais. A especificação aberta é a disponibilidade de ferramentas de linha de comando (sphere, h_strip, w_decode) tornam simples converter, inspecionar é processar esses arquivos programaticamente em pipelines de processamento de fala.
SOU é uma designacao de formato de áudio bruto que funciona como alias para dados PCM de 8 bits não assinado (u8) no framework de processamento de áudio SoX. Arquivos com a extensão .sou contém amostras de áudio sem cabecalho é sem compressão armazenadas como inteiros de 8 bits não assinados — cada byte representa um único valor de amplitude de 0 a 255, com 128 como ponto médio de silencio. Como não há cabecalho, parâmetros de reprodução como taxa de amostragem é contagem de canais devem ser especificados externamente. A suposicao padrão é tipicamente mono a 8000 Hz, embora os dados possam representar qualquer taxa que o hardware de gravação suportasse. A codificação u8 que o SOU alias é uma das representações de áudio digital mais simples possíveis, anterior a containers de áudio estruturados como WAV e AIFF. PCM bruto não assinado era comumente produzido por placas de som é digitalizadores antigos no final dos anos 1980 é início dos anos 1990, quando restrições de armazenamento é poder de processamento limitado tornavam formatos sem cabecalho uma escolha prática. Uma vantagem é a simplicidade absoluta: arquivos SOU podem ser lidos por qualquer programa capaz de É/S básica de arquivo, sem análise de estruturas de container ou decodificação de metadados — útil para sistemas embarcados, diagnosticos de hardware é contextos educacionais onde fundamentos de áudio estão sendo explorados. A sobrecarga mínima do formato também significa que a conversão para qualquer container moderno é sem perdas é instantânea, já que às amostras PCM brutas podem ser envolvidas em um cabecalho WAV ou AIFF sem qualquer transcodificação.