Conversor de NIST para AMR
Converta seus arquivos nist para amr online e grátis
nist
amr
Definições
12.2 kbps
O codec de áudio AMR suporta vários bitrates, com intervalo entre 4.75 e 12.2kbps, com uma fala de qualidade telefônica iniciando em 7.4 kbps.
Mono (1.0)
Define o número de canais de áudio. Essa configuração é muito útil ao reduzir canais (downmix), por exemplo, de 5.1 para estéreo.
8000 Hz
Define a taxa de amostragem do áudio. Música com um espectro completo (20 Hz – 20 kHz) requer valores não inferiores a 44.1 kHz para atingir a transparência. Mais informações podem ser encontradas na wiki.
nist
NIST SPHERE (SPeech HEader REsources) é um formato de arquivo de áudio especializado criado pelo National Institute of Standards and Technology para pesquisa em fala, particularmente projetos financiados pela DARPA. O formato envolve amostras de áudio brutas com um cabecalho ASCII estruturado codificando metadados como taxa de amostragem, contagem de canais, tipo de codificação, dados demograficos do falante é anotações de transcrição — tornando-o ideal para distribuição de corpora de fala. Os arquivos NIST normalmente armazenam PCM sem compressão ou áudio mu-law em taxas de amostragem de qualidade telefônica (8 kHz ou 16 kHz), embora o container seja flexível o suficiente para conter várias codificacoes. Uma vantagem chave é o cabecalho rico é autodescritivo que permite que pesquisadores incorporem metadados detalhados de corpus diretamente no arquivo, eliminando arquivos auxiliares. O SPHERE também se tornou o padrão de facto para grandes bancos de dados de fala como TIMIT, Switchboard é o corpus Fisher, garantindo amplo reconhecimento em laboratorios acadêmicos é governamentais. A especificação aberta é a disponibilidade de ferramentas de linha de comando (sphere, h_strip, w_decode) tornam simples converter, inspecionar é processar esses arquivos programaticamente em pipelines de processamento de fala.
leia mais
amr
AMR (Adaptive Multi-Rate) é um formato de áudio comprimido otimizado para voz, padronizado pelo Instituto Europeu de Normas de Telecomunicações é adotado como codec obrigatório para redes móveis GSM é 3G. O codec alterna dinamicamente entre oito taxas de bits — de 4,75 a 12,2 kbps — dependendo das condições da rede é dos níveis de ruido de fundo. Quando a qualidade do enlace cai, o codificador muda para uma taxa mais baixa, trocando clareza marginal por confiabilidade de transmissão. Esse mecanismo adaptativo é definido pelas especificações do 3GPP é representa um dos codecs de voz mais amplamente implantados globalmente, utilizado em bilhoes de chamadas móveis. A principal vantagem é a eficiência de compressão: um minuto de áudio AMR a 12,2 kbps ocupa aproximadamente 90 KB, prático para memorandos de voz, correio de voz é MMS em redes com largura de banda limitada. Outro beneficio é a deteccao de atividade de voz integrada é a geração de ruido de conforto, reduzindo a transmissão durante o silencio. Embora o AMR seja inadequado para música devido a sua largura de banda estreita (300-3400 Hz), ele se destaca na entrega de fala inteligivel sob condições de rede desafiadoras.
leia mais
Como converter NIST para AMR
Selecione os arquivos do seu computador, Google Drive, Dropbox ou adicione um URL. Você também pode simplesmente arrastá-lo para esta página.
Escolha amr ou qualquer outro formato de saída desejado (mais de 200 formatos compatíveis)
Espere o arquivo ser convertido e você poderá, então, baixar o seu arquivo amr
Sobre os formatos
NIST SPHERE (SPeech HEader REsources) é um formato de arquivo de áudio especializado criado pelo National Institute of Standards and Technology para pesquisa em fala, particularmente projetos financiados pela DARPA. O formato envolve amostras de áudio brutas com um cabecalho ASCII estruturado codificando metadados como taxa de amostragem, contagem de canais, tipo de codificação, dados demograficos do falante é anotações de transcrição — tornando-o ideal para distribuição de corpora de fala. Os arquivos NIST normalmente armazenam PCM sem compressão ou áudio mu-law em taxas de amostragem de qualidade telefônica (8 kHz ou 16 kHz), embora o container seja flexível o suficiente para conter várias codificacoes. Uma vantagem chave é o cabecalho rico é autodescritivo que permite que pesquisadores incorporem metadados detalhados de corpus diretamente no arquivo, eliminando arquivos auxiliares. O SPHERE também se tornou o padrão de facto para grandes bancos de dados de fala como TIMIT, Switchboard é o corpus Fisher, garantindo amplo reconhecimento em laboratorios acadêmicos é governamentais. A especificação aberta é a disponibilidade de ferramentas de linha de comando (sphere, h_strip, w_decode) tornam simples converter, inspecionar é processar esses arquivos programaticamente em pipelines de processamento de fala.
AMR (Adaptive Multi-Rate) é um formato de áudio comprimido otimizado para voz, padronizado pelo Instituto Europeu de Normas de Telecomunicações é adotado como codec obrigatório para redes móveis GSM é 3G. O codec alterna dinamicamente entre oito taxas de bits — de 4,75 a 12,2 kbps — dependendo das condições da rede é dos níveis de ruido de fundo. Quando a qualidade do enlace cai, o codificador muda para uma taxa mais baixa, trocando clareza marginal por confiabilidade de transmissão. Esse mecanismo adaptativo é definido pelas especificações do 3GPP é representa um dos codecs de voz mais amplamente implantados globalmente, utilizado em bilhoes de chamadas móveis. A principal vantagem é a eficiência de compressão: um minuto de áudio AMR a 12,2 kbps ocupa aproximadamente 90 KB, prático para memorandos de voz, correio de voz é MMS em redes com largura de banda limitada. Outro beneficio é a deteccao de atividade de voz integrada é a geração de ruido de conforto, reduzindo a transmissão durante o silencio. Embora o AMR seja inadequado para música devido a sua largura de banda estreita (300-3400 Hz), ele se destaca na entrega de fala inteligivel sob condições de rede desafiadoras.