Conversor de AV1 para NIST

Extraia áudio NIST Sphere de vídeo AV1 online

Solte os arquivos aqui. 1 GB tamanho máximo do ficheiro ou Registar-se
para
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Padrão de Pesquisa

NIST Sphere é o padrão governamental para troca de dados de fala — converter de AV1 produz áudio pronto para pesquisa.

Configurações de Corpus

Configure taxa de amostragem e codificação para corresponder aos requisitos exatos do seu corpus de avaliação ou treinamento de fala.

Conversão Segura

Uploads AV1 são apagados logo após o processamento, e saídas NIST são excluídas em até 24 horas.

Como converter AV1 para NIST

1

Selecione os arquivos do seu computador, Google Drive, Dropbox ou adicione um URL. Você também pode simplesmente arrastá-lo para esta página.

2

Escolha nist ou qualquer outro formato de saída desejado (mais de 200 formatos compatíveis)

3

Espere o arquivo ser convertido e você poderá, então, baixar o seu arquivo nist

Sobre os formatos

AV1 (AOMedia Vídeo 1) é um formato de codificação de vídeo aberto é livre de royalties desenvolvido pela Alliance for Open Média, um consorcio cujos membros fundadores incluem Google, Mozilla, Microsoft, Amazon, Netflix é Intel, entre outros. A especificação foi finalizada em junho de 2018 com o objetivo de fornecer um codec de vídeo de próxima geração que supere a eficiência de compressão do H.264 e HEVC, permanecendo livre de taxas de licenciamento. O AV1 alcança aproximadamente 30-50% melhor compressão que o HEVC em qualidade visual equivalente, tornando-o particularmente atraente para plataformas de streaming que buscam reduzir custos de largura de banda sem sacrificar a experiência do espectador. O codec suporta uma ampla gama de recursos incluindo síntese de grao de filme, divisao flexível em blocos para processamento paralelo, comutacao adaptativa de resolução por conteúdo é um rico conjunto de modos de predicao intra é inter. O suporte a decodificação por hardware se expandiu rapidamente em processadores móveis, GPUs é smart TVs, abordando preocupações iniciais sobre demandas computacionais durante a codificação. O AV1 têm sido amplamente adotado pelos principais serviços de streaming para entrega de conteúdo 4K e HDR, e serve como o componente de vídeo do container WebM para reprodução baseada na web. O status livre de royalties torna o AV1 especialmente importante para padrões web abertos é distribuição acessível de mídia.
Desenvolvedor: Alliance for Open Media
Lançamento inicial: 25 de junho de 2018
NIST SPHERE (SPeech HEader REsources) é um formato de arquivo de áudio especializado criado pelo National Institute of Standards and Technology para pesquisa em fala, particularmente projetos financiados pela DARPA. O formato envolve amostras de áudio brutas com um cabecalho ASCII estruturado codificando metadados como taxa de amostragem, contagem de canais, tipo de codificação, dados demograficos do falante é anotações de transcrição — tornando-o ideal para distribuição de corpora de fala. Os arquivos NIST normalmente armazenam PCM sem compressão ou áudio mu-law em taxas de amostragem de qualidade telefônica (8 kHz ou 16 kHz), embora o container seja flexível o suficiente para conter várias codificacoes. Uma vantagem chave é o cabecalho rico é autodescritivo que permite que pesquisadores incorporem metadados detalhados de corpus diretamente no arquivo, eliminando arquivos auxiliares. O SPHERE também se tornou o padrão de facto para grandes bancos de dados de fala como TIMIT, Switchboard é o corpus Fisher, garantindo amplo reconhecimento em laboratorios acadêmicos é governamentais. A especificação aberta é a disponibilidade de ferramentas de linha de comando (sphere, h_strip, w_decode) tornam simples converter, inspecionar é processar esses arquivos programaticamente em pipelines de processamento de fala.
Lançamento inicial: 1990

Perguntas Frequentes

Por que converter AV1 para NIST?

NIST Sphere é o formato padrão de intercâmbio para dados de pesquisa de fala — usado por programas governamentais e acadêmicos de avaliação de fala.

O que abre arquivos NIST?

Ferramentas de fala NIST, SoX, Kaldi e HTK lidam com áudio NIST Sphere para fins de pesquisa e avaliação.

Como NIST difere de SPH?

NIST e SPH referem-se ao mesmo formato NIST Sphere — diferentes extensões de arquivo para especificações de contêiner de áudio idênticas.

Que configurações funcionam melhor?

Pesquisa de fala tipicamente requer 8 kHz ou 16 kHz, 16 bits mono — corresponda esses às especificações do seu corpus.

Meus dados são privados?

Uploads AV1 são excluídos imediatamente. Saídas NIST são removidas em até 24 horas.