Conversor de MPEG para NIST

Crie áudio NIST SPHERE a partir de arquivos de vídeo MPEG online

Solte os arquivos aqui. 1 GB tamanho máximo do ficheiro ou Registar-se
para
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Conforme com Padrões

A saída NIST SPHERE segue especificações do National Institute of Standards and Technology — compatível com todos os principais frameworks de pesquisa ASR.

MPEG para NIST Direto

Vá de vídeo MPEG para áudio de fala NIST em um passo. Sem extração manual de áudio ou conversão de formato intermediário necessária.

No Navegador

Sem toolkit SPHERE ou decodificadores MPEG necessários localmente. Converta MPEG para NIST pelo seu navegador web em qualquer dispositivo ou plataforma.

Como converter MPEG para NIST

1

Selecione os arquivos do seu computador, Google Drive, Dropbox ou adicione um URL. Você também pode simplesmente arrastá-lo para esta página.

2

Escolha nist ou qualquer outro formato de saída desejado (mais de 200 formatos compatíveis)

3

Espere o arquivo ser convertido e você poderá, então, baixar o seu arquivo nist

Sobre os formatos

MPEG (MPEG-1) é um padrão fundamental de compressão de vídeo é áudio publicado em agosto de 1993 pelo Moving Picture Experts Group como ISO/IEC 11172. Foi o primeiro padrão internacional para compressão com perdas de imagens em movimento é áudio associado, estabelecendo principios é técnicas que influenciariam virtualmente todos os codecs de vídeo subsequentes. O vídeo MPEG-1 alcança compressão por meio de uma combinação de predicao compensada por movimento, codificação de transformada discreta de cosseno é codificação de entropia de comprimento variável, organizado em três tipos de quadros: I-frames (intra-codificados), P-frames (preditos) é B-frames (preditos bidirecionalmente). O padrão têm como alvo taxas de bits em torno de 1,5 Mbps para áudio é vídeo combinados, produzindo qualidade comparável a fita VHS em resolução SIF (352x240 para NTSC). Esse nível de compressão foi especificamente escolhido para corresponder a taxa de transferência de dados de unidades de CD-ROM de velocidade 1x, possibilitando o formato Vídeo CD que levou vídeo digital aos consumidores no início dos anos 1990. O componente de áudio, particularmente a Layer III (MP3), tornou-se o formato de áudio mais influente da história. A estrutura de quadros I/P/B, a abordagem de estimativa de movimento é a codificação de transformada baseada em blocos estabeleceram o modelo arquitetural seguido por todos os principais codecs de vídeo desde então, do MPEG-2 ao H.264 é além. Embora há muito superado em eficiência de compressão, o MPEG-1 permanece suportado por virtualmente todos os softwares de mídia.
Lançamento inicial: Agosto 1993
NIST SPHERE (SPeech HEader REsources) é um formato de arquivo de áudio especializado criado pelo National Institute of Standards and Technology para pesquisa em fala, particularmente projetos financiados pela DARPA. O formato envolve amostras de áudio brutas com um cabecalho ASCII estruturado codificando metadados como taxa de amostragem, contagem de canais, tipo de codificação, dados demograficos do falante é anotações de transcrição — tornando-o ideal para distribuição de corpora de fala. Os arquivos NIST normalmente armazenam PCM sem compressão ou áudio mu-law em taxas de amostragem de qualidade telefônica (8 kHz ou 16 kHz), embora o container seja flexível o suficiente para conter várias codificacoes. Uma vantagem chave é o cabecalho rico é autodescritivo que permite que pesquisadores incorporem metadados detalhados de corpus diretamente no arquivo, eliminando arquivos auxiliares. O SPHERE também se tornou o padrão de facto para grandes bancos de dados de fala como TIMIT, Switchboard é o corpus Fisher, garantindo amplo reconhecimento em laboratorios acadêmicos é governamentais. A especificação aberta é a disponibilidade de ferramentas de linha de comando (sphere, h_strip, w_decode) tornam simples converter, inspecionar é processar esses arquivos programaticamente em pipelines de processamento de fala.
Lançamento inicial: 1990

Perguntas Frequentes

Por que converter MPEG para NIST?

NIST SPHERE é o formato de referência para distribuição de dados de fala. Diálogos de vídeo MPEG tornam-se áudio padronizado para pesquisa de reconhecimento.

Qual a diferença entre NIST e SPH?

São o mesmo formato — SPHERE do National Institute of Standards and Technology. NIST e SPH são extensões intercambiáveis.

NIST suporta qualidade MPEG?

NIST armazena PCM sem compressão. Áudio extraído de MPEG é preservado em qualidade total, independente da codificação MPEG original.

Quais ferramentas ASR aceitam NIST?

Kaldi, HTK, frameworks de avaliação NIST e a maioria dos laboratórios acadêmicos de fala trabalham com áudio NIST SPHERE como formato de entrada padrão.

Processamento em lote está disponível?

Sim — envie múltiplos vídeos MPEG e converta-os todos para NIST de uma vez. Prático para construção de corpus a partir de arquivos de vídeo.