Conversor de SPH para SPX
Converta seus arquivos sph para spx online e grátis
sph
spx
Definições
Automático
Define o bitrate de áudio geral para Speex. Projetado para codificação de fala humana, o Speex atinge a transparência em bitrates ultrabaixos, com um bitrate máximo de 44 kbps.
Automático (Sem alterações)
Define o número de canais de áudio. Essa configuração é muito útil ao reduzir canais (downmix), por exemplo, de 5.1 para estéreo.
Automático (Sem alterações)
Define a taxa de amostragem do áudio. Música com um espectro completo (20 Hz – 20 kHz) requer valores não inferiores a 44.1 kHz para atingir a transparência. Mais informações podem ser encontradas na wiki.
sph
SPH é a extensão de arquivo para áudio armazenado no formato NIST SPHERE (SPeech HEader REsources), um padrão criado pelo National Institute of Standards and Technology dos EUA por volta de 1990. Construído para pesquisa em fala, os arquivos SPH carregam um cabecalho ASCII de 1024 bytes repleto de metadados — identificadores de banco de dados, contagens de canais, taxas de amostragem, ordenacao de bytes é tipo de compressão — tornando cada gravação autodescritiva. O áudio subjacente é tipicamente PCM linear de 16 bits amostrado a 16 kHz, embora outras configurações sejam permitidas. Pesquisadores do NIST, DARPA é universidades em todo o mundo confiam no SPH para distribuir corpora de fala como TIMIT, Switchboard é às coleções LDC que sustentam os modernos sistemas de reconhecimento automático de fala. Uma vantagem chave é que o cabecalho legível por humanos permite que scripts analisem metadados de gravação sem decodificação binária. A padronizacao rigorosa do formato também elimina ambiguidade ao compartilhar conjuntos de dados entre instituições é plataformas. Como os arquivos SPH armazenam PCM sem compressão, eles preservam a fidelidade total do áudio — critico ao treinar modelos acusticos onde até pequenos artefatos podem distorcer os resultados.
leia mais
spx
Speex é um codec de áudio de código aberto desenvolvido especificamente para compressão de fala, criado por Jean-Marc Valin sob a Xiph.Org Foundation. Lancado pela primeira vez em outubro de 2002, ele têm como alvo voz sobre IP, conferencias é qualquer cenário onde a palavra falada precisa viajar de forma eficiente pela rede. Os arquivos SPX envolvem áudio codificado em Speex dentro de um container Ogg, combinando a otimizacao de fala do codec com às capacidades de streaming do Ogg. Três taxas de amostragem são suportadas — banda estreita a 8 kHz, banda larga a 16 kHz é banda ultra-larga a 32 kHz — juntamente com codificação de taxa de bits variável que se adapta em tempo real a complexidade da fala. Uma vantagem de destaque é sua natureza livre de patentes é licenciada sob BSD, que permitiu que desenvolvedores o incorporassem livremente em produtos comerciais é de código aberto. O Speex também inclui cancelamento de eco acustico, supressao de ruido é controle automático de ganho, recursos que codecs rivais normalmente delegam a bibliotecas externas. Embora seus criadores recomendem oficialmente o Opus) como sucessor desde 2012, o Speex permanece implantado em sistemas VoIP legados, gravações arquivadas é dispositivos embarcados onde seu decodificador leve ainda é valorizado.
leia mais
Como converter SPH para SPX
Selecione os arquivos do seu computador, Google Drive, Dropbox ou adicione um URL. Você também pode simplesmente arrastá-lo para esta página.
Escolha spx ou qualquer outro formato de saída desejado (mais de 200 formatos compatíveis)
Espere o arquivo ser convertido e você poderá, então, baixar o seu arquivo spx
Sobre os formatos
SPH é a extensão de arquivo para áudio armazenado no formato NIST SPHERE (SPeech HEader REsources), um padrão criado pelo National Institute of Standards and Technology dos EUA por volta de 1990. Construído para pesquisa em fala, os arquivos SPH carregam um cabecalho ASCII de 1024 bytes repleto de metadados — identificadores de banco de dados, contagens de canais, taxas de amostragem, ordenacao de bytes é tipo de compressão — tornando cada gravação autodescritiva. O áudio subjacente é tipicamente PCM linear de 16 bits amostrado a 16 kHz, embora outras configurações sejam permitidas. Pesquisadores do NIST, DARPA é universidades em todo o mundo confiam no SPH para distribuir corpora de fala como TIMIT, Switchboard é às coleções LDC que sustentam os modernos sistemas de reconhecimento automático de fala. Uma vantagem chave é que o cabecalho legível por humanos permite que scripts analisem metadados de gravação sem decodificação binária. A padronizacao rigorosa do formato também elimina ambiguidade ao compartilhar conjuntos de dados entre instituições é plataformas. Como os arquivos SPH armazenam PCM sem compressão, eles preservam a fidelidade total do áudio — critico ao treinar modelos acusticos onde até pequenos artefatos podem distorcer os resultados.
Speex é um codec de áudio de código aberto desenvolvido especificamente para compressão de fala, criado por Jean-Marc Valin sob a Xiph.Org Foundation. Lancado pela primeira vez em outubro de 2002, ele têm como alvo voz sobre IP, conferencias é qualquer cenário onde a palavra falada precisa viajar de forma eficiente pela rede. Os arquivos SPX envolvem áudio codificado em Speex dentro de um container Ogg, combinando a otimizacao de fala do codec com às capacidades de streaming do Ogg. Três taxas de amostragem são suportadas — banda estreita a 8 kHz, banda larga a 16 kHz é banda ultra-larga a 32 kHz — juntamente com codificação de taxa de bits variável que se adapta em tempo real a complexidade da fala. Uma vantagem de destaque é sua natureza livre de patentes é licenciada sob BSD, que permitiu que desenvolvedores o incorporassem livremente em produtos comerciais é de código aberto. O Speex também inclui cancelamento de eco acustico, supressao de ruido é controle automático de ganho, recursos que codecs rivais normalmente delegam a bibliotecas externas. Embora seus criadores recomendem oficialmente o Opus) como sucessor desde 2012, o Speex permanece implantado em sistemas VoIP legados, gravações arquivadas é dispositivos embarcados onde seu decodificador leve ainda é valorizado.