Convertidor de AV1 a SPH

Extrae audio NIST Sphere de vídeo AV1 en línea

Suelte los archivos aquí. 1 GB tamaño máximo de archivo o Registrarse
a
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Estándar de investigación de voz

SPH es el formato para corpus principales de voz — convertir desde AV1 prepara audio para investigación lingüística y análisis.

Compatible con corpus

Los archivos SPH se integran con herramientas estándar de investigación de voz como Kaldi, HTK y utilidades de evaluación NIST.

Archivos privados

Los archivos AV1 se eliminan justo después de la conversión, y las salidas SPH se borran en 24 horas.

Cómo convertir de AV1 a SPH

1

Seleccione los archivos desde el ordenador, Google Drive, Dropbox o agregue una URL. También puede simplemente arrastrarlo a esta página..

2

Elija sph o cualquier otro formato de salida deseado (más de 200 formatos compatibles)

3

Cuando su archivo está convertido, puede guardar archivo sph inmediatamente

Sobre los formatos

AV1 (AOMedia Vídeo 1) es un formato de codificación de vídeo abierto y libre de regalías desarrollado por la Alliance for Open Media, un consorcio cuyos miembros fundadores incluyen a Google, Mozilla, Microsoft, Amazon, Netflix e Intel, entre otros. La especificación se finalizo en junio de 2018 con el objetivo de proporcionar un códec de vídeo de proxima generación qué supere la eficiencia de compresión de H.264 y HEVC manteniendose libre de tarifas de licencia. AV1 logra aproximadamente un 30-50% mejor compresión qué HEVC a calidad visual equivalente, haciéndolo particularmente atractivo para plataformas de streaming qué buscan reducir costos de ancho de banda sin sacrificar la experiencia del espectador. El códec soporta una amplía gama de características incluyendo sintesis de grano de película, mosaico flexible para procesamiento paralelo, cambio de resolución adaptativo al contenido y un rico conjunto de modos de prediccion intra e inter. El soporte de decodificación por hardware se ha expandido rápidamente en procesadores móviles, GPUs y televisores inteligentes, abordando las preocupaciones iniciales sobre la demanda computacional durante la codificación. AV1 ha visto una amplía adopción por parte de los principales servicios de streaming para entregar contenido 4K y HDR, y sirve como componente de vídeo del contenedor WebM para reproducción basada en web. Su estatus libre de regalías hace qué AV1 sea especialmente importante para los estándares web abiertos y la distribución accesible de medios.
Desarrollador: Alliance for Open Media
Lanzamiento inicial: 25 de junio de 2018
SPH es la extensión de archivo para audio almacenado en el formato NIST SPHERE (SPeech HEader REsources), un estándar creado por el Instituto Nacional de Estándares y Tecnología de EE.UU. alrededor de 1990. Diseñado para la investigación del habla, los archivos SPH llevan una cabecera ASCII de 1024 bytes repleta de metadatos — identificadores de base de datos, conteos de canales, frecuencias de muestreo, orden de bytes y tipo de compresión — haciendo qué cada grabación sea autodescriptiva. El audio subyacente es típicamente PCM lineal de 16 bits muestreado a 16 kHz, aunque se permiten otras configuraciones. Investigadores del NIST, DARPA y universidades de todo el mundo confian en SPH para distribuir corpus de voz como TIMIT, Switchboard y las colecciones del LDC qué sustentan los sistemas modernos de reconocimiento automático del habla. Una ventaja clave es qué la cabecera legible por humanos permite qué los scripts analicen los metadatos de grabación sin decodificación binaria. La estricta estandarizacion del formato también elimina la ambiguedad al compartir conjuntos de datos entre instituciones y plataformas. Dado qué los archivos SPH almacenan PCM sin comprimir, preservan la fidelidad total del audio — algo critico al entrenar modelos acusticos dónde incluso pequeños artefactos pueden sesgar los resultados.
Lanzamiento inicial: 1990

Preguntas frecuentes

¿Por qué convertir AV1 a SPH?

SPH (NIST Sphere) es el formato estándar para corpus de investigación de voz — usado por datasets lingüísticos como TIMIT y Switchboard.

¿Qué abre archivos SPH?

Herramientas NIST Sphere, Kaldi, HTK y SoX manejan archivos SPH. Es estándar en investigación académica de voz y lenguaje.

¿SPH es lo mismo que NIST?

SPH usa el formato de cabecera NIST Sphere — los términos se usan frecuentemente de forma intercambiable en contextos de investigación de voz.

¿Qué tasa de muestreo es típica?

La mayoría de corpus de voz usan 8 kHz o 16 kHz mono — tasas estándar para datos de telefonía y reconocimiento de voz.

¿La conversión es segura?

Los archivos AV1 se eliminan inmediatamente. Las salidas SPH se borran en 24 horas.