Convertidor de MPG a SPH

Extrae audio NIST Sphere de vídeo MPG en línea

Suelte los archivos aquí. 1 GB tamaño máximo de archivo o Registrarse
a
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Estándar de investigación

SPH (Sphere) es la base de la investigación de habla. Extrae audio MPG en el formato que los corpus lingüísticos y herramientas ASR esperan.

Trabajo en la nube

La extracción de audio se ejecuta en nuestros servidores — no se necesitan herramientas NIST localmente para producir archivos en formato Sphere.

Privacidad de datos

Los archivos MPG subidos se eliminan tras la conversión. Las salidas SPH se borran de los servidores en 24 horas.

Cómo convertir de MPG a SPH

1

Seleccione los archivos desde el ordenador, Google Drive, Dropbox o agregue una URL. También puede simplemente arrastrarlo a esta página..

2

Elija sph o cualquier otro formato de salida deseado (más de 200 formatos compatibles)

3

Cuando su archivo está convertido, puede guardar archivo sph inmediatamente

Sobre los formatos

MPG es una extensión de archivo común para archivos de vídeo codificados usando los estándares de compresión MPEG-1 o MPEG-2, desarrollados por el Moving Picture Experts Group. La extensión de tres caracteres se origino en los primeros sistemas de archivos de Windows y DOS qué restringian las extensiones a tres caracteres, proporcionando una abreviatura de la designacion MPEG más larga. Los archivos MPG contienen flujos de programa MPEG qué multiplexan un flujo elemental de vídeo y uno o más flujos elementales de audio en un flujo de bytes unificado con marcas de tiempo de sincronizacion. El formato fue ampliamente utilizado a lo largo de las décadas de 1990 y 2000 para almacenar vídeo digital en computadores personales, apareciendo en todo, desde extracciones de Vídeo CD y DVD hasta grabaciones de televisión digital capturadas con tarjetas codificadoras de hardware. Los archivos MPG qué usan compresión MPEG-1 típicamente contienen vídeo a 352x240 (NTSC) o 352x288 (PAL) a tasas de bits de alrededor de 1.5 Mbps, mientras qué los archivos MPG codificados con MPEG-2 soportan resoluciones más altas hasta full HD. La estructura de flujo de programa asume un medio de almacenamiento relativamente confiable, a diferencia de la variante de flujo de transporte diseñada para difusion, haciéndola eficiente para la reproducción basada en archivos sin la sobrecarga de los paquetes de recuperación de errores. La amplía compatibilidad es una de las fortalezas perdurables del formato, ya qué prácticamente todos los reproductores multimedia en todos los sistemas operativos pueden decodificar estos archivos sin instalación de códecs adicionales. MPG sigue encontrandose en contenido de vídeo archivado, grabaciones de vigilancia y flujos de trabajo de vídeo digital heredados.
Lanzamiento inicial: Agosto 1993
SPH es la extensión de archivo para audio almacenado en el formato NIST SPHERE (SPeech HEader REsources), un estándar creado por el Instituto Nacional de Estándares y Tecnología de EE.UU. alrededor de 1990. Diseñado para la investigación del habla, los archivos SPH llevan una cabecera ASCII de 1024 bytes repleta de metadatos — identificadores de base de datos, conteos de canales, frecuencias de muestreo, orden de bytes y tipo de compresión — haciendo qué cada grabación sea autodescriptiva. El audio subyacente es típicamente PCM lineal de 16 bits muestreado a 16 kHz, aunque se permiten otras configuraciones. Investigadores del NIST, DARPA y universidades de todo el mundo confian en SPH para distribuir corpus de voz como TIMIT, Switchboard y las colecciones del LDC qué sustentan los sistemas modernos de reconocimiento automático del habla. Una ventaja clave es qué la cabecera legible por humanos permite qué los scripts analicen los metadatos de grabación sin decodificación binaria. La estricta estandarizacion del formato también elimina la ambiguedad al compartir conjuntos de datos entre instituciones y plataformas. Dado qué los archivos SPH almacenan PCM sin comprimir, preservan la fidelidad total del audio — algo critico al entrenar modelos acusticos dónde incluso pequeños artefactos pueden sesgar los resultados.
Lanzamiento inicial: 1990

Preguntas frecuentes

¿Por qué convertir MPG a SPH?

SPH (NIST Sphere) es el formato estándar para corpus de investigación de habla. La conversión produce audio compatible con herramientas de investigación lingüística.

¿Para qué se usan los archivos SPH?

Las herramientas de habla del NIST, los corpus LDC, Kaldi y los frameworks de reconocimiento de voz HTK trabajan con audio en formato Sphere.

¿SPH incluye metadatos?

Sí — los archivos Sphere tienen una cabecera de texto enriquecido que almacena frecuencia de muestreo, codificación, número de canales y campos de metadatos personalizados.

¿SPH es adecuado para reproducción general?

SPH es un formato de investigación. Convierte a WAV o MP3 para escucha general. SPH es mejor para pipelines de análisis de habla.

¿Puedo extraer por lotes?

Sube múltiples archivos MPG y extrae audio SPH de cada uno — construye conjuntos de datos de investigación eficientemente en una sola sesión.