Convertidor de MPEG a SPH

Extrae audio MPEG como formato de voz NIST SPHERE en línea

Seleccione los archivos

Suelte los archivos aquí. 1 GB tamaño máximo de archivo o Registrarse

Vídeo a corpus de voz

Extrae diálogo de vídeo MPEG y empaquétalo como NIST SPHERE — saltando la extracción manual al construir conjuntos de datos de investigación de voz.

Estándar NIST

La salida SPH cumple exactamente con las especificaciones NIST SPHERE. Importa directamente en Kaldi, HTK o cualquier framework de reconocimiento de voz.

Manejo seguro

Los archivos MPEG subidos se eliminan tras la conversión. Los archivos de salida SPH se borran en 24 horas — tus materiales de investigación permanecen confidenciales.

Cómo convertir de MPEG a SPH

Seleccione los archivos desde el ordenador, Google Drive, Dropbox o agregue una URL. También puede simplemente arrastrarlo a esta página..

Elija sph o cualquier otro formato de salida deseado (más de 200 formatos compatibles)

Cuando su archivo está convertido, puede guardar archivo sph inmediatamente

Sobre los formatos

MPEG (MPEG-1) es un estándar de compresión de vídeo y audio fundacional publicado en agosto de 1993 por el Moving Picture Experts Group como ISO/IEC 11172. Fue el primer estándar internacional para la compresión con pérdida de imágenes en movimiento y audio asociado, estableciendo principios y técnicas qué influirian prácticamente en todos los códecs de vídeo posteriores. El vídeo MPEG-1 logra la compresión mediante una combinación de prediccion compensada por movimiento, codificación de transformada de coseno discreta y codificación de entropia de longitud variable, organizados en tres tipos de cuadros: cuadros I (intra-codificados), cuadros P (predichos) y cuadros B (predichos bidireccionalmente). El estándar apunta a tasas de bits de alrededor de 1.5 Mbps para audio y vídeo combinados, produciendo una calidad comparable a la cinta VHS a resolución SIF (352x240 para NTSC). Esté nivel de compresión fue elegido específicamente para coincidir con el rendimiento de datos de las unidades CD-ROM a velocidad 1x, habilitando el formato Vídeo CD qué llevó el vídeo digital a los consumidores a principios de los años 90. El componente de audio, particularmente Layer III (MP3), se convirtio en el formato de audio más influyente de la historia. La estructura de cuadros I/P/B, el enfoque de estimacion de movimiento y la codificación de transformada basada en bloques establecieron la plantilla arquitectonica seguida por cada códec de vídeo importante desde entonces, desde MPEG-2 hasta H.264 y más allá. Aunque superado hace tiempo en eficiencia de compresión, MPEG-1 sigue siendo soportado por prácticamente todo el software de medios.

Desarrollador: Moving Picture Experts Group

Lanzamiento inicial: Agosto 1993

SPH es la extensión de archivo para audio almacenado en el formato NIST SPHERE (SPeech HEader REsources), un estándar creado por el Instituto Nacional de Estándares y Tecnología de EE.UU. alrededor de 1990. Diseñado para la investigación del habla, los archivos SPH llevan una cabecera ASCII de 1024 bytes repleta de metadatos — identificadores de base de datos, conteos de canales, frecuencias de muestreo, orden de bytes y tipo de compresión — haciendo qué cada grabación sea autodescriptiva. El audio subyacente es típicamente PCM lineal de 16 bits muestreado a 16 kHz, aunque se permiten otras configuraciones. Investigadores del NIST, DARPA y universidades de todo el mundo confian en SPH para distribuir corpus de voz como TIMIT, Switchboard y las colecciones del LDC qué sustentan los sistemas modernos de reconocimiento automático del habla. Una ventaja clave es qué la cabecera legible por humanos permite qué los scripts analicen los metadatos de grabación sin decodificación binaria. La estricta estandarizacion del formato también elimina la ambiguedad al compartir conjuntos de datos entre instituciones y plataformas. Dado qué los archivos SPH almacenan PCM sin comprimir, preservan la fidelidad total del audio — algo critico al entrenar modelos acusticos dónde incluso pequeños artefactos pueden sesgar los resultados.

Desarrollador: National Institute of Standards and Technology

Lanzamiento inicial: 1990

Preguntas frecuentes

¿Por qué convertir MPEG a SPH?

SPH es el estándar NIST SPHERE para investigación de voz. El diálogo de vídeo MPEG se convierte en datos correctamente formateados para entrenamiento y evaluación ASR.

¿Qué herramientas manejan SPH?

Kaldi, HTK, Praat y el toolkit NIST SPHERE soportan SPH nativamente. Es el formato de intercambio estándar para investigación de audio de voz.

¿Comprime SPH el audio?

No — SPH almacena datos PCM sin compresión con pérdidas. El audio MPEG llega al formato SPHERE a calidad completa para procesamiento preciso de voz.

¿Es el audio MPEG-1 suficiente?

El audio MPEG-1 proporciona calidad adecuada para investigación de voz. El contenido de diálogo se preserva bien a través del proceso de extracción y codificación SPH.

¿Puedo convertir muchos archivos MPEG?

Sube múltiples vídeos MPEG y convierte por lotes a SPH. Eficiente para construir corpus de voz a partir de colecciones de vídeo MPEG archivadas.

Conversiones relacionadas

MPEG a MP3

MPEG a WAV

MPEG a MP4

MPEG a OGG

MPEG a M4A

MPEG a WMA

MPEG a GIF

MPEG a AAC

MPEG a FLAC

MPEG a AVI

MPEG a M4R

MPEG a AIFF

MPEG a MJPEG

MPEG a MOV

MPEG a WMV

MPEG a AMR

MPEG a OPUS

MPEG a DIVX

MPEG a GSM

MPEG a 3GP

MPEG a AV1

MPEG a AC3

MPEG a MP2

MPEG a WEBM

MPEG a FLV

MPEG a VOB

MPEG a CDDA

MPEG a AU

MPEG a M4V

MPEG a XVID

MPEG a MKV

MPEG a DTS

MPEG a TS

MPEG a AVCHD

MPEG a W64

MPEG a HEVC

MPEG a OGV

MPEG a SWF

MPEG a M2V

MPEG a SLN

MPEG a F4V

MPEG a ASF

MPEG a VOX

MPEG a WV

MPEG a SPX

MPEG a 8SVX

MPEG a CAF

MPEG a 3G2

MPEG a RMVB

MPEG a VOC

MPEG a MTS

MPEG a CVS

MPEG a OGA

MPEG a SD2

MPEG a RA

MPEG a WVE

MPEG a AMB

MPEG a AVR

MPEG a MXF

MPEG a GSRT

Conversores específicos

MP3 a SPH

WAV a SPH

MP4 a SPH

ASF a SPH

FLAC a SPH

M4A a SPH

OGG a SPH

SWF a SPH

WVE a SPH

3G2 a SPH

3GP a SPH

AAF a SPH

AV1 a SPH

AVCHD a SPH

AVI a SPH

CAVS a SPH

DIVX a SPH

DV a SPH

F4V a SPH

FLV a SPH

HEVC a SPH

M2TS a SPH

M2V a SPH

M4V a SPH

MJPEG a SPH

MKV a SPH

MOD a SPH

MOV a SPH

MPEG a SPH

MPEG-2 a SPH