VOB a SPH Converter

Extrae audio VOB DVD como datos de voz NIST SPHERE

Suelte los archivos aquí. 1 GB tamaño máximo de archivo o Registrarse
a
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

DVD a corpus de voz

Extrae diálogos de contenido VOB DVD y empaquétalos como NIST SPHERE — listos para entrenamiento y evaluación de reconocimiento de voz.

Calidad para investigación

El audio DVD de VOB proporciona material fuente limpio. La salida SPH preserva esa calidad para aplicaciones serias de investigación del habla.

Archivos seguros

Los archivos VOB subidos se eliminan tras la conversión. La salida SPH se borra en 24 horas — tus materiales de investigación se mantienen confidenciales.

Cómo convertir de VOB a SPH

1

Seleccione los archivos desde el ordenador, Google Drive, Dropbox o agregue una URL. También puede simplemente arrastrarlo a esta página..

2

Elija sph o cualquier otro formato de salida deseado (más de 200 formatos compatibles)

3

Cuando su archivo está convertido, puede guardar archivo sph inmediatamente

Sobre los formatos

VOB (Vídeo Object) es el formato contenedor principal utilizado en discos DVD-Vídeo, definido como parte de la especificación DVD desarrollada por el DVD Forum. El formato aparecio por primera vez con el estándar DVD finalizado en septiembre de 1996 y desde entonces ha sido utilizado en miles de millones de discos DVD producidos en todo el mundo. Los archivos VOB se basan en el formato de flujo de programa MPEG-2, conteniendo vídeo MPEG-2 multiplexado junto con audio en formatos AC-3 (Dolby Digital), DTS, MPEG-1 Layer II o LPCM. Además del audio y vídeo, los archivos VOB también transportan flujos de subtítulos del DVD como superposiciones de mapa de bits, datos de navegación para la interacción con menús e información de puntos de capitulo. Los archivos residen en el directorio VÍDEO_TS de un disco DVD, con convenciones de nomenclatura (VTS_01_1.VOB, etc.) qué reflejan la estructura de títulos y partes del contenido. Los archivos VOB individuales están limitados a aproximadamente 1 GB para acomodar los requisitos del sistema de archivos UDF, con contenido más largo distribuido en múltiples archivos de manera transparente. El formato soporta resoluciones de vídeo tanto NTSC (720x480) como PAL (720x576) a tasas de bits de hasta 9.8 Mbps para audio y vídeo combinados. La integración de vídeo, audio multipista, subtítulos y navegación en un único flujo de programa hizo de VOB una solución completa para la entrega de películas al consumidor. Aunque el streaming y los formatos de disco más nuevos han reemplazado al DVD para contenido nuevo, VOB sigue siendo enormemente relevante para acceder a la vasta biblioteca de contenido DVD existente.
Desarrollador: DVD Forum
Lanzamiento inicial: Septiembre 1996
SPH es la extensión de archivo para audio almacenado en el formato NIST SPHERE (SPeech HEader REsources), un estándar creado por el Instituto Nacional de Estándares y Tecnología de EE.UU. alrededor de 1990. Diseñado para la investigación del habla, los archivos SPH llevan una cabecera ASCII de 1024 bytes repleta de metadatos — identificadores de base de datos, conteos de canales, frecuencias de muestreo, orden de bytes y tipo de compresión — haciendo qué cada grabación sea autodescriptiva. El audio subyacente es típicamente PCM lineal de 16 bits muestreado a 16 kHz, aunque se permiten otras configuraciones. Investigadores del NIST, DARPA y universidades de todo el mundo confian en SPH para distribuir corpus de voz como TIMIT, Switchboard y las colecciones del LDC qué sustentan los sistemas modernos de reconocimiento automático del habla. Una ventaja clave es qué la cabecera legible por humanos permite qué los scripts analicen los metadatos de grabación sin decodificación binaria. La estricta estandarizacion del formato también elimina la ambiguedad al compartir conjuntos de datos entre instituciones y plataformas. Dado qué los archivos SPH almacenan PCM sin comprimir, preservan la fidelidad total del audio — algo critico al entrenar modelos acusticos dónde incluso pequeños artefactos pueden sesgar los resultados.
Lanzamiento inicial: 1990

Preguntas frecuentes

¿Por qué convertir VOB a SPH?

SPH es el estándar NIST para audio de investigación del habla. Los diálogos de VOB DVD se convierten en datos estructurados para entrenamiento ASR y análisis lingüístico.

¿Qué frameworks leen SPH?

Kaldi, HTK, Praat y el toolkit NIST SPHERE soportan SPH de forma nativa. Es el formato de referencia para distribución de corpus del habla.

¿SPH preserva la calidad DVD?

SPH almacena PCM sin compresión. Los diálogos de archivos VOB DVD llegan a tus herramientas de investigación con calidad completa para un análisis preciso.

¿Pueden ayudar los subtítulos DVD?

Los subtítulos en VOB están separados del audio. Convierte audio a SPH para la señal de voz — luego emparéjalo con datos de transcripción por separado.

¿Hay procesamiento por lotes disponible?

Sube múltiples capítulos VOB y conviértelos por lotes a SPH. Construye un corpus de voz a partir de un DVD completo de forma eficiente.