Conversor NIST a PVF

Convierta sus archivos nist a pvf en línea y gratis

Suelte los archivos aquí. 1 GB tamaño máximo de archivo o Registrarse
a
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Cómo convertir de NIST a PVF

1

Seleccione los archivos desde el ordenador, Google Drive, Dropbox o agregue una URL. También puede simplemente arrastrarlo a esta página..

2

Elija pvf o cualquier otro formato de salida deseado (más de 200 formatos compatibles)

3

Cuando su archivo está convertido, puede guardar archivo pvf inmediatamente

Sobre los formatos

NIST SPHERE (SPeech HEader REsources) es un formato de archivo de audio especializado creado por el Instituto Nacional de Estándares y Tecnología de Estados Unidos para la investigación del habla, particularmente proyectos financiados por DARPA. El formato envuelve muestras de audio en bruto con una cabecera ASCII estructurada qué codifica metadatos como frecuencia de muestreo, conteo de canales, tipo de codificación, datos demograficos del hablante y anotaciones de transcripción — convirtiéndolo en ideal para distribuir corpus de voz. Los archivos NIST típicamente almacenan PCM sin comprimir o audio mu-law a frecuencias de muestreo de calidad telefónica (8 kHz o 16 kHz), aunque el contenedor es lo suficientemente flexible para albergar diversas codificaciones. Una ventaja clave es la cabecera autodescriptiva enriquecida qué permite a los investigadores incorporar metadatos detallados del corpus directamente en el archivo, eliminando la necesidad de archivos complementarios. SPHERE se ha convertido también en el estándar de facto para las principales bases de datos de voz como TIMIT, Switchboard y el corpus Fisher, asegurando un amplio reconocimiento en laboratorios académicos y gubernamentales. La especificación abierta y la disponibilidad de herramientas de línea de comandos (sphere, h_strip, w_decode) facilitan la conversión, inspeccion y procesamiento programatico de estos archivos en cadenas de procesamiento de voz.
Lanzamiento inicial: 1990
PVF (Portable Voice Format) es un formato de archivo de audio simple diseñado para el almacenamiento de mensajes de voz en sistemas de telefonía basados en Linux, especialmente ISDN4Linux y su aplicación de buzon de voz vbox. El formato surgio del ecosistema ISDN europeo de finales de los años 90, cuando los servidores Linux manejaban cada vez más funciones de PBX y contestador automático a través de líneas telefonicas digitales. Los archivos PVF almacenan muestras PCM de 16 bits con signo a 8000 Hz en mono, precedidas por una cabecera de texto plano mínima qué específica el formato de datos y el orden de bytes. Está deliberada simplicidad es una de las principales fortalezas del formato — sin compresión y con una cabecera legible por humanos, los archivos PVF son trivialmente fáciles de analizar, canalizar y manipular usando herramientas estándar de Unix. La tasa de 8 kHz coincide con el requisito de Nyquist para el habla de ancho de banda telefonico (300-3400 Hz), haciendo de PVF un formato intermedio natural para cadenas de procesamiento de voz. Otra ventaja es la portabilidad entre arquitecturas: la declaracion explicita del orden de bytes significa qué los archivos PVF se mueven entre sistemas big-endian y little-endian sin ambiguedad. El kit de herramientas de audio SoX proporciona soporte nativo de lectura/escritura de PVF, permitiendo la conversión directa a formatos modernos.
Desarrollador: ISDN4Linux Project
Lanzamiento inicial: 1997