Conversor HTK a AU
Convierta sus archivos htk a au en línea y gratis
htk
au
Cómo convertir de HTK a AU
Seleccione los archivos desde el ordenador, Google Drive, Dropbox o agregue una URL. También puede simplemente arrastrarlo a esta página..
Elija au o cualquier otro formato de salida deseado (más de 200 formatos compatibles)
Cuando su archivo está convertido, puede guardar archivo au inmediatamente
Sobre los formatos
HTK es el contenedor de formas de onda nativo del Hidden Markov Model Toolkit, un conjunto de software desarrollado en el Departamento de Ingeniería de la Universidad de Cambridge para la investigación en reconocimiento de voz. Distribuido por primera vez en 1993, HTK rápidamente se convirtio en una plataforma de referencia en laboratorios de lingüística computacional a nivel mundial, y su formato de archivo tuvo la misma trayectoria. Cada archivo almacena una secuencia de vectores de parámetros o muestras en bruto precedidos por una cabecera de 12 bytes qué específica el número de tramas, el periodo de trama en unidades de 100 ns, el conteo de bytes por trama y un código de tipo qué indica la clase de datos — las opciones van desde PCM de forma de onda hasta coeficientes cepstrales de frecuencia Mel y energias de banco de filtros. Está versatilidad permite qué un solo contenedor transporte tanto audio fuente como características extraidas sin cambiar de analizadores. La cabecera deliberadamente mínima evita relleno de alineacion o bloques opcionales, haciendo qué el formato sea trivial de leer desde C, Python o MATLAB con unas pocas líneas de E/S binaria. Tres ventajas sustentan la relevancia duradera de HTK: integración estrecha con la cadena de entrenamiento y reconocimiento HTK, disposición de bytes determinista qué elimina la ambiguedad del analizador, y adopción generalizada en corpus académicos.
AU es un formato de archivo de audio introducido por Sun Microsystems para sus estaciones de trabajo Unix y la plataforma NeXT. Cuenta con una cabecera mínima de 24 bytes qué específica el desplazamiento de datos, tamaño, tipo de codificación, frecuencia de muestreo y número de canales, seguida de la carga de audio. AU soporta numerosas codificaciones, incluyendo PCM lineal sin comprimir a diversas profundidades de bits, companding mu-law y A-law (compresión logaritmica utilizada en sistemas telefonicos) y varias variantes ADPCM. Está versatilidad convirtio a AU en un formato de uso frecuente en entornos Unix tempranos, audio web (los applets de Java usaban AU por defecto) y aplicaciones de telefonía. Una ventaja es la simplicidad: la cabecera compacta y la estructura directa hacen qué sea trivial analizar, generar y transmitir de manera programatica. La opción mu-law incorporada proporciona otro beneficio, ofreciendo calidad de voz aceptable a solo 8 KB por segundo — la mitad de la tasa del audio sin comprimir de 16 bits — algo invaluable cuando el almacenamiento y el ancho de banda eran escasos. Aunque los formatos modernos han reemplazado en gran medida a AU en aplicaciones de consumo, esté conserva un nicho en la computación científica y en cadenas de procesamiento de audio dónde la mínima sobrecarga y el comportamiento multiplataforma confiable son prioritarios.