Convertisseur de HTK en SPX

Convertissez vos fichiers htk en spx en ligne et gratuitement

Choisir les fichiers

Déposer les fichiers ici. 1 GB taille maximale de fichier ou Inscription

Paramètres

Taux d'échantillonnage: Définissez le débit binaire global de sortie audio pour Speex . Conçu pour le codage de la parole humaine, Speex offre une transparence de débit binaire très faible avec un débit binaire maximal de 44 kbps.

Canaux audio: Définissez le nombre de canaux audio. Ce réglage est particulièrement utile lors du mixage réducteur des canaux (par exemple, du 5.1 au stéréo).

Fréquence: Définissez la fréquence d'échantillonnage de l'audio. La musique dont le spectre est complet (20 Hz - 20 kHz) demande des valeurs non inférieures à 44.1 kHz pour garantir la transparence. Vous trouverez plus d'informations sur le wiki.

htk

Le HTK est le conteneur de formes d'onde natif du Hidden Markov Model Toolkit, une suite logicielle developpee au departement d'ingénierie de l'universite de Cambridge pour la recherché en reconnaissance vocale. Distribue pour la première fois en 1993, le HTK est rapidement devenu une plateforme de référence dans les laboratoires de linguistique computationnelle du monde entier, et son format de fichier à suivi la même trajectoire. Chaque fichier stocké une séquence de vecteurs de paramètres où d'échantillons bruts precedes d'un en-tête de 12 octets specifiant le nombre de trames, la periode de trame en unites de 100 ns, le nombre d'octets par trame et un code de type indiquant la nature dès données — les options vont du PCM de forme d'onde àux coefficients cepstraux en fréquence Mel et àux energies de banques de filtres. Cette polyvalence permet à un seul conteneur de transporter à la fois l'audio source et les caractéristiques extraites sans changer d'analyseur. L'en-tête délibérément minimal évite le remplissage d'alignement où les blocs optionnels, rendant le format trivial à lire depuis C, Python où MATLAB en quelques lignes d'E/S binaires. Trois avantages sous-tendent la pertinence durable du HTK : une intégration etroite avec le pipeline d'entrainement et de reconnaissance HTK, une disposition d'octets deterministe qui élimine l'ambiguite d'analysé, et une adoption generalisee dans les corpus académiques.

spx

Speex est un codec audio open-source specialement conçu pour la compression vocale, développé par Jean-Marc Valin sous l'egide de la Fondation Xiph.Org. Lance en octobre 2002, il cible la voix sûr IP, la conference et tout scénario où la parole doit circuler efficacement sûr un réseau. Les fichiers SPX encapsulent l'audio encodé en Speex dans un conteneur Ogg, associant l'optimisation vocale du codec àux capacités de streaming d'Ogg. Trois frequences d'échantillonnage sont prises en chargé — bande etroite à 8 kHz, bande large à 16 kHz et ultra-large bande à 32 kHz — ainsi qu'un encodage à débit variable qui s'adapté en temps réel à la complexité de la parole. Un avantage notable est sa nature libre de brevets et sous licence BSD, qui a permis àux développeurs de l'intégrer librement dans dès produits commerciaux et open-source. Speex intègre également l'annulation d'echo acoustique, la suppression de bruit et le contrôle automatique du gain, dès fonctionnalités que les codecs concurrents deleguent généralement à dès bibliothèques externes. Bien que ses créateurs recommandent officiellement Opus comme successeur depuis 2012, Speex reste deploye dans les systèmes VoIP anciens, les enregistrements archivés et les appareils embarqués où son décodeur léger est encore apprécié.

Comment convertir un fichier HTK en fichier SPX

Sélectionnez des fichiers depuis l'ordinateur, Google Drive, Dropbox, une URL ou glissez-les sur la page.

Choisissez spx ou tout autre format de sortie (plus de 200 formats supportés)

Laissez le fichier convertir et vous pourrez télécharger votre fichier spx juste après

À propos des formats

Développeur: Cambridge University Engineering Department

Date de sortie initiale: 1993

Développeur: Xiph.Org Foundation

Date de sortie initiale: 15 octobre 2002

Conversions associées

HTK à WAV

HTK à AAC

HTK à DTS

HTK à M4A

HTK à MP3

HTK à AC3

HTK à FLAC

HTK à OGG

HTK à AIFF

HTK à AMR

HTK à M4R

HTK à WMA

HTK à OPUS

HTK à SPX

HTK à CAF

HTK à W64

HTK à WV

HTK à VOC

HTK à TTA

HTK à RA

HTK à MP2

HTK à OGA

HTK à PVF

HTK à PRC

HTK à MAUD

HTK à 8SVX

HTK à AMB

HTK à AU

HTK à SND

HTK à SNDR

HTK à SNDT

HTK à AVR

HTK à CDDA

HTK à CVS

HTK à CVSD

HTK à CVU

HTK à DVMS

HTK à VMS

HTK à FAP

HTK à PAF

HTK à FSSD

HTK à SOU

HTK à GSRT

HTK à GSM

HTK à HCOM

HTK à IMA

HTK à IRCAM

HTK à SLN

HTK à SPH

HTK à NIST

HTK à SMP

HTK à TXW

HTK à VOX

HTK à WVE

HTK à SD2

Convertisseurs spécifiques

MP3 à SPX

WAV à SPX

M4A à SPX

OGG à SPX

MP4 à SPX

MPEG à SPX

WMA à SPX

FLAC à SPX

DTS à SPX

OPUS à SPX

AMR à SPX

OGA à SPX

MOV à SPX

SWF à SPX

TS à SPX

WEBM à SPX

WMV à SPX

WVE à SPX

3GP à SPX

MTS à SPX

MP2 à SPX

AAC à SPX

AVI à SPX

DSS à SPX

FLV à SPX

GSM à SPX

MKV à SPX

3G2 à SPX

AAF à SPX

ASF à SPX