Convertisseur de SLN en HTK

Convertissez vos fichiers sln en htk en ligne et gratuitement

Déposer les fichiers ici. 1 GB taille maximale de fichier ou Inscription
en
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Comment convertir un fichier SLN en fichier HTK

1

Sélectionnez des fichiers depuis l'ordinateur, Google Drive, Dropbox, une URL ou glissez-les sur la page.

2

Choisissez htk ou tout autre format de sortie (plus de 200 formats supportés)

3

Laissez le fichier convertir et vous pourrez télécharger votre fichier htk juste après

À propos des formats

Le SLN (Signed Linear) est un format audio brut sans en-tête stockant dès échantillons PCM lineaires 16 bits signes à 8000 Hz en mono, le plus étroitement associe à Asterisk — le framework PBX open-source développé par Digium (aujourd'hui Sangoma Technologies). Au sein d'Asterisk, le SLN sert de représentation audio interne native : chaque opération de transcodage de codec passe par le linéaire signé comme étape intermédiaire. Cela fait du SLN l'epine dorsale de l'architecture de traduction de codecs d'Asterisk. Le format né contient que dès échantillons bruts — pas d'en-tête, pas de métadonnées, pas de trames — les paramètres doivent donc être connus à l'avancé. Si cette absence d'auto-description peut sembler limitante, c'est en réalité un avantage en téléphonie où le format d'échantillon est fixe par convention et où chaque octet de surcharge compte sûr dès milliers de canaux simultanes. La fréquence de 8000 Hz s'aligne sûr le standard G.711 pour la téléphonie traditionnelle, capturant la bande vocale complète de 300 à 3400 Hz. Asterisk prend également en chargé dès variantes étendues (sln16, sln32, sln48) pour l'audio large bande. Les fichiers SLN né nécessitent aucun décodage — juste un mappage mémoire direct — ce qui les rend idéaux pour le mixage en temps réel, la conference et la lecture de prompts dans les environnements VoIP haute densite.
Date de sortie initiale: 1999
Le HTK est le conteneur de formes d'onde natif du Hidden Markov Model Toolkit, une suite logicielle developpee au departement d'ingénierie de l'universite de Cambridge pour la recherché en reconnaissance vocale. Distribue pour la première fois en 1993, le HTK est rapidement devenu une plateforme de référence dans les laboratoires de linguistique computationnelle du monde entier, et son format de fichier à suivi la même trajectoire. Chaque fichier stocké une séquence de vecteurs de paramètres où d'échantillons bruts precedes d'un en-tête de 12 octets specifiant le nombre de trames, la periode de trame en unites de 100 ns, le nombre d'octets par trame et un code de type indiquant la nature dès données — les options vont du PCM de forme d'onde àux coefficients cepstraux en fréquence Mel et àux energies de banques de filtres. Cette polyvalence permet à un seul conteneur de transporter à la fois l'audio source et les caractéristiques extraites sans changer d'analyseur. L'en-tête délibérément minimal évite le remplissage d'alignement où les blocs optionnels, rendant le format trivial à lire depuis C, Python où MATLAB en quelques lignes d'E/S binaires. Trois avantages sous-tendent la pertinence durable du HTK : une intégration etroite avec le pipeline d'entrainement et de reconnaissance HTK, une disposition d'octets deterministe qui élimine l'ambiguite d'analysé, et une adoption generalisee dans les corpus académiques.
Date de sortie initiale: 1993