WMA'dan HTK'ya Dönüştürücü

WMA sesinden HTK konuşma işleme formatı oluşturun

Dosyaları buraya bırakın. 1 GB maksimum dosya boyutu veya Kaydol
için
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

ASR Eğitim Formatı

HTK, konuşma tanıma standardıdır — WMA kayıtlarını araştırma için dönüştürün.

Korpus İşleme

WMA veri kümelerinin tamamını yükleyip her dosya için HTK sesi üretin.

Çevrimiçi Dönüşüm

HTK araç takımına ihtiyaç yok — WMA'yı tarayıcınızda HTK'ya dönüştürün.

WMA'i HTK'ye dönüştürme yöntemi

1

Dosyaları bilgisayar, Google Drive, Dropbox, URL'den veya sayfa üzerinden sürükleyerek seçin.

2

htk ya da sonuç olarak ihtiyacınız olan diğer formatlardan birini seçin (200'den fazla format desteklenir)

3

Haydi dosyayı dönüştürün ve htk dosyanızı hemen sonra indirebilirsiniz

Formatlar hakkında

WMA (Windows Media Audio), Microsoft tarafından geliştirilen ve i̇lk olarak 1999'da Windows Media çerçevesinin bir parçası olarak yayınlanan tescilli ses kodekleri ailesidir. MP3 ve AAC ile rekabet etmek için oluşturulan WMA Standard, Microsoft'un 64 kbps gibi düşük bit hızlarında CD'ye yakın kalite sunduğunu iddia ettiği algısal kodlama kullanır — MP3'ün karşılaştırılabilir sonuçlar için genellikle ihtiyaç duyduğu veri hızının yaklaşık yarısı. Kodek ailesi, surround ses ve yüksek çözünürlüklü ses için WMA Professional, bit düzeyinde mükemmel arşivsel sıkıştırma için WMA Lossless ve çok düşük bit hızlarında konuşma içeriği için optimize edilmiş WMA Voice içerecek şekilde genişlemiştir. Windows, Windows Media Player ve Zune ekosistemleriyle derin entegrasyon, 2000'li yıllar boyunca WMA'ya güçlü bir dağıtım avantajı sağlamıştır ve dijital haklar yönetimi (DRM) desteği onu dönemin çevrimiçi müzik mağazaları için cazip kılmıştır. Kodlama ve kod çözme, Windows tarafından yerel olarak gerçekleştirilir ve herhangi bir Windows makinesinde oynatma için üçüncü taraf yazılım gerektirmez. FFmpeg ve GStreamer gibi kütüphaneler aracılığıyla çapraz platform desteği gelişmiş olsa da WMA, Microsoft dışı cihazlarda MP3 veya AAC kadar evrensel uyumluluğa sahip değildir. Format hâlâ eski medya kütüphanelerinde karşımıza çıksa da daha yeni kodekler akış ve taşınabilir kullanım için büyük ölçüde yerini almıştır.
Geliştirici: Microsoft Corporation
İlk yayın: 1999
HTK, Cambridge Üniversitesi Mühendislik Bölümü'nde konuşma tanıma araştırmaları için geliştirilen bir yazılım paketi olan Hidden Markov Model Toolkit'ın yerel dalga formu kapsayıcısıdır. 1993'te i̇lk dağıtılan HTK, dünya genelinde hesaplamalı dilbilim laboratuvarlarında hızla referans platform haline gelmiş ve dosya formatı da aynı yolu izlemiştir. Her dosya, çerçeve sayısını, 100 ns birimlerinde çerçeve süresini, çerçeve başına bayt sayısını ve veri türünü belirten bir tür kodu içeren 12 baytlık bir başlık ile öncelenmiş parametre vektörleri veya ham örnekler dizisi depolar — dalga formu PCM'den Mel-frekans kepstral katsayılarına ve filtre bankası enerjilerine kadar seçenekler mevcuttur. Bu çok yönlülük, tek bir kapsayıcının hem kaynak sesi hem de çıkarılan özellikleri ayrıştırıcı değiştirmeden taşımasını sağlar. Kasıtlı olarak minimalist başlık, hizalama dolgusu veya isteğe bağlı yığınlardan kaçınarak formatı C, Python veya MATLAB'da birkaç satır i̇kili G/Ç ile okumayı kolaylaştırır. HTK'nın kalıcı önemini destekleyen üç avantaj: HTK eğitim ve tanıma hattıyla sıkı entegrasyon, ayrıştırıcı belirsizliğini ortadan kaldıran deterministik bayt düzeni ve akademik veri derlemlerinde yaygın benimseme.
İlk yayın: 1993

Sık Sorulan Sorular

Neden WMA'yı HTK'ya dönüştürmeliyim?

HTK formatı, HMM konuşma tanıma eğitimi için gereklidir. HTK araç takımı WMA'yı doğrudan işleyemez.

HTK'yı ne kullanır?

Cambridge HTK araç takımı, Kaldi ve ASR araştırma işlem hatları HTK formatında ses tüketir.

ASR için format önemli mi?

Evet — HTK araçları, model eğitimi için özel başlıklara sahip belirli bir PCM formatı gerektirir.

Hangi örnekleme hızı?

Çoğu ASR görevi 8 veya 16 kHz mono kullanır — WMA'dan otomatik olarak yeniden örneklenir.

Veri kümesini dönüştürebilir miyim?

WMA konuşma korpusunuzun tamamını yükleyip tek seferde HTK'ya dönüştürün.