OGG'den HTK'ya Dönüştürücü

OGG dosyalarından HTK konuşma işleme sesi oluşturun

Dosyaları buraya bırakın. 1 GB maksimum dosya boyutu veya Kaydol
için
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Konuşma Tanıma Formatı

HTK, HMM tabanlı konuşma tanıma eğitimi için giriş standardıdır — OGG konuşma verilerinizi araştırma kullanımı için dönüştürün.

Veri Seti İşleme

Tüm OGG konuşma veri kümeleriyle yükleyin ve her dosya için aynı anda HTK formatında ses üretin.

Sunucu Tarafı Dönüşüm

HTK araç seti kurulumu gerekmez — OGG'den HTK'ya dönüşüm tamamen çevrimiçi çalışır.

OGG'i HTK'ye dönüştürme yöntemi

1

Dosyaları bilgisayar, Google Drive, Dropbox, URL'den veya sayfa üzerinden sürükleyerek seçin.

2

htk ya da sonuç olarak ihtiyacınız olan diğer formatlardan birini seçin (200'den fazla format desteklenir)

3

Haydi dosyayı dönüştürün ve htk dosyanızı hemen sonra indirebilirsiniz

Formatlar hakkında

OGG Vorbis, her i̇kisi de Xiph.Org Vakfı tarafından geliştirilen Ogg kapsayıcı formatı içindeki açık, telifsiz kayıplı ses kodekidir. Vorbis, MP3 ve AAC'ye patent içermeyen bir alternatif olarak tasarlanmıştır ve çerçeve başına sinyal karmaşıklığına uyum sağlayan değişken bit hızlı kodlama ile modifiye ayrık kosinüs dönüşümü (MDCT) kodlaması kullanır. Kör dinleme testleri, Vorbis'ın özellikle 96-192 kbps aralığında MP3 ile eşleşen veya onu aşan algısal kalite sunduğunu tutarlı olarak göstermiştir. Format, 8 kHz'den 192 kHz'e kadar örnekleme hızlarını ve 1 ile 255 arasında kanalı destekleyerek mono sesten surround mikslere kadar her şeyi kapsar. Öne çıkan avantajı lisans ücretlerinin tamamen bulunmamasıdır — oyun geliştiricileri, akış platformları ve donanım üreticileri telif kaygısı olmadan Vorbis uygulayabilir. Spotify tam da bu nedenle yıllarca birincil akış kodeki olarak Vorbis'e güvenmiştir. Format ayrıca düşük bit hızlarında kalite düşüşünü birçok rakibinden daha zarif biçimde yönetir — bu yüzden depolama alanının kısıtlı olduğu ve binlerce ses efektinin alan için yarıştığı video oyunlarında popülerliğini korumaktadır. VLC, Firefox, Chrome ve Android yerel Vorbis kod çözme desteği sunar.
Geliştirici: Xiph.Org Foundation
İlk yayın: 1 Mayıs 2000
HTK, Cambridge Üniversitesi Mühendislik Bölümü'nde konuşma tanıma araştırmaları için geliştirilen bir yazılım paketi olan Hidden Markov Model Toolkit'ın yerel dalga formu kapsayıcısıdır. 1993'te i̇lk dağıtılan HTK, dünya genelinde hesaplamalı dilbilim laboratuvarlarında hızla referans platform haline gelmiş ve dosya formatı da aynı yolu izlemiştir. Her dosya, çerçeve sayısını, 100 ns birimlerinde çerçeve süresini, çerçeve başına bayt sayısını ve veri türünü belirten bir tür kodu içeren 12 baytlık bir başlık ile öncelenmiş parametre vektörleri veya ham örnekler dizisi depolar — dalga formu PCM'den Mel-frekans kepstral katsayılarına ve filtre bankası enerjilerine kadar seçenekler mevcuttur. Bu çok yönlülük, tek bir kapsayıcının hem kaynak sesi hem de çıkarılan özellikleri ayrıştırıcı değiştirmeden taşımasını sağlar. Kasıtlı olarak minimalist başlık, hizalama dolgusu veya isteğe bağlı yığınlardan kaçınarak formatı C, Python veya MATLAB'da birkaç satır i̇kili G/Ç ile okumayı kolaylaştırır. HTK'nın kalıcı önemini destekleyen üç avantaj: HTK eğitim ve tanıma hattıyla sıkı entegrasyon, ayrıştırıcı belirsizliğini ortadan kaldıran deterministik bayt düzeni ve akademik veri derlemlerinde yaygın benimseme.
İlk yayın: 1993

Sık Sorulan Sorular

Neden OGG'yi HTK'ya dönüştürmeliyim?

HTK formatı, Hidden Markov Model Toolkit tarafından konuşma tanıma modeli eğitimi için gereklidir. Araştırmacılar HTK formatında giriş verisi gerektirir.

HTK dosyalarını neler kullanır?

Cambridge Üniversitesi'nin HTK araç seti, Kaldi ve çeşitli konuşma tanıma araştırma hatları HTK formatındaki sesi tüketir.

HTK yaygın bir ses formatı mı?

HTK, konuşma işleme araştırması için özelleşmiştir — genel amaçlı bir ses formatı değildir. Özel başlıklarla 16-bit PCM depolar.

HTK hangi örnekleme hızını gerektirir?

Çoğu konuşma tanıma görevi 8 veya 16 kHz mono kullanır. Dönüştürücü, OGG kaynağınızdan yeniden örneklemeyi otomatik olarak yapar.

Bir OGG veri setini toplu dönüştürebilir miyim?

Tüm konuşma veri setinizi OGG olarak yükleyin ve tek seferde HTK'ya dönüştürün — ASR model eğitimi için hazır.

OGG - HTK kalite değerlendirmesi

5.0 (1 oyları)
Geribildirim sağlamak için en az 1 dosya dönüştürmeniz ve indirmeniz gerekir!