DIVX - HTK Dönüştürücü

DIVX video kliplerinden HTK sesini çevrimiçi çıkarın

Dosyaları buraya bırakın. 1 GB maksimum dosya boyutu veya Kaydol
için
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Videodan Konuşma Verisine

DIVX video sesini doğrudan HTK formatına dönüştürün — video arşivlerinden konuşma veri setleri oluştururken birçok manuel adımı atlayın.

Sunucu Tarafında Çıkarma

DIVX sesinin çıkarılması ve HTK kodlaması bulut altyapımızda gerçekleşir. Araç seti kurulumu veya yerel işlem gerekmez.

Platformdan Bağımsız

DIVX - HTK dönüştürmeyi tarayıcısı olan herhangi bir cihazdan çalıştırın. İşletim sisteminizden bağımsız olarak konuşmaya hazır ses dosyalarınıza erişin.

DIVX'i HTK'ye dönüştürme yöntemi

1

Dosyaları bilgisayar, Google Drive, Dropbox, URL'den veya sayfa üzerinden sürükleyerek seçin.

2

htk ya da sonuç olarak ihtiyacınız olan diğer formatlardan birini seçin (200'den fazla format desteklenir)

3

Haydi dosyayı dönüştürün ve htk dosyanızı hemen sonra indirebilirsiniz

Formatlar hakkında

DivX, DivX, LLC tarafından geliştirilen bir video codec'leri ve medya kapsayıcı formatı ailesidir. Projenin kökleri 1990'ların sonlarında dolaşıma giren Microsoft MPEG-4 v3 codec'inin değiştirilmiş bir sürümüne dayanır; ancak meşru DivX codec'ı Ocak 2001'de OpenDivX adlı açık kaynaklı bir proje olarak başlamış ve ardından tescilli ticari bir ürüne dönüşmüştür. Codec, MPEG-4 Part 2 (ASP) sıkıştırmasına dayanır ve sonraki sürümler H.264/AVC ile HEVC desteğini de bünyesine katmıştır. DivX, 2000'lerin başında tam uzunlukta bir filmi izlenebilir görsel kaliteyi koruyarak tek bir CD-ROM'a sığacak kadar küçük bir dosyaya sıkıştırabilme yeteneğiyle muazzam bir popülerlik kazanmıştır. Bu sıkıştırma verimliliği, bant genişliği ve depolamanın kıt kaynaklar olduğu erken i̇nternet dönemini belirleyen bir format haline getirmiştir. DivX Media Format (.divx) kapsayıcısı; etkileşimli menüler, bölümler, altyazılar ve alternatif ses parçaları gibi özellikler ekleyerek dijital dosyalara DVD benzeri işlevsellik kazandırır. DivX sertifikasyonu tüketici elektroniğinde yaygın bir etiket haline gelmiş ve binlerce DVD oynatıcı ile diğer cihaz yerel olarak DivX oynatma desteği sunmuştur. Codec ayrıca, karmaşık sahnelere daha fazla veri ayırıp durağan sahnelere daha az veri aktaran kalite tabanlı değişken bit hızı kodlamaya öncülük ederek video boyunca tutarlı görsel kalite sağlamıştır.
Geliştirici: DivX, LLC
İlk yayın: 15 Ocak 2001
HTK, Cambridge Üniversitesi Mühendislik Bölümü'nde konuşma tanıma araştırmaları için geliştirilen bir yazılım paketi olan Hidden Markov Model Toolkit'ın yerel dalga formu kapsayıcısıdır. 1993'te i̇lk dağıtılan HTK, dünya genelinde hesaplamalı dilbilim laboratuvarlarında hızla referans platform haline gelmiş ve dosya formatı da aynı yolu izlemiştir. Her dosya, çerçeve sayısını, 100 ns birimlerinde çerçeve süresini, çerçeve başına bayt sayısını ve veri türünü belirten bir tür kodu içeren 12 baytlık bir başlık ile öncelenmiş parametre vektörleri veya ham örnekler dizisi depolar — dalga formu PCM'den Mel-frekans kepstral katsayılarına ve filtre bankası enerjilerine kadar seçenekler mevcuttur. Bu çok yönlülük, tek bir kapsayıcının hem kaynak sesi hem de çıkarılan özellikleri ayrıştırıcı değiştirmeden taşımasını sağlar. Kasıtlı olarak minimalist başlık, hizalama dolgusu veya isteğe bağlı yığınlardan kaçınarak formatı C, Python veya MATLAB'da birkaç satır i̇kili G/Ç ile okumayı kolaylaştırır. HTK'nın kalıcı önemini destekleyen üç avantaj: HTK eğitim ve tanıma hattıyla sıkı entegrasyon, ayrıştırıcı belirsizliğini ortadan kaldıran deterministik bayt düzeni ve akademik veri derlemlerinde yaygın benimseme.
İlk yayın: 1993

Sık Sorulan Sorular

DIVX neden HTK formatına dönüştürülmeli?

HTK, konuşma tanıma araştırmalarında kullanılan Gizli Markov Modeli Araç Seti için standart formattır. DIVX sesi kullanılabilir eğitim verisine dönüşür.

HTK ses formatı nedir?

HTK, konuşma işleme için tek kanallı 16-bit PCM verileri depolar. HTK konuşma tanıma ve analiz araç seti için özel olarak oluşturulmuştur.

HTK, DIVX surround sesi işleyebilir mi?

HTK tek kanallı bir formattır. Çok kanallı DIVX sesi dönüştürme sırasında mono olarak karıştırılır ki bu konuşma analizi için standarttır.

Ses kalitesi yeterli mi?

HTK, 16-bit PCM kalitesini korur — konuşma tanıma eğitimi için fazlasıyla yeterlidir. DIVX videolardaki diyaloglar temiz şekilde dönüştürülür.

HTK dosyalarını başka ne okur?

HTK Araç Seti dışında SoX ve birçok akademik konuşma analiz paketi HTK formatlı ses verilerini işleyebilir.