MPEG - SPH Dönüştürücü

MPEG sesini çevrimiçi NIST SPHERE konuşma formatı olarak çıkarın

Dosyaları buraya bırakın. 1 GB maksimum dosya boyutu veya Kaydol
için
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Videodan Konuşma Derlemine

MPEG videodan diyalogu çıkarıp NIST SPHERE olarak paketleyin — konuşma araştırma veri setleri oluştururken manuel çıkarmayı atlayın.

NIST Standardı

SPH çıktısı tam olarak NIST SPHERE spesifikasyonlarını karşılar. Doğrudan Kaldi, HTK veya herhangi bir konuşma tanıma çerçevesine aktarın.

Güvenli İşlem

MPEG yüklemeleri dönüştürme sonrasında kaldırılır. SPH çıktı dosyaları 24 saat içinde silinir — araştırma materyalleriniz gizli kalır.

MPEG'i SPH'ye dönüştürme yöntemi

1

Dosyaları bilgisayar, Google Drive, Dropbox, URL'den veya sayfa üzerinden sürükleyerek seçin.

2

sph ya da sonuç olarak ihtiyacınız olan diğer formatlardan birini seçin (200'den fazla format desteklenir)

3

Haydi dosyayı dönüştürün ve sph dosyanızı hemen sonra indirebilirsiniz

Formatlar hakkında

MPEG (MPEG-1), Hareketli Görüntü Uzmanlar Grubu tarafından ISO/IEC 11172 olarak Ağustos 1993'te yayımlanan temel bir video ve ses sıkıştırma standardıdır. Hareketli görüntülerin ve ilişkili sesin kayıplı sıkıştırılması için i̇lk uluslararası standart olup sonraki neredeyse tüm video codec'lerini etkileyen prensip ve teknikleri ortaya koymuştur. MPEG-1 video sıkıştırması; hareket telafili tahmin, ayrık kosinüs dönüşümü kodlama ve değişken uzunluklu entropi kodlamanın birleşimiyle I-kareler (kare içi kodlanmış), P-kareler (tahminli) ve B-kareler (çift yönlü tahminli) olmak üzere üç kare türü etrafında organize edilir. Standart, SIF çözünürlükte (NTSC için 352x240) VHS kaset kalitesine eşdeğer görüntü üreterek ses ve video için birleşik yaklaşık 1,5 Mbps bit hızını hedefler. Bu sıkıştırma düzeyi, 1x hızlı CD-ROM sürücülerinin veri aktarım hızına uyacak şekilde özellikle seçilmiş ve 1990'ların başında dijital videoyu tüketicilere ulaştıran Video CD formatını mümkün kılmıştır. Ses bileşeni — özellikle Katman III (MP3) — tarihin en etkili ses formatı haline gelmiştir. I/P/B kare yapısı, hareket tahmini yaklaşımı ve blok tabanlı dönüşüm kodlama, MPEG-2'den H.264'e ve ötesine kadar her büyük video codec'inin izlediği mimari şablonu oluşturmuştur. Sıkıştırma verimliliği açısından çoktan aşılmış olmasına rağmen MPEG-1, neredeyse tüm medya yazılımları tarafından desteklenmeye devam etmektedir.
İlk yayın: Ağustos 1993
SPH, 1990 civarında ABD Ulusal Standartlar ve Teknoloji Enstitüsü tarafından oluşturulan NIST SPHERE (SPeech HEader REsources) formatında depolanan sesin dosya uzantısıdır. Konuşma araştırması için tasarlanan SPH dosyaları, veritabanı tanımlayıcıları, kanal sayıları, örnekleme hızları, bayt sıralaması ve sıkıştırma türü gibi üst verilerle dolu 1024 baytlık ASCII başlık taşır — her kaydı kendi kendini tanımlayan hâle getirir. Temel ses genellikle 16 kHz'de örneklenmiş 16 bit doğrusal PCM'dır, ancak diğer yapılandırmalara da izin verilir. NIST, DARPA ve dünya genelindeki üniversitelerdeki araştırmacılar, modern otomatik konuşma tanıma sistemlerinin temelini oluşturan TIMIT, Switchboard ve LDC koleksiyonları gibi konuşma veri derlemlerini dağıtmak için SPH'ye güvenir. Önemli bir avantajı, i̇nsan tarafından okunabilir başlığın betiklerin i̇kili kod çözme olmadan kayıt üst verilerini ayrıştırmasına olanak tanımasıdır. Formatın sıkı standardizasyonu ayrıca kurumlar ve platformlar arasında veri setleri paylaşırken belirsizliği ortadan kaldırır. SPH dosyaları sıkıştırılmamış PCM depoladığından tam ses doğruluğunu korur — küçük artefaktların bile sonuçları çarpıtabileceği akustik modeller eğitilirken kritik bir özellik.
İlk yayın: 1990

Sık Sorulan Sorular

Neden MPEG dosyasını SPH formatına dönüştürmeliyim?

SPH konuşma araştırması için NIST SPHERE standardıdır. MPEG video diyalogu ASR eğitimi ve değerlendirmesi için uygun şekilde formatlanmış veri haline gelir.

SPH dosyalarını hangi araçlar destekler?

Kaldi, HTK, Praat ve NIST SPHERE toolkit SPH formatını doğal olarak destekler. Konuşma ses araştırması için standart değişim formatıdır.

SPH sesi sıkıştırır mı?

Hayır — SPH kayıplı sıkıştırma olmadan PCM verisi depolar. MPEG sesi doğru konuşma işleme için tam kalitede SPHERE formatına ulaşır.

MPEG-1 sesi yeterli mi?

MPEG-1 sesi konuşma araştırması için yeterli kalite sağlar. Diyalog içeriği çıkarma ve SPH kodlama sürecinden iyi şekilde korunur.

Birden fazla MPEG dosyası dönüştürebilir miyim?

Birden fazla MPEG video yükleyin ve toplu olarak SPH formatına dönüştürün. Arşivlenmiş MPEG video koleksiyonlarından konuşma derlemleri oluşturmak için verimlidir.