AV1 - SPH Dönüştürücü

AV1 videodan NIST Sphere ses çıkarımını çevrimiçi yapın

Dosyaları buraya bırakın. 1 GB maksimum dosya boyutu veya Kaydol
için
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Konuşma Araştırma Standardı

SPH, büyük konuşma korpuslarının formatıdır — AV1'den dönüştürme sesi dilbilimsel araştırma ve analiz için hazırlar.

Korpus Uyumlu

SPH dosyaları Kaldi, HTK ve NIST puanlama araçları gibi standart konuşma araştırma araçlarıyla entegre olur.

Gizli Dosyalar

AV1 yüklemeleri dönüştürmeden hemen sonra silinir ve SPH çıktıları 24 saat içinde kaldırılır.

AV1'i SPH'ye dönüştürme yöntemi

1

Dosyaları bilgisayar, Google Drive, Dropbox, URL'den veya sayfa üzerinden sürükleyerek seçin.

2

sph ya da sonuç olarak ihtiyacınız olan diğer formatlardan birini seçin (200'den fazla format desteklenir)

3

Haydi dosyayı dönüştürün ve sph dosyanızı hemen sonra indirebilirsiniz

Formatlar hakkında

AV1 (AOMedia Video 1), kurucu üyeleri arasında Google, Mozilla, Microsoft, Amazon, Netflix ve Intel gibi şirketlerin bulunduğu Alliance for Open Media konsorsiyumu tarafından geliştirilen açık ve telifsiz bir video kodlama formatıdır. Spesifikasyon, lisans ücretlerinden arındırılmış olarak H.264 ve HEVC'nın sıkıştırma verimliliğini aşan yeni nesil bir video codec'ı sağlamak amacıyla Haziran 2018'de tamamlanmıştır. AV1, eşdeğer görsel kalitede HEVC'ye kıyasla yaklaşık %30-50 daha i̇yi sıkıştırma elde ederek, i̇zleyici deneyiminden ödün vermeden bant genişliği maliyetlerini düşürmek isteyen akış platformları için özellikle cazip hâle gelir. Codec; film grenü sentezi, paralel işleme için esnek döşeme yapısı, içerik uyarlamalı çözünürlük geçişi ve zengin intra/inter tahmin modları dahil geniş bir özellik yelpazesini destekler. Mobil işlemciler, GPU'lar ve akıllı TV'ler genelinde donanımsal kod çözme desteği hızla genişleyerek kodlama sırasındaki hesaplama gereksinimleriyle ilgili erken dönem endişeleri gidermiştir. AV1, büyük akış hizmetleri tarafından 4K ve HDR içerik dağıtımı için geniş çapta benimsenmiştir ve web tabanlı oynatma için WebM kapsayıcısının video bileşeni olarak hizmet vermektedir. Telifsiz yapısı, AV1'ı açık web standartları ve erişilebilir medya dağıtımı için özellikle önemli kılmaktadır.
İlk yayın: 25 Haziran 2018
SPH, 1990 civarında ABD Ulusal Standartlar ve Teknoloji Enstitüsü tarafından oluşturulan NIST SPHERE (SPeech HEader REsources) formatında depolanan sesin dosya uzantısıdır. Konuşma araştırması için tasarlanan SPH dosyaları, veritabanı tanımlayıcıları, kanal sayıları, örnekleme hızları, bayt sıralaması ve sıkıştırma türü gibi üst verilerle dolu 1024 baytlık ASCII başlık taşır — her kaydı kendi kendini tanımlayan hâle getirir. Temel ses genellikle 16 kHz'de örneklenmiş 16 bit doğrusal PCM'dır, ancak diğer yapılandırmalara da izin verilir. NIST, DARPA ve dünya genelindeki üniversitelerdeki araştırmacılar, modern otomatik konuşma tanıma sistemlerinin temelini oluşturan TIMIT, Switchboard ve LDC koleksiyonları gibi konuşma veri derlemlerini dağıtmak için SPH'ye güvenir. Önemli bir avantajı, i̇nsan tarafından okunabilir başlığın betiklerin i̇kili kod çözme olmadan kayıt üst verilerini ayrıştırmasına olanak tanımasıdır. Formatın sıkı standardizasyonu ayrıca kurumlar ve platformlar arasında veri setleri paylaşırken belirsizliği ortadan kaldırır. SPH dosyaları sıkıştırılmamış PCM depoladığından tam ses doğruluğunu korur — küçük artefaktların bile sonuçları çarpıtabileceği akustik modeller eğitilirken kritik bir özellik.
İlk yayın: 1990

Sık Sorulan Sorular

AV1'i neden SPH'ye dönüştürmelisiniz?

SPH (NIST Sphere), konuşma araştırma korpusları için standart formattır — TIMIT ve Switchboard gibi dilbilimsel veri setleri tarafından kullanılır.

SPH dosyalarını ne açar?

NIST Sphere araçları, Kaldi, HTK ve SoX SPH dosyalarını işler. Akademik konuşma ve dil araştırmalarında standarttır.

SPH ile NIST aynı şey mi?

SPH, NIST Sphere başlık formatını kullanır — terimler konuşma araştırması bağlamında genellikle birbirinin yerine kullanılır.

Tipik örnekleme hızı nedir?

Çoğu konuşma korpusu 8 kHz veya 16 kHz mono kullanır — telefon ve konuşma tanıma verileri için standart hızlardır.

Dönüştürme güvenli mi?

AV1 yüklemeleri hemen silinir. SPH çıktıları 24 saat içinde kaldırılır.