AV1 - NIST Dönüştürücü

AV1 videodan NIST Sphere ses formatını çevrimiçi çıkarın

Dosyaları buraya bırakın. 1 GB maksimum dosya boyutu veya Kaydol
için
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Araştırma Standardı

NIST Sphere, konuşma verisi değişimi için devlet standardıdır — AV1 dönüştürme araştırmaya hazır ses üretir.

Korpus Ayarları

Örnekleme hızı ve kodlamayı konuşma değerlendirme veya eğitim korpusunuzun tam gereksinimlerine göre yapılandırın.

Güvenli Dönüştürme

AV1 yüklemeleri işlemden hemen sonra silinir ve NIST çıktıları 24 saat içinde kaldırılır.

AV1'i NIST'ye dönüştürme yöntemi

1

Dosyaları bilgisayar, Google Drive, Dropbox, URL'den veya sayfa üzerinden sürükleyerek seçin.

2

nist ya da sonuç olarak ihtiyacınız olan diğer formatlardan birini seçin (200'den fazla format desteklenir)

3

Haydi dosyayı dönüştürün ve nist dosyanızı hemen sonra indirebilirsiniz

Formatlar hakkında

AV1 (AOMedia Video 1), kurucu üyeleri arasında Google, Mozilla, Microsoft, Amazon, Netflix ve Intel gibi şirketlerin bulunduğu Alliance for Open Media konsorsiyumu tarafından geliştirilen açık ve telifsiz bir video kodlama formatıdır. Spesifikasyon, lisans ücretlerinden arındırılmış olarak H.264 ve HEVC'nın sıkıştırma verimliliğini aşan yeni nesil bir video codec'ı sağlamak amacıyla Haziran 2018'de tamamlanmıştır. AV1, eşdeğer görsel kalitede HEVC'ye kıyasla yaklaşık %30-50 daha i̇yi sıkıştırma elde ederek, i̇zleyici deneyiminden ödün vermeden bant genişliği maliyetlerini düşürmek isteyen akış platformları için özellikle cazip hâle gelir. Codec; film grenü sentezi, paralel işleme için esnek döşeme yapısı, içerik uyarlamalı çözünürlük geçişi ve zengin intra/inter tahmin modları dahil geniş bir özellik yelpazesini destekler. Mobil işlemciler, GPU'lar ve akıllı TV'ler genelinde donanımsal kod çözme desteği hızla genişleyerek kodlama sırasındaki hesaplama gereksinimleriyle ilgili erken dönem endişeleri gidermiştir. AV1, büyük akış hizmetleri tarafından 4K ve HDR içerik dağıtımı için geniş çapta benimsenmiştir ve web tabanlı oynatma için WebM kapsayıcısının video bileşeni olarak hizmet vermektedir. Telifsiz yapısı, AV1'ı açık web standartları ve erişilebilir medya dağıtımı için özellikle önemli kılmaktadır.
İlk yayın: 25 Haziran 2018
NIST SPHERE (SPeech HEader REsources), konuşma araştırmaları için özellikle DARPA tarafından finanse edilen projeler kapsamında Ulusal Standartlar ve Teknoloji Enstitüsü tarafından oluşturulmuş özel bir ses dosyası formatıdır. Format, ham ses örneklerini örnekleme hızı, kanal sayısı, kodlama türü, konuşmacı demografisi ve transkripsiyon açıklamaları gibi üst verileri kodlayan yapılandırılmış ASCII başlıkla sarar — bu özellik konuşma veri derlemleri dağıtımı için idealdir. NIST dosyaları genellikle telefon kalitesinde örnekleme hızlarında (8 kHz veya 16 kHz) sıkıştırılmamış PCM veya mü-law ses depolar, ancak kapsayıcı çeşitli kodlamaları barındıracak kadar esnektir. Önemli bir avantajı, araştırmacıların ayrıntılı veri derlemi üst verilerini doğrudan dosyaya gömmesine olanak tanıyan zengin, kendi kendini tanımlayan başlıktır ve ek dosyalara gerek kalmaz. SPHERE ayrıca TIMIT, Switchboard ve Fisher veri derlemi gibi büyük konuşma veritabanları için fiili standart haline gelmiştir ve akademik ile devlet laboratuvarlarında geniş tanınırlık sağlar. Açık spesifikasyon ve komut satırı araçlarının (sphere, h_strip, w_decode) erişilebilirliği, bu dosyaların konuşma işleme hatlarında programatik olarak dönüştürülmesini, incelenmesini ve işlenmesini kolaylaştırır.
İlk yayın: 1990

Sık Sorulan Sorular

AV1'i neden NIST'e dönüştürmelisiniz?

NIST Sphere, konuşma araştırma verileri için standart değişim formatıdır — devlet ve akademik konuşma değerlendirme programları tarafından kullanılır.

NIST dosyalarını ne açar?

NIST konuşma araçları, SoX, Kaldi ve HTK araştırma ve değerlendirme amaçlı NIST Sphere sesini işler.

NIST ile SPH arasındaki fark nedir?

NIST ve SPH aynı NIST Sphere formatını ifade eder — aynı ses konteyner spesifikasyonları için farklı dosya uzantılarıdır.

En iyi ayarlar nelerdir?

Konuşma araştırması genellikle 8 kHz veya 16 kHz, 16-bit mono gerektirir — bunları korpus spesifikasyonlarınıza eşleştirin.

Verilerim gizli mi?

AV1 yüklemeleri hemen silinir. NIST çıktıları 24 saat içinde temizlenir.