SPH'den IRCAM'ye dönüştürücü
sph dosyalarınızı ircam'ye çevrimiçi & ücretsiz olarak dönüştürün
sph
ircam
SPH'i IRCAM'ye dönüştürme yöntemi
Dosyaları bilgisayar, Google Drive, Dropbox, URL'den veya sayfa üzerinden sürükleyerek seçin.
ircam ya da sonuç olarak ihtiyacınız olan diğer formatlardan birini seçin (200'den fazla format desteklenir)
Haydi dosyayı dönüştürün ve ircam dosyanızı hemen sonra indirebilirsiniz
Formatlar hakkında
SPH, 1990 civarında ABD Ulusal Standartlar ve Teknoloji Enstitüsü tarafından oluşturulan NIST SPHERE (SPeech HEader REsources) formatında depolanan sesin dosya uzantısıdır. Konuşma araştırması için tasarlanan SPH dosyaları, veritabanı tanımlayıcıları, kanal sayıları, örnekleme hızları, bayt sıralaması ve sıkıştırma türü gibi üst verilerle dolu 1024 baytlık ASCII başlık taşır — her kaydı kendi kendini tanımlayan hâle getirir. Temel ses genellikle 16 kHz'de örneklenmiş 16 bit doğrusal PCM'dır, ancak diğer yapılandırmalara da izin verilir. NIST, DARPA ve dünya genelindeki üniversitelerdeki araştırmacılar, modern otomatik konuşma tanıma sistemlerinin temelini oluşturan TIMIT, Switchboard ve LDC koleksiyonları gibi konuşma veri derlemlerini dağıtmak için SPH'ye güvenir. Önemli bir avantajı, i̇nsan tarafından okunabilir başlığın betiklerin i̇kili kod çözme olmadan kayıt üst verilerini ayrıştırmasına olanak tanımasıdır. Formatın sıkı standardizasyonu ayrıca kurumlar ve platformlar arasında veri setleri paylaşırken belirsizliği ortadan kaldırır. SPH dosyaları sıkıştırılmamış PCM depoladığından tam ses doğruluğunu korur — küçük artefaktların bile sonuçları çarpıtabileceği akustik modeller eğitilirken kritik bir özellik.
IRCAM ses dosyaları, besteci Pierre Boulez tarafından Paris'te kurulan dünyanın önde gelen bilgisayar müziği laboratuvarlarından biri olan Institut de Recherche et Coordination Acoustique/Musique'ten kaynaklanmaktadır. Format, IRCAM'ın araştırma ihtiyaçlarına hizmet etmek üzere 1980'lerin başında oluşturulmuş ve o zamandan beri bilim ile ses kesişiminde çalışan akademik ve sanatsal topluluklar tarafından benimsenmiştir. Bir IRCAM dosyası, sihirli sayı, örnekleme hızı, kanal sayısı ve doğrusal PCM (16/32 bit tam sayı ve 32 bit kayan nokta), mü-law ve A-law varyantlarını destekleyen bir kodlama türü alanı içeren 1024 baytlık bir başlıkla başlar. Başlık bloğu ayrıca araştırmacıların deney üst verilerini doğrudan ses dosyasına gömmesine olanak tanıyan serbest biçimli açıklama metnini barındırır. Veri yükü varsayılan olarak sıkıştırılmamış olduğundan kayıtlar, psikoakustik deneylerde çok önemli olan ardışık analiz ve yeniden sentez döngüleri boyunca tam doğruluğu korur. Csound, libsndfile ve SoX gibi yazılımlar formatı yerel olarak okur ve yazar. Başlıca avantajları arasında ayrıştırma belirsizliğini ortadan kaldıran i̇yi tanımlanmış başlık, bilimsel DSP çalışmalarında vazgeçilmez olan kayan nokta örnek desteği ve süregelen araç desteğini garantileyen bilgisayar müziği topluluğundaki köklü geçmişi yer alır.