Konwerter plików NIST do AMB
Konwertuj swoje pliki w formacie nist do formatu amb przez Internet i bezpłatnie
nist
amb
Jak przekonwertować plik w formacie NIST do formatu AMB
Wybierz pliki z komputera, dysku Google, usługi Dropbox, adresu URL lub po prostu przeciągnij plik na stronę.
Wybierz format amb lub inny potrzebny Ci format (spośród ponad 200 wspieranych formatów).
Poczekaj, aż plik zostanie przekonwertowany do formatu amb; od razu po konwersji możesz go pobrać.
O formatach
NIST SPHERE (SPeech HEader REsources) to specjalistyczny format plikow audio stworzony przez National Institute of Standards and Technology na potrzeby badan nad mowa, w szczegolnosci projektow finansowanych przez DARPA. Format opakowuje surowe probki audio w strukturalny naglowek ASCII kodujacy metadane, takie jak czestotliwosc probkowania, liczba kanalow, typ kodowania, dane demograficzne mowcy i adnotacje transkrypcyjne — co czyni go idealnym do dystrybucji korpusow mowy. Pliki NIST zwykle przechowuja nieskompresowane PCM lub audio mu-law przy czestotliwosciach probkowania klasy telefonicznej (8 kHz lub 16 kHz), choc kontener jest na tyle elastyczny, by pomiescic rozne kodowania. Kluczowa zaleta jest bogaty, samoopisujoacy sie naglowek, pozwalajacy badaczom osadzac szczegolowe metadane korpusowe bezposrednio w pliku, eliminujac potrzebe osobnych plikow towarzyszacych. SPHERE stal sie rowniez de facto standardem dla glownych baz danych mowy, takich jak TIMIT, Switchboard i korpus Fisher, zapewniajac szerokie uznanie w laboratoriach akademickich i rzadowych. Otwarta specyfikacja i dostepnosc narzedzi wiersza polecen (sphere, h_strip, w_decode) umozliwiaja latwa konwersje, inspekcje i przetwarzanie tych plikow programistycznie w potokach przetwarzania mowy.
Pliki AMB zawieraja dzwiek zakodowany w formacie Ambisonic B-format — technice dzwieku przestrzennego pelnej sfery, opracowanej przez Michaela Gerzona w latach 70. XX wieku. W odroznieniu od systemow kanalowych, takich jak 5.1 czy 7.1, Ambisonics rejestruje pelne trojwymiarowe pole akustyczne za pomoca harmonicznych sferycznych — B-format pierwszego rzedu sklada sie z czterech kanalow: W (dookólny), X (przod-tyl), Y (lewo-prawo) i Z (gora-dol). Reprezentacja ta jest niezalezna od ukladu glosnikow, co oznacza, ze jedno nagranie moze byc dekodowane na dowolna konfiguracje glosnikow lub sluchawki binauralne bez koniecznosci remiksowania. Pliki AMB zwykle przechowuja nieskompresowane dane PCM i sa przetwarzane przez narzedzia takie jak SoX lub specjalistyczne wtyczki. Kluczowa zaleta jest elastycznosc przestrzenna — tworcy przygotowuja jeden plik master, ktory dostosowuje sie do odtwarzania stereo, surround lub immersyjnego. Format skaluje sie tez elegancko: Ambisonics wyzszych rzedow dodaje kanaly zwiekszajace precyzje przestrzenna w oparciu o te sama platforme matematyczna. Wraz z rozwojem rzeczywistosci wirtualnej, wideo 360 stopni i przestrzennego audio w grach, Ambisonics przezywa renesans — wykorzystuja go m.in. platformy takie jak YouTube do dostarczania tresci immersyjnych.