Konwerter plików SOU do NIST

Konwertuj swoje pliki w formacie sou do formatu nist przez Internet i bezpłatnie

Upuść pliki tutaj. 1 GB Maksymalny rozmiar pliku lub Zapisz się
do
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Jak przekonwertować plik w formacie SOU do formatu NIST

1

Wybierz pliki z komputera, dysku Google, usługi Dropbox, adresu URL lub po prostu przeciągnij plik na stronę.

2

Wybierz format nist lub inny potrzebny Ci format (spośród ponad 200 wspieranych formatów).

3

Poczekaj, aż plik zostanie przekonwertowany do formatu nist; od razu po konwersji możesz go pobrać.

O formatach

SOU to oznaczenie surowego formatu audio, funkcjonujace jako alias dla 8-bitowych danych PCM bez znaku (u8) w systemie przetwarzania audio SoX. Pliki z rozszerzeniem .sou zawieraja beznaglowkowe, nieskompresowane probki audio przechowywane jako 8-bitowe liczby calkowite bez znaku — kazdy bajt reprezentuje pojedyncza wartosc amplitudy od 0 do 255, z 128 jako punktem ciszy. Poniewaz nie ma naglowka, parametry odtwarzania, takie jak czestotliwosc probkowania i liczba kanalow, musza byc okreslone zewnetrznie. Domyslne zalozenie to zwykle mono przy 8000 Hz, choc dane moga reprezentowac dowolna czestotliwosc obslugiwana przez sprzet nagrywajacy. Kodowanie u8, ktorego SOU jest aliasem, jest jedna z najprostszych mozliwych reprezentacji cyfrowego audio, poprzedzajaca ustrukturyzowane kontenery, takie jak WAV i AIFF. Surowe PCM bez znaku bylo powszechnie produkowane przez wczesne karty dzwiekowe i digitizery pod koniec lat 80. i na poczatku lat 90., gdy ograniczenia pamieciowe i limitowana moc obliczeniowa czynialy formaty bez naglowka praktycznym wyborem. Jedna z zalet jest absolutna prostota: pliki SOU moga byc odczytane przez dowolny program zdolny do podstawowego I/O plikow, bez parsowania struktur kontenerowych czy dekodowania metadanych — przydatne w systemach wbudowanych, diagnostyce sprzetowej i kontekstach edukacyjnych. Minimalny narzut formatu oznacza tez, ze konwersja do dowolnego nowoczesnego kontenera jest bezstratna i natychmiastowa, poniewaz surowe probki PCM moga byc opakowane w naglowek WAV lub AIFF bez jakiegokolwiek transkodowania.
Pierwsze wydanie: 1991
NIST SPHERE (SPeech HEader REsources) to specjalistyczny format plikow audio stworzony przez National Institute of Standards and Technology na potrzeby badan nad mowa, w szczegolnosci projektow finansowanych przez DARPA. Format opakowuje surowe probki audio w strukturalny naglowek ASCII kodujacy metadane, takie jak czestotliwosc probkowania, liczba kanalow, typ kodowania, dane demograficzne mowcy i adnotacje transkrypcyjne — co czyni go idealnym do dystrybucji korpusow mowy. Pliki NIST zwykle przechowuja nieskompresowane PCM lub audio mu-law przy czestotliwosciach probkowania klasy telefonicznej (8 kHz lub 16 kHz), choc kontener jest na tyle elastyczny, by pomiescic rozne kodowania. Kluczowa zaleta jest bogaty, samoopisujoacy sie naglowek, pozwalajacy badaczom osadzac szczegolowe metadane korpusowe bezposrednio w pliku, eliminujac potrzebe osobnych plikow towarzyszacych. SPHERE stal sie rowniez de facto standardem dla glownych baz danych mowy, takich jak TIMIT, Switchboard i korpus Fisher, zapewniajac szerokie uznanie w laboratoriach akademickich i rzadowych. Otwarta specyfikacja i dostepnosc narzedzi wiersza polecen (sphere, h_strip, w_decode) umozliwiaja latwa konwersje, inspekcje i przetwarzanie tych plikow programistycznie w potokach przetwarzania mowy.
Pierwsze wydanie: 1990