Konwerter plików SPH do AMR
Konwertuj swoje pliki w formacie sph do formatu amr przez Internet i bezpłatnie
sph
amr
Ustawienia
12.2 kbps
Kodek audio AMR obsługuje różne przepływności, od 4.75 do 12.2 kbit/s, przy czym najwyższa jakość przekazu mowy zaczyna się od 7.4 kbit/s .
Mono (1.0)
Ustaw liczbę kanałów audio. To ustawienie jest najbardziej przydatne podczas ograniczania liczby kanałów (np. z 5.1 do stereo).
8000 Hz
Ustaw częstotliwość próbkowania audio. Muzyka z pełnym spektrum (20 Hz – 20 kHz) wymaga wartości nie mniejszych niż 44.1 kHz, aby osiągnąć transparentność. Więcej informacji można znaleźć w wiki.
sph
SPH to rozszerzenie plikow audio przechowywanych w formacie NIST SPHERE (SPeech HEader REsources) — standardzie stworzonym przez amerykanski National Institute of Standards and Technology okolo 1990 roku. Przeznaczony do badan nad mowa, pliki SPH zawieraja 1024-bajtowy naglowek ASCII wypelniony metadanymi — identyfikatorami bazy danych, liczba kanalow, czestotliwoscia probkowania, kolejnoscia bajtow i typem kompresji — co czyni kazde nagranie samoopisujoacy sie. Dane audio to zwykle 16-bitowe liniowe PCM probkowane przy 16 kHz, choc dozwolone sa inne konfiguracje. Badacze z NIST, DARPA i uniwersytetow na calym swiecie polegaja na SPH przy dystrybucji korpusow mowy, takich jak TIMIT, Switchboard i kolekcje LDC, ktore stanowia fundament nowoczesnych systemow automatycznego rozpoznawania mowy. Kluczowa zaleta jest to, ze czytelny naglowek pozwala skryptom parsowac metadane nagrania bez dekodowania binarnego. Scisla standaryzacja formatu eliminuje tez niejednoznacznosc przy wspoldzieleniu zbiorow danych miedzy instytucjami i platformami. Poniewaz pliki SPH przechowuja nieskompresowane PCM, zachowuja pelna wiernosc audio — co jest krytyczne przy trenowaniu modeli akustycznych, gdzie nawet drobne artefakty moga znieksztalcic wyniki.
czytaj więcej
amr
AMR (Adaptive Multi-Rate) to skompresowany format audio zoptymalizowany pod katem mowy, standaryzowany przez Europejski Instytut Norm Telekomunikacyjnych i przyjety jako obowiazkowy kodek w sieciach GSM i 3G. Kodek dynamicznie przelacza sie miedzy osmioma szybkosciami transmisji — od 4,75 do 12,2 kbps — w zaleznosci od warunkow sieciowych i poziomu szumu tla. Gdy jakosc lacza spada, koder przechodzi na nizsza przepustowosc, wymieniaiac nieznaczna czytelnosc na niezawodnosc transmisji. Ten mechanizm adaptacyjny zdefiniowany jest w specyfikacjach 3GPP i reprezentuje jeden z najszerzej wdrozonych kodekow glosowych na swiecie, uzywany w miliardach polaczen telefonii komorkowej. Glowna zaleta jest efektywnosc kompresji: jedna minuta dzwieku AMR przy 12,2 kbps zajmuje ok. 90 KB, co jest praktyczne dla notatek glosowych, poczty glosowej i MMS w sieciach o ograniczonej przepustowosci. Kolejnym atutem jest wbudowana detekcja aktywnosci glosowej i generowanie szumu komfortu, co redukuje transmisje w czasie ciszy. Choc AMR nie nadaje sie do muzyki ze wzgledu na waskie pasmo (300-3400 Hz), doskonale sprawdza sie w dostarczaniu zrozumialej mowy w trudnych warunkach sieciowych.
czytaj więcej
Jak przekonwertować plik w formacie SPH do formatu AMR
Wybierz pliki z komputera, dysku Google, usługi Dropbox, adresu URL lub po prostu przeciągnij plik na stronę.
Wybierz format amr lub inny potrzebny Ci format (spośród ponad 200 wspieranych formatów).
Poczekaj, aż plik zostanie przekonwertowany do formatu amr; od razu po konwersji możesz go pobrać.
O formatach
SPH to rozszerzenie plikow audio przechowywanych w formacie NIST SPHERE (SPeech HEader REsources) — standardzie stworzonym przez amerykanski National Institute of Standards and Technology okolo 1990 roku. Przeznaczony do badan nad mowa, pliki SPH zawieraja 1024-bajtowy naglowek ASCII wypelniony metadanymi — identyfikatorami bazy danych, liczba kanalow, czestotliwoscia probkowania, kolejnoscia bajtow i typem kompresji — co czyni kazde nagranie samoopisujoacy sie. Dane audio to zwykle 16-bitowe liniowe PCM probkowane przy 16 kHz, choc dozwolone sa inne konfiguracje. Badacze z NIST, DARPA i uniwersytetow na calym swiecie polegaja na SPH przy dystrybucji korpusow mowy, takich jak TIMIT, Switchboard i kolekcje LDC, ktore stanowia fundament nowoczesnych systemow automatycznego rozpoznawania mowy. Kluczowa zaleta jest to, ze czytelny naglowek pozwala skryptom parsowac metadane nagrania bez dekodowania binarnego. Scisla standaryzacja formatu eliminuje tez niejednoznacznosc przy wspoldzieleniu zbiorow danych miedzy instytucjami i platformami. Poniewaz pliki SPH przechowuja nieskompresowane PCM, zachowuja pelna wiernosc audio — co jest krytyczne przy trenowaniu modeli akustycznych, gdzie nawet drobne artefakty moga znieksztalcic wyniki.
AMR (Adaptive Multi-Rate) to skompresowany format audio zoptymalizowany pod katem mowy, standaryzowany przez Europejski Instytut Norm Telekomunikacyjnych i przyjety jako obowiazkowy kodek w sieciach GSM i 3G. Kodek dynamicznie przelacza sie miedzy osmioma szybkosciami transmisji — od 4,75 do 12,2 kbps — w zaleznosci od warunkow sieciowych i poziomu szumu tla. Gdy jakosc lacza spada, koder przechodzi na nizsza przepustowosc, wymieniaiac nieznaczna czytelnosc na niezawodnosc transmisji. Ten mechanizm adaptacyjny zdefiniowany jest w specyfikacjach 3GPP i reprezentuje jeden z najszerzej wdrozonych kodekow glosowych na swiecie, uzywany w miliardach polaczen telefonii komorkowej. Glowna zaleta jest efektywnosc kompresji: jedna minuta dzwieku AMR przy 12,2 kbps zajmuje ok. 90 KB, co jest praktyczne dla notatek glosowych, poczty glosowej i MMS w sieciach o ograniczonej przepustowosci. Kolejnym atutem jest wbudowana detekcja aktywnosci glosowej i generowanie szumu komfortu, co redukuje transmisje w czasie ciszy. Choc AMR nie nadaje sie do muzyki ze wzgledu na waskie pasmo (300-3400 Hz), doskonale sprawdza sie w dostarczaniu zrozumialej mowy w trudnych warunkach sieciowych.