SPX-zu-SPH-Konverter
Wandeln Sie Ihre spx-Dateien online & kostenlos in sph um
spx
sph
Wie man SPX in SPH konvertiert
Wählen Sie Dateien vom Computer, Google Drive, Dropbox, einer URL oder durch Ziehen auf die Seite.
Wählen Sie sph oder irgendein anderes Format, das Sie als Ergebnis haben wollen (mehr als 200 Formate unterstützt)
Lassen Sie die Datei konvertieren und Sie können Ihre sph-Datei direkt danach herunterladen
Über die Formate
Speex ist ein quelloffener Audiocodec, der gezielt für Sprachkompression entwickelt wurde — erdacht von Jean-Marc Valin unter der Xiph.Org Foundation. Erstmals im Oktober 2002 veröffentlicht, zielt er auf Voice-over-IP, Konferenzen und jedes Szenario, in dem gesprochenes Wort effizient über ein Netzwerk übertragen werden muss. SPX-Dateien verpacken Speex-kodiertes Audio in einem Ogg-Container und kombinieren so die Sprachoptimierung des Codecs mit den Streaming-Fähigkeiten von Ogg. Drei Abtastraten werden unterstützt — Schmalband bei 8 kHz, Breitband bei 16 kHz und Ultra-Breitband bei 32 kHz — zusammen mit variabler Bitratenkodierung, die sich in Echtzeit an die Sprachkomplexität anpasst. Ein herausragender Vorteil ist seine patentfreie, BSD-lizenzierte Natur, die es Entwicklern ermöglichte, ihn frei in kommerzielle und Open-Source-Produkte einzubetten. Speex bringt zudem akustische Echounterdrückung, Rauschunterdrückung und automatische Verstärkungsregelung mit — Features, die konkurrierende Codecs typischerweise an externe Bibliotheken delegieren. Obwohl die Entwickler seit 2012 offiziell Opus als Nachfolger empfehlen, bleibt Speex in Legacy-VoIP-Systemen, archivierten Aufnahmen und eingebetteten Geräten im Einsatz, wo sein leichtgewichtiger Decoder-Footprint geschätzt wird.
SPH ist die Dateierweiterung für Audio im NIST SPHERE-Format (SPeech HEader REsources), einem Standard, der um 1990 vom U.S. National Institute of Standards and Technology entwickelt wurde. Für die Sprachforschung konzipiert, enthalten SPH-Dateien einen 1024-Byte-ASCII-Header mit umfangreichen Metadaten — Datenbankkennungen, Kanalzahlen, Abtastraten, Bytereihenfolge und Kompressionstyp — sodass jede Aufnahme sich selbst beschreibt. Das zugrunde liegende Audio ist typischerweise 16-Bit-lineares PCM mit 16 kHz Abtastrate, obwohl andere Konfigurationen zulässig sind. Forscher am NIST, bei der DARPA und an Universitäten weltweit setzen auf SPH für die Verteilung von Sprachkorpora wie TIMIT, Switchboard und den LDC-Sammlungen, die modernen Spracherkennungssystemen zugrunde liegen. Ein wesentlicher Vorteil ist, dass der menschenlesbare Header es Skripten ermöglicht, Aufnahme-Metadaten ohne binäre Dekodierung zu parsen. Die strikte Standardisierung eliminiert zudem Mehrdeutigkeiten beim Austausch von Datensätzen zwischen Institutionen und Plattformen. Da SPH-Dateien unkomprimiertes PCM speichern, bewahren sie die volle Audioklangtreü — entscheidend beim Training akustischer Modelle, bei denen selbst kleine Artefakte die Ergebnisse verfälschen können.