AV1 in SPH Konverter

NIST-Sphere-Audio aus AV1-Video online extrahieren

Dateien hierhin und ablegen. 1 GB maximale dateigröße oder Registrieren
in
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Sprachforschungsstandard

SPH ist das Format für große Sprachkorpora — die Konvertierung von AV1 bereitet Audio für linguistische Forschung und Analyse vor.

Korpus-kompatibel

SPH-Dateien integrieren sich mit Standard-Sprachforschungstools wie Kaldi, HTK und NIST-Scoring-Utilities.

Private Dateien

AV1-Uploads werden sofort nach der Konvertierung gelöscht und SPH-Ausgaben innerhalb von 24 Stunden entfernt.

Wie man AV1 in SPH konvertiert

1

Wählen Sie Dateien vom Computer, Google Drive, Dropbox, einer URL oder durch Ziehen auf die Seite.

2

Wählen Sie sph oder irgendein anderes Format, das Sie als Ergebnis haben wollen (mehr als 200 Formate unterstützt)

3

Lassen Sie die Datei konvertieren und Sie können Ihre sph-Datei direkt danach herunterladen

Über die Formate

AV1 (AOMedia Video 1) ist ein offenes, lizenzgebührenfreies Videokodierungsformat, das von der Alliance for Open Media entwickelt wurde — einem Konsortium, zu dessen Gründungsmitgliedern unter anderem Google, Mozilla, Microsoft, Amazon, Netflix und Intel gehören. Die Spezifikation wurde im Juni 2018 finalisiert mit dem Ziel, einen Videocodec der nächsten Generation bereitzustellen, der die Kompressionseffizienz von H.264 und HEVC übertrifft und dabei frei von Lizenzgebühren bleibt. AV1 erreicht rund 30-50% bessere Kompression als HEVC bei gleichwertiger visueller Qualität, was es besonders attraktiv für Streaming-Plattformen macht, die Bandbreitenkosten senken wollen, ohne das Zuschaürerlebnis einzuschränken. Der Codec unterstützt ein breites Spektrum an Funktionen, darunter Filmkorn-Synthese, flexible Kachelung für parallele Verarbeitung, inhaltsadaptive Auflösungsumschaltung und einen reichen Satz an Intra- und Inter-Vorhersagemodi. Die Hardware-Dekodierungsunterstützung ist rapide gewachsen — über mobile Prozessoren, GPUs und Smart-TVs hinweg — und adressiert frühe Bedenken hinsichtlich der Rechenanforderungen bei der Kodierung. AV1 wurde von großen Streaming-Diensten für die Bereitstellung von 4K- und HDR-Inhalten übernommen und dient als Videokomponente des WebM-Containers für webbasierte Wiedergabe. Der lizenzgebührenfreie Status macht AV1 besonders bedeutsam für offene Web-Standards und barrierefreie Medienverbreitung.
Erstveröffentlichung: 25. Juni 2018
SPH ist die Dateierweiterung für Audio im NIST SPHERE-Format (SPeech HEader REsources), einem Standard, der um 1990 vom U.S. National Institute of Standards and Technology entwickelt wurde. Für die Sprachforschung konzipiert, enthalten SPH-Dateien einen 1024-Byte-ASCII-Header mit umfangreichen Metadaten — Datenbankkennungen, Kanalzahlen, Abtastraten, Bytereihenfolge und Kompressionstyp — sodass jede Aufnahme sich selbst beschreibt. Das zugrunde liegende Audio ist typischerweise 16-Bit-lineares PCM mit 16 kHz Abtastrate, obwohl andere Konfigurationen zulässig sind. Forscher am NIST, bei der DARPA und an Universitäten weltweit setzen auf SPH für die Verteilung von Sprachkorpora wie TIMIT, Switchboard und den LDC-Sammlungen, die modernen Spracherkennungssystemen zugrunde liegen. Ein wesentlicher Vorteil ist, dass der menschenlesbare Header es Skripten ermöglicht, Aufnahme-Metadaten ohne binäre Dekodierung zu parsen. Die strikte Standardisierung eliminiert zudem Mehrdeutigkeiten beim Austausch von Datensätzen zwischen Institutionen und Plattformen. Da SPH-Dateien unkomprimiertes PCM speichern, bewahren sie die volle Audioklangtreü — entscheidend beim Training akustischer Modelle, bei denen selbst kleine Artefakte die Ergebnisse verfälschen können.
Erstveröffentlichung: 1990

Häufig gestellte Fragen

Warum AV1 in SPH konvertieren?

SPH (NIST Sphere) ist das Standardformat für Sprachforschungskorpora — verwendet von linguistischen Datensätzen wie TIMIT und Switchboard.

Was öffnet SPH-Dateien?

NIST-Sphere-Tools, Kaldi, HTK und SoX verarbeiten SPH-Dateien. Es ist Standard in der akademischen Sprach- und Sprachforschung.

Ist SPH dasselbe wie NIST?

SPH verwendet das NIST-Sphere-Header-Format — die Begriffe werden in Sprachforschungskontexten oft austauschbar verwendet.

Welche Abtastrate ist typisch?

Die meisten Sprachkorpora verwenden 8 kHz oder 16 kHz Mono — Standardraten für Telefonie- und Spracherkennungsdaten.

Ist die Konvertierung sicher?

AV1-Uploads werden sofort gelöscht. SPH-Ausgaben werden innerhalb von 24 Stunden entfernt.