MPEG to SPH Converter

MPEG-Audio als NIST-SPHERE-Sprachformat online extrahieren

Dateien wählen

Dateien hierhin und ablegen. 1 GB maximale dateigröße oder Registrieren

Video zu Sprach-Korpus

Extrahieren Sie Dialog aus MPEG-Video und verpacken es als NIST SPHERE — ohne manuelle Extraktion beim Aufbau von Sprach-Forschungsdatensätzen.

NIST-Standard

SPH-Ausgabe erfüllt NIST-SPHERE-Spezifikationen exakt. Importieren Sie direkt in Kaldi, HTK oder jedes Spracherkennungs-Framework.

Sichere Handhabung

MPEG-Uploads werden nach der Konvertierung entfernt. SPH-Ausgabedateien werden innerhalb von 24 Stunden gelöscht — Ihre Forschungsmaterialien bleiben vertraulich.

Wie man MPEG in SPH konvertiert

Wählen Sie Dateien vom Computer, Google Drive, Dropbox, einer URL oder durch Ziehen auf die Seite.

Wählen Sie sph oder irgendein anderes Format, das Sie als Ergebnis haben wollen (mehr als 200 Formate unterstützt)

Lassen Sie die Datei konvertieren und Sie können Ihre sph-Datei direkt danach herunterladen

Über die Formate

MPEG (MPEG-1) ist ein grundlegender Video- und Audiokompressionsstandard, der im August 1993 von der Moving Picture Experts Group als ISO/IEC 11172 veröffentlicht wurde. Es war der erste internationale Standard für die verlustbehaftete Kompression bewegter Bilder und zugehöriger Audiodaten und etablierte Prinzipien und Techniken, die praktisch alle nachfolgenden Videocodecs beeinflussten. MPEG-1-Video erreicht Kompression durch eine Kombination aus bewegungskompensierter Vorhersage, diskreter Kosinustransformation und variabler Längen-Entropiekodierung, organisiert um drei Frame-Typen: I-Frames (intra-kodiert), P-Frames (prädiziert) und B-Frames (bidirektional prädiziert). Der Standard zielt auf Bitraten von etwa 1,5 Mbps für kombiniertes Audio und Video ab und erzeugt Qualität vergleichbar mit VHS-Band bei SIF-Auflösung (352x240 für NTSC). Diese Kompressionsstufe wurde gezielt gewählt, um dem Datendurchsatz von 1x-CD-ROM-Laufwerken zu entsprechen, was das Video CD-Format ermöglichte, das digitales Video in den frühen 1990er Jahren zu den Verbrauchern brachte. Die Audiokomponente, insbesondere Layer III (MP3), wurde zum einflussreichsten Audioformat der Geschichte. Die I/P/B-Frame-Struktur, der Bewegungsschätzungsansatz und die blockbasierte Transformationskodierung schufen die architektonische Vorlage, der jeder bedeutende Videocodec seitdem folgt — von MPEG-2 über H.264 und darüber hinaus. Obwohl in der Kompressionseffizienz längst überholt, wird MPEG-1 von praktisch jeder Mediensoftware weiterhin unterstützt.

Entwickler: Moving Picture Experts Group

Erstveröffentlichung: August 1993

SPH ist die Dateierweiterung für Audio im NIST SPHERE-Format (SPeech HEader REsources), einem Standard, der um 1990 vom U.S. National Institute of Standards and Technology entwickelt wurde. Für die Sprachforschung konzipiert, enthalten SPH-Dateien einen 1024-Byte-ASCII-Header mit umfangreichen Metadaten — Datenbankkennungen, Kanalzahlen, Abtastraten, Bytereihenfolge und Kompressionstyp — sodass jede Aufnahme sich selbst beschreibt. Das zugrunde liegende Audio ist typischerweise 16-Bit-lineares PCM mit 16 kHz Abtastrate, obwohl andere Konfigurationen zulässig sind. Forscher am NIST, bei der DARPA und an Universitäten weltweit setzen auf SPH für die Verteilung von Sprachkorpora wie TIMIT, Switchboard und den LDC-Sammlungen, die modernen Spracherkennungssystemen zugrunde liegen. Ein wesentlicher Vorteil ist, dass der menschenlesbare Header es Skripten ermöglicht, Aufnahme-Metadaten ohne binäre Dekodierung zu parsen. Die strikte Standardisierung eliminiert zudem Mehrdeutigkeiten beim Austausch von Datensätzen zwischen Institutionen und Plattformen. Da SPH-Dateien unkomprimiertes PCM speichern, bewahren sie die volle Audioklangtreü — entscheidend beim Training akustischer Modelle, bei denen selbst kleine Artefakte die Ergebnisse verfälschen können.

Entwickler: National Institute of Standards and Technology

Erstveröffentlichung: 1990

Häufig gestellte Fragen

Warum MPEG in SPH umwandeln?

SPH ist der NIST-SPHERE-Standard für Sprachforschung. MPEG-Video-Dialog wird zu korrekt formatierten Daten für ASR-Training und -Evaluierung.

Welche Tools verarbeiten SPH?

Kaldi, HTK, Praat und das NIST-SPHERE-Toolkit unterstützen SPH nativ. Es ist das Standard-Austauschformat für Sprach-Audio-Forschung.

Komprimiert SPH das Audio?

Nein — SPH speichert PCM-Daten ohne verlustbehaftete Kompression. MPEG-Audio erreicht das SPHERE-Format in voller Qualität für genaue Sprachverarbeitung.

Reicht MPEG-1-Audio aus?

MPEG-1-Audio bietet ausreichende Qualität für Sprachforschung. Dialog-Inhalte werden durch den Extraktions- und SPH-Kodierungsprozess gut bewahrt.

Kann ich viele MPEG-Dateien konvertieren?

Laden Sie mehrere MPEG-Videos hoch und konvertieren Sie im Stapel zu SPH. Effizient für den Aufbau von Sprach-Korpora aus archivierten MPEG-Video-Sammlungen.

Spezifische Converter

MP3 in SPH

WAV in SPH

MP4 in SPH

ASF in SPH

FLAC in SPH

M4A in SPH

OGG in SPH

SWF in SPH

WVE in SPH

3G2 in SPH

3GP in SPH

AAF in SPH

AV1 in SPH

AVCHD in SPH

AVI in SPH

CAVS in SPH

DIVX in SPH

DV in SPH

F4V in SPH

FLV in SPH

HEVC in SPH

M2TS in SPH

M2V in SPH

M4V in SPH

MJPEG in SPH

MKV in SPH

MOD in SPH

MOV in SPH

MPEG in SPH

MPEG-2 in SPH