MPEG to NIST Converter

NIST-SPHERE-Audio aus MPEG-Videodateien online erstellen

Dateien hierhin und ablegen. 1 GB maximale dateigröße oder Registrieren
in
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Standards-konform

NIST-SPHERE-Ausgabe folgt den Spezifikationen des National Institute of Standards and Technology — kompatibel mit allen großen ASR-Forschungsrahmen.

MPEG zu NIST direkt

Gehen Sie von MPEG-Video zu NIST-Sprach-Audio in einem Schritt. Keine manuelle Audio-Extraktion oder Zwischenformat-Konvertierung erforderlich.

Browserbasiert

Keine SPHERE-Toolkit- oder MPEG-Decoder lokal nötig. Konvertieren Sie MPEG in NIST über Ihren Webbrowser auf jedem Gerät oder Plattform.

Wie man MPEG in NIST konvertiert

1

Wählen Sie Dateien vom Computer, Google Drive, Dropbox, einer URL oder durch Ziehen auf die Seite.

2

Wählen Sie nist oder irgendein anderes Format, das Sie als Ergebnis haben wollen (mehr als 200 Formate unterstützt)

3

Lassen Sie die Datei konvertieren und Sie können Ihre nist-Datei direkt danach herunterladen

Über die Formate

MPEG (MPEG-1) ist ein grundlegender Video- und Audiokompressionsstandard, der im August 1993 von der Moving Picture Experts Group als ISO/IEC 11172 veröffentlicht wurde. Es war der erste internationale Standard für die verlustbehaftete Kompression bewegter Bilder und zugehöriger Audiodaten und etablierte Prinzipien und Techniken, die praktisch alle nachfolgenden Videocodecs beeinflussten. MPEG-1-Video erreicht Kompression durch eine Kombination aus bewegungskompensierter Vorhersage, diskreter Kosinustransformation und variabler Längen-Entropiekodierung, organisiert um drei Frame-Typen: I-Frames (intra-kodiert), P-Frames (prädiziert) und B-Frames (bidirektional prädiziert). Der Standard zielt auf Bitraten von etwa 1,5 Mbps für kombiniertes Audio und Video ab und erzeugt Qualität vergleichbar mit VHS-Band bei SIF-Auflösung (352x240 für NTSC). Diese Kompressionsstufe wurde gezielt gewählt, um dem Datendurchsatz von 1x-CD-ROM-Laufwerken zu entsprechen, was das Video CD-Format ermöglichte, das digitales Video in den frühen 1990er Jahren zu den Verbrauchern brachte. Die Audiokomponente, insbesondere Layer III (MP3), wurde zum einflussreichsten Audioformat der Geschichte. Die I/P/B-Frame-Struktur, der Bewegungsschätzungsansatz und die blockbasierte Transformationskodierung schufen die architektonische Vorlage, der jeder bedeutende Videocodec seitdem folgt — von MPEG-2 über H.264 und darüber hinaus. Obwohl in der Kompressionseffizienz längst überholt, wird MPEG-1 von praktisch jeder Mediensoftware weiterhin unterstützt.
Erstveröffentlichung: August 1993
NIST SPHERE (SPeech HEader REsources) ist ein spezialisiertes Audiodateiformat, das vom National Institute of Standards and Technology für die Sprachforschung entwickelt wurde, insbesondere für DARPA-geförderte Projekte. Das Format umhüllt rohe Audiosamples mit einem strukturierten ASCII-Header, der Metadaten wie Abtastrate, Kanalanzahl, Kodierungstyp, Sprecherdemografie und Transkriptionsannotationen enthält — ideal für die Verteilung von Sprachkorpora. NIST-Dateien speichern typischerweise unkomprimiertes PCM oder Mu-Law-Audio bei Telefonie-Abtastraten (8 kHz oder 16 kHz), obwohl der Container flexibel genug für verschiedene Kodierungen ist. Ein wesentlicher Vorteil ist der reichhaltige, selbstbeschreibende Header, der es Forschern ermöglicht, detaillierte Korpus-Metadaten direkt in die Datei einzubetten und so Begleitdateien überflüssig zu machen. SPHERE hat sich zudem als De-facto-Standard für bedeutende Sprachdatenbanken wie TIMIT, Switchboard und das Fisher-Korpus etabliert und genießt breite Anerkennung in akademischen und staatlichen Laboren. Die offene Spezifikation und die Verfügbarkeit von Kommandozeilentools (sphere, h_strip, w_decode) machen es unkompliziert, diese Dateien in Sprachverarbeitungspipelines programmatisch zu konvertieren, zu inspizieren und zu verarbeiten.
Erstveröffentlichung: 1990

Häufig gestellte Fragen

Warum MPEG in NIST umwandeln?

NIST SPHERE ist das Benchmark-Format für die Distribution von Sprachdaten. MPEG-Video-Dialog wird zu standardisiertem Audio für Erkennungsforschung.

Wie unterscheidet sich NIST von SPH?

Es ist dasselbe Format — SPHERE vom National Institute of Standards and Technology. NIST und SPH sind austauschbare Endungen.

Unterstützt NIST MPEG-Qualität?

NIST speichert PCM ohne Kompression. Audio aus MPEG wird in voller Qualität bewahrt, unabhängig von der originalen MPEG-Kodierung.

Welche ASR-Tools akzeptieren NIST?

Kaldi, HTK, NIST-Evaluierungsrahmen und die meisten akademischen Sprachlabore arbeiten mit NIST-SPHERE-Audio als Standard-Eingabeformat.

Ist Stapelverarbeitung verfügbar?

Ja — laden Sie mehrere MPEG-Videos hoch und konvertieren Sie alle auf einmal in NIST. Praktisch zum Aufbau von Korpora aus Video-Archiven.