MXF到SPH转换器

从MXF录制中提取NIST SPH语音数据

选择文件

放置文件在这里. 1 GB 最大文件大小或者注册

到

研究标准

SPH是NIST语音研究的标准格式。从MXF中提取音频用于语言学分析和识别研究。

丰富元数据

SPHERE格式承载详细的录制元数据——为来自MXF源的语音研究提供有价值的上下文。

云端提取

MXF到SPH的提取在我们的服务器上运行——研究工作站上无需NIST工具。

如何转换MXF到SPH

从计算机，Google Drive，Dropbox，URL或在页面上拖拽选择文件.

选择sph或任何其他你需要的格式作为结果（支持超过200种格式）

让文件进行转换随后你可以下载你的sph文件

关于格式

MXF（素材交换格式）是由美国电影电视工程师协会（SMPTE）于2004年在SMPTE 377M规范下标准化的专业媒体容器。为广播和后期制作行业设计，MXF提供了一个厂商中立的封装器，用于在不同制作系统和平台之间传输视频、音频和丰富的描述性元数据。该格式支持广泛的专业编解码器，包括MPEG-2、AVC-Intra、DNxHD、DNxHR、ProRes和JPEG 2000，使其适用于从代理编辑到母版级归档的各种质量层级。丰富的元数据框架是MXF的核心特征之一，在结构化的键-长度-值（KLV）编码方案中承载时间码、片段名称、描述性标记、源引用和技术参数等制作信息。这些元数据随内容在制作链中传递，降低了文件在采集、编辑、图形、播出和归档系统之间移动时的信息丢失风险。MXF文件使用操作模式系统定义不同的复杂度级别，从简单的单项目包（OP1a）到复杂的多项目播放列表。主要广播设备制造商和基于文件的工作流系统普遍支持MXF，它也作为广播中使用的AS-02和AS-11等标准的交换格式。

开发者: Society of Motion Picture and Television Engineers

首次发布: 2004

SPH 是 NIST SPHERE(SPeech HEader REsources,语音头资源)格式音频文件的扩展名,该标准由美国国家标准与技术研究院于 1990 年前后创建。SPH 文件专为语音研究而设计,包含一个 1024 字节的 ASCII 头部,其中填充了丰富的元数据 — 数据库标识、声道数、采样率、字节序和压缩类型 — 使每条录音都具有自描述性。底层音频通常为 16 kHz 采样的 16 位线性 PCM,但也允许其他配置。NIST、DARPA 及全球各大学的研究人员依赖 SPH 格式分发 TIMIT、Switchboard 和 LDC 语料库等语音数据集,这些数据集是现代自动语音识别系统的基础。一个关键优势是,人类可读的头部使得脚本无需二进制解码即可解析录音元数据。该格式严格的标准化也消除了跨机构、跨平台共享数据集时的歧义。由于 SPH 文件存储未压缩的 PCM,可完整保留音频保真度 — 这在训练声学模型时至关重要,因为即使微小的失真也可能影响结果。

开发者: National Institute of Standards and Technology

首次发布: 1990

经常问的问题

为什么要将MXF转换为SPH？

SPHERE（SPH）是NIST语音研究的标准音频格式——对语言语料库和语音识别研究至关重要。

SPH文件用在哪里？

NIST语音评测活动、语言数据联盟语料库和语音识别研究使用SPH格式。

SPH广泛兼容吗？

SPH专用于语音研究。SOX、NIST工具和Kaldi语音识别工具包可处理SPH文件。

SPH包含什么元数据？

SPHERE头部包含丰富的录制条件、说话人信息和声道细节等元数据。

可以批量处理吗？

可以上传多个MXF文件，同时提取SPH音频，用于构建语音语料库。

特定转换器

MP3 为 SPH

WAV 为 SPH

MP4 为 SPH

ASF 为 SPH

FLAC 为 SPH

M4A 为 SPH

OGG 为 SPH

SWF 为 SPH

WVE 为 SPH

3G2 为 SPH

3GP 为 SPH

AAF 为 SPH

AV1 为 SPH

AVCHD 为 SPH

AVI 为 SPH

CAVS 为 SPH

DIVX 为 SPH

DV 为 SPH

F4V 为 SPH

FLV 为 SPH

HEVC 为 SPH

M2TS 为 SPH

M2V 为 SPH

M4V 为 SPH

MJPEG 为 SPH

MKV 为 SPH

MOD 为 SPH

MOV 为 SPH

MPEG 为 SPH

MPEG-2 为 SPH