MXF到SPH转换器

从MXF录制中提取NIST SPH语音数据

放置文件在这里. 1 GB 最大文件大小 或者 注册
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

研究标准

SPH是NIST语音研究的标准格式。从MXF中提取音频用于语言学分析和识别研究。

丰富元数据

SPHERE格式承载详细的录制元数据——为来自MXF源的语音研究提供有价值的上下文。

云端提取

MXF到SPH的提取在我们的服务器上运行——研究工作站上无需NIST工具。

如何转换MXF到SPH

1

从计算机,Google Drive,Dropbox,URL或在页面上拖拽选择文件.

2

选择sph或任何其他你需要的格式作为结果(支持超过200种格式)

3

让文件进行转换随后你可以下载你的sph文件

关于格式

MXF(素材交换格式)是由美国电影电视工程师协会(SMPTE)于2004年在SMPTE 377M规范下标准化的专业媒体容器。为广播和后期制作行业设计,MXF提供了一个厂商中立的封装器,用于在不同制作系统和平台之间传输视频、音频和丰富的描述性元数据。该格式支持广泛的专业编解码器,包括MPEG-2、AVC-Intra、DNxHD、DNxHR、ProRes和JPEG 2000,使其适用于从代理编辑到母版级归档的各种质量层级。丰富的元数据框架是MXF的核心特征之一,在结构化的键-长度-值(KLV)编码方案中承载时间码、片段名称、描述性标记、源引用和技术参数等制作信息。这些元数据随内容在制作链中传递,降低了文件在采集、编辑、图形、播出和归档系统之间移动时的信息丢失风险。MXF文件使用操作模式系统定义不同的复杂度级别,从简单的单项目包(OP1a)到复杂的多项目播放列表。主要广播设备制造商和基于文件的工作流系统普遍支持MXF,它也作为广播中使用的AS-02和AS-11等标准的交换格式。
首次发布: 2004
SPH 是 NIST SPHERE(SPeech HEader REsources,语音头资源)格式音频文件的扩展名,该标准由美国国家标准与技术研究院于 1990 年前后创建。SPH 文件专为语音研究而设计,包含一个 1024 字节的 ASCII 头部,其中填充了丰富的元数据 — 数据库标识、声道数、采样率、字节序和压缩类型 — 使每条录音都具有自描述性。底层音频通常为 16 kHz 采样的 16 位线性 PCM,但也允许其他配置。NIST、DARPA 及全球各大学的研究人员依赖 SPH 格式分发 TIMIT、Switchboard 和 LDC 语料库等语音数据集,这些数据集是现代自动语音识别系统的基础。一个关键优势是,人类可读的头部使得脚本无需二进制解码即可解析录音元数据。该格式严格的标准化也消除了跨机构、跨平台共享数据集时的歧义。由于 SPH 文件存储未压缩的 PCM,可完整保留音频保真度 — 这在训练声学模型时至关重要,因为即使微小的失真也可能影响结果。
首次发布: 1990

经常问的问题

为什么要将MXF转换为SPH?

SPHERE(SPH)是NIST语音研究的标准音频格式——对语言语料库和语音识别研究至关重要。

SPH文件用在哪里?

NIST语音评测活动、语言数据联盟语料库和语音识别研究使用SPH格式。

SPH广泛兼容吗?

SPH专用于语音研究。SOX、NIST工具和Kaldi语音识别工具包可处理SPH文件。

SPH包含什么元数据?

SPHERE头部包含丰富的录制条件、说话人信息和声道细节等元数据。

可以批量处理吗?

可以上传多个MXF文件,同时提取SPH音频,用于构建语音语料库。