MOV 转 NIST 转换器

在线从MOV视频中提取NIST音频

放置文件在这里. 1 GB 最大文件大小 或者 注册
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

QuickTime转语音数据

从MOV视频中提取对话并打包为NIST SPHERE——语音语料库分发和ASR训练的基准格式。

任何平台

所有处理均在服务器上完成。上传MOV即可获得NIST文件,无需在设备上安装任何软件。

数据安全

上传的MOV文件在转换后立即删除。NIST下载文件在24小时内从服务器移除。

如何转换MOV到NIST

1

从计算机,Google Drive,Dropbox,URL或在页面上拖拽选择文件.

2

选择nist或任何其他你需要的格式作为结果(支持超过200种格式)

3

让文件进行转换随后你可以下载你的nist文件

关于格式

MOV是由Apple Inc.开发的多媒体容器格式,于1991年12月随QuickTime多媒体框架发布。作为QuickTime的原生格式,MOV开创了许多后来影响ISO基础媒体文件格式(MPEG-4 Part 12)及其衍生格式(包括MP4)的概念。该容器使用分层的atom(或box)结构,每个atom存放特定类型的数据——从视频和音频轨道到元数据、文本和时间码信息。MOV支持极其广泛的编解码器,包括H.264、HEVC、ProRes、Apple Intermediate Codec、AAC和PCM等。这种编解码器灵活性加上多轨道支持、引用影片和编辑列表等功能,使MOV成为专业视频制作的核心格式。Apple的ProRes编解码器通常封装在MOV容器中,是后期制作和广播精编的行业标准。该格式能够同等出色地处理压缩的交付级内容和高码率的制作级素材。精确的时间码和元数据处理使MOV在需要帧精确编辑和制作工具间可靠交换的工作流中特别受重视。MOV在所有Apple平台上原生支持,并在所有操作系统的专业编辑软件中获得广泛认可,在数十年的视频技术演进中始终保持其重要地位。
开发者: Apple Inc.
首次发布: 1991年12月2日
NIST SPHERE(SPeech HEader REsources,语音头资源)是由美国国家标准与技术研究院专门为语音研究而创建的音频文件格式,尤其适用于 DARPA 资助的项目。该格式使用结构化的 ASCII 头部将原始音频采样数据封装在一起,头部中编码了采样率、声道数、编码类型、说话人信息及转录标注等元数据,非常适合分发语音语料库。NIST 文件通常存储未压缩的 PCM 或 mu-law 音频,采样率为电话级别的 8 kHz 或 16 kHz,但容器格式本身足够灵活,可容纳多种编码方式。一个重要优势在于其丰富的自描述头部,研究人员可以将详细的语料库元数据直接嵌入文件中,无需额外的辅助文件。SPHERE 已成为 TIMIT、Switchboard 和 Fisher 等主要语音数据库的事实标准,在学术和政府实验室中获得广泛认可。其开放的规范以及配套的命令行工具(sphere、h_strip、w_decode)使得在语音处理流水线中转换、检查和处理这些文件十分便捷。
首次发布: 1990

经常问的问题

为什么要将MOV转换为NIST?

NIST SPHERE是语音研究音频的基准格式。将MOV对话提取为NIST可创建格式规范的ASR训练数据。

什么程序可以打开/播放NIST文件?

Kaldi、HTK、NIST SPHERE工具包和大多数学术ASR平台可直接处理NIST格式的语音音频文件。

MOV是好的语音源吗?

Apple设备的MOV通常有干净的音频采集。这使得QuickTime录音成为语音研究数据集的良好源材料。

NIST会压缩音频吗?

不会——NIST存储无损压缩的PCM。MOV音频以完整质量传输到SPHERE格式,可用于精确的语音分析。

NIST和SPH有什么区别?

NIST和SPH是相同格式——美国国家标准与技术研究院的SPHERE。文件扩展名可以互换使用。