AVI到NIST转换器

在线从AVI视频中提取音频并转为NIST SPHERE格式

放置文件在这里. 1 GB 最大文件大小 或者 注册
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

标准合规

输出完全遵循NIST SPHERE规格。AVI音频以正确的头信息封装,可直接用于语音研究工作流程。

无需安装

直接在浏览器中将AVI转换为NIST — 无需下载SPHERE工具包。上传、转换并获取研究音频文件。

安全数据处理

上传的AVI视频在转换后删除。NIST输出文件在24小时内移除 — 您的语音数据保持机密。

如何转换AVI到NIST

1

从计算机,Google Drive,Dropbox,URL或在页面上拖拽选择文件.

2

选择nist或任何其他你需要的格式作为结果(支持超过200种格式)

3

让文件进行转换随后你可以下载你的nist文件

关于格式

AVI(Audio Video Interleave,音频视频交错)是最古老且最知名的多媒体容器格式之一,由Microsoft于1992年11月作为Video for Windows技术的一部分推出。基于资源交换文件格式(RIFF)结构构建,AVI将音频和视频数据以交替块的形式交错排列,实现同步播放而无需复杂的流管理机制。该格式与编解码器无关,意味着它可以容纳几乎任何编解码器压缩的视频,从早期的Cinepak和Indeo到现代的DivX、Xvid和H.264流。这种灵活性促成了它在整个1990年代和2000年代个人电脑上的广泛普及。一个显著特点是其简洁的内部结构,与更复杂的现代容器相比,AVI文件在二进制层面上相对容易编辑和处理。AVI还支持多个音频流,可在单个文件中包含多语言内容。然而,原始规范存在局限性,包括早期实现中2 GB的文件大小上限,以及不原生支持可变帧率或高级字幕格式。OpenDML扩展(AVI 2.0)通过允许文件超出原始限制解决了大小问题。尽管已有数十年历史,AVI仍然是最被广泛认可的多媒体格式之一,在所有主要操作系统的媒体播放器和编辑工具中仍获得广泛支持。
开发者: Microsoft
首次发布: 1992年11月10日
NIST SPHERE(SPeech HEader REsources,语音头资源)是由美国国家标准与技术研究院专门为语音研究而创建的音频文件格式,尤其适用于 DARPA 资助的项目。该格式使用结构化的 ASCII 头部将原始音频采样数据封装在一起,头部中编码了采样率、声道数、编码类型、说话人信息及转录标注等元数据,非常适合分发语音语料库。NIST 文件通常存储未压缩的 PCM 或 mu-law 音频,采样率为电话级别的 8 kHz 或 16 kHz,但容器格式本身足够灵活,可容纳多种编码方式。一个重要优势在于其丰富的自描述头部,研究人员可以将详细的语料库元数据直接嵌入文件中,无需额外的辅助文件。SPHERE 已成为 TIMIT、Switchboard 和 Fisher 等主要语音数据库的事实标准,在学术和政府实验室中获得广泛认可。其开放的规范以及配套的命令行工具(sphere、h_strip、w_decode)使得在语音处理流水线中转换、检查和处理这些文件十分便捷。
首次发布: 1990

经常问的问题

为什么要将AVI转换为NIST?

NIST SPHERE是语音研究数据集的标准格式。将AVI音频提取为NIST使视频对话可用于识别系统。

什么能读取NIST文件?

NIST SPHERE工具包、Kaldi ASR框架和HTK都原生支持NIST音频。SOX也能读写此格式。

NIST与WAV有什么区别?

NIST SPHERE包含WAV所没有的丰富头信息元数据,用于语音语料库管理。两者都存储PCM音频,但NIST面向研究流程。

音频质量能保持吗?

NIST无压缩存储PCM数据,因此从AVI提取的音频保持完整质量。转换过程中不应用有损编码。

能处理长视频吗?

我们的服务器可处理各种时长的AVI文件。较长的视频按比例需要更多时间,但转换保持稳定可靠。