VOB转NIST转换器

从DVD VOB文件在线创建NIST SPHERE音频

放置文件在这里. 1 GB 最大文件大小 或者 注册
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

符合标准

NIST SPHERE输出遵循美国国家标准与技术研究院规范 — 与ASR研究工具完全兼容。

VOB直接转NIST

一步从VOB DVD容器转为NIST语音音频。无需手动音频提取或中间格式。

基于浏览器

无需SPHERE工具包或DVD翻录软件。通过网络浏览器从任何设备将VOB转换为NIST。

如何转换VOB到NIST

1

从计算机,Google Drive,Dropbox,URL或在页面上拖拽选择文件.

2

选择nist或任何其他你需要的格式作为结果(支持超过200种格式)

3

让文件进行转换随后你可以下载你的nist文件

关于格式

VOB(Video Object,视频对象)是DVD-Video光盘上使用的主要容器格式,作为DVD论坛开发的DVD规范的一部分进行定义。该格式最早出现在1996年9月定稿的DVD标准中,此后已被用于全球生产的数十亿张DVD光盘。VOB文件基于MPEG-2节目流格式,包含复用的MPEG-2视频以及AC-3(杜比数字)、DTS、MPEG-1 Layer II或LPCM格式的音频。除音视频外,VOB文件还承载作为位图叠加层的DVD字幕流、用于菜单交互的导航数据和章节点信息。这些文件位于DVD光盘的VIDEO_TS目录中,命名规则(VTS_01_1.VOB等)反映了内容的标题和部分结构。为满足UDF文件系统要求,单个VOB文件限制在约1 GB,较长的内容跨越多个文件无缝衔接。该格式支持NTSC(720x480)和PAL(720x576)视频分辨率,音视频合计比特率最高9.8 Mbps。将视频、多音轨、字幕和导航集成到单个节目流中,使VOB成为消费级电影发行的完整解决方案。虽然流媒体和更新的光盘格式已在新内容方面取代了DVD,但VOB对于访问现有的庞大DVD内容库仍然极为重要。
开发者: DVD Forum
首次发布: 九月 1996
NIST SPHERE(SPeech HEader REsources,语音头资源)是由美国国家标准与技术研究院专门为语音研究而创建的音频文件格式,尤其适用于 DARPA 资助的项目。该格式使用结构化的 ASCII 头部将原始音频采样数据封装在一起,头部中编码了采样率、声道数、编码类型、说话人信息及转录标注等元数据,非常适合分发语音语料库。NIST 文件通常存储未压缩的 PCM 或 mu-law 音频,采样率为电话级别的 8 kHz 或 16 kHz,但容器格式本身足够灵活,可容纳多种编码方式。一个重要优势在于其丰富的自描述头部,研究人员可以将详细的语料库元数据直接嵌入文件中,无需额外的辅助文件。SPHERE 已成为 TIMIT、Switchboard 和 Fisher 等主要语音数据库的事实标准,在学术和政府实验室中获得广泛认可。其开放的规范以及配套的命令行工具(sphere、h_strip、w_decode)使得在语音处理流水线中转换、检查和处理这些文件十分便捷。
首次发布: 1990

经常问的问题

为什么要将VOB转换为NIST?

NIST SPHERE是分发语音研究音频的基准格式。DVD VOB对话可成为ASR开发的标准化数据。

NIST与WAV有何不同?

NIST SPHERE用结构化元数据包装PCM音频,用于语音语料库管理。WAV缺少这些面向研究的头信息。

DVD音频质量会保留吗?

NIST以无压缩PCM存储。从VOB提取的音频以完整质量到达NIST格式,用于精确识别工作。

什么工具接受NIST文件?

Kaldi、HTK、NIST SPHERE工具包和大多数学术语音研究平台直接使用NIST格式的音频。

可以转换整张DVD吗?

上传多个VOB章节并批量转换为NIST。从整个DVD集合构建综合语音数据集。