AV1转NIST转换器

从AV1视频在线提取NIST Sphere音频

放置文件在这里. 1 GB 最大文件大小 或者 注册
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

研究标准

NIST Sphere是政府语音数据交换标准 — 从AV1转换可生成研究就绪的音频。

语料库设置

配置采样率和编码以匹配语音评估或训练语料库的精确要求。

安全转换

AV1上传文件在处理后立即删除,NIST输出将在24小时内清除。

如何转换AV1到NIST

1

从计算机,Google Drive,Dropbox,URL或在页面上拖拽选择文件.

2

选择nist或任何其他你需要的格式作为结果(支持超过200种格式)

3

让文件进行转换随后你可以下载你的nist文件

关于格式

AV1(AOMedia Video 1)是由开放媒体联盟开发的开放、免版税视频编码格式,该联盟的创始成员包括Google、Mozilla、Microsoft、Amazon、Netflix和Intel等。规范于2018年6月最终确定,目标是提供超越H.264和HEVC压缩效率的下一代视频编解码器,同时完全免除授权费用。AV1在同等视觉质量下比HEVC实现约30-50%的压缩率提升,对于希望在不牺牲观看体验的前提下降低带宽成本的流媒体平台尤其具有吸引力。该编解码器支持广泛的功能,包括胶片颗粒合成、灵活的分片并行处理、内容自适应分辨率切换,以及丰富的帧内和帧间预测模式。硬件解码支持在移动处理器、GPU和智能电视上迅速扩展,解决了早期编码计算需求方面的顾虑。AV1已被主要流媒体服务广泛采用,用于提供4K和HDR内容,并作为WebM容器的视频组件用于基于网页的播放。免版税的特性使AV1对开放网络标准和可访问的媒体分发尤为重要。
首次发布: 2018年6月25日
NIST SPHERE(SPeech HEader REsources,语音头资源)是由美国国家标准与技术研究院专门为语音研究而创建的音频文件格式,尤其适用于 DARPA 资助的项目。该格式使用结构化的 ASCII 头部将原始音频采样数据封装在一起,头部中编码了采样率、声道数、编码类型、说话人信息及转录标注等元数据,非常适合分发语音语料库。NIST 文件通常存储未压缩的 PCM 或 mu-law 音频,采样率为电话级别的 8 kHz 或 16 kHz,但容器格式本身足够灵活,可容纳多种编码方式。一个重要优势在于其丰富的自描述头部,研究人员可以将详细的语料库元数据直接嵌入文件中,无需额外的辅助文件。SPHERE 已成为 TIMIT、Switchboard 和 Fisher 等主要语音数据库的事实标准,在学术和政府实验室中获得广泛认可。其开放的规范以及配套的命令行工具(sphere、h_strip、w_decode)使得在语音处理流水线中转换、检查和处理这些文件十分便捷。
首次发布: 1990

经常问的问题

为什么要将AV1转换为NIST?

NIST Sphere是语音研究数据的标准交换格式 — 用于政府和学术语音评估项目。

用什么打开NIST文件?

NIST语音工具、SoX、Kaldi和HTK可处理NIST Sphere音频用于研究和评估。

NIST和SPH有什么区别?

NIST和SPH指同一NIST Sphere格式 — 是同一音频容器规格的不同文件扩展名。

什么设置最佳?

语音研究通常需要8 kHz或16 kHz、16位单声道 — 匹配您的语料库规格。

我的数据是私密的吗?

AV1上传文件立即删除。NIST输出将在24小时内清除。