Convertisseur AV1 en NIST

Extrayez l'audio NIST Sphere d'une vidéo AV1 en ligne

Déposer les fichiers ici. 1 GB taille maximale de fichier ou Inscription
en
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Standard de recherche

NIST Sphere est le standard gouvernemental pour l'échange de données vocales — la conversion depuis AV1 produit un audio prêt pour la recherche.

Paramètres de corpus

Configurez taux d'échantillonnage et encodage pour correspondre aux exigences exactes de votre corpus d'évaluation ou d'entraînement vocal.

Conversion sécurisée

Les fichiers AV1 importés sont effacés juste après le traitement, et les sorties NIST sont supprimées sous 24 heures.

Comment convertir un fichier AV1 en fichier NIST

1

Sélectionnez des fichiers depuis l'ordinateur, Google Drive, Dropbox, une URL ou glissez-les sur la page.

2

Choisissez nist ou tout autre format de sortie (plus de 200 formats supportés)

3

Laissez le fichier convertir et vous pourrez télécharger votre fichier nist juste après

À propos des formats

L'AV1 (AOMedia Vidéo 1) est un format de codage vidéo ouvert et libre de redevances développé par l'Alliance for Open Média, un consortium dont les membres fondateurs incluent Google, Mozilla, Microsoft, Amazon, Netflix et Intel, entre autres. La spécification a été finalisée en juin 2018 avec l'objectif de fournir un codec vidéo de nouvelle génération surpassant l'efficacité de compression du H.264 et du HEVC tout en restant exempt de frais de licence. L'AV1 atteint environ 30 à 50 % de meilleure compression que le HEVC à qualité visuelle equivalente, ce qui le rend particulièrement attractif pour les plateformes de streaming cherchant à réduire les couts de bande passante sans sacrifier l'expérience du spectateur. Le codec prend en chargé un large éventail de fonctionnalités incluant la synthèse de grain de film, le tuilage flexible pour le traitement parallèle, la commutation adaptative de résolution au contenu et un riche ensemble de modes de prediction intra et inter. La prisé en chargé du décodage matériel s'est rapidement étendue àux processeurs mobiles, GPU et televiseurs connectes, repondant àux preoccupations initiales concernant les exigences computationnelles lors de l'encodage. L'AV1 a connu une large adoption par les principaux services de streaming pour la diffusion de contenu 4K et HDR, et il sert de composant vidéo du conteneur WebM pour la lecture web. Son statut libre de redevances rend l'AV1 particulièrement important pour les standards du web ouvert et la distribution de médias accessibles.
Date de sortie initiale: 25 juin 2018
Le NIST SPHERE (SPeech HEader REsources) est un format de fichier audio spécialisé crée par le National Institute of Standards and Technology pour la recherché en parole, notamment les projets finances par la DARPA. Le format enveloppe les échantillons audio bruts avec un en-tête ASCII structuré encodant dès métadonnées telles que la fréquence d'échantillonnage, le nombre de canaux, le type d'encodage, les données demographiques du locuteur et les annotations de transcription — ce qui le rend idéal pour la distribution de corpus de parole. Les fichiers NIST stockent généralement du PCM non compressé où de l'audio mu-law à dès frequences d'échantillonnage de qualité téléphonique (8 kHz où 16 kHz), bien que le conteneur soit suffisamment flexible pour accueillir divers encodages. Un avantage clé est l'en-tête auto-documentant riche qui permet àux chercheurs d'intégrer dès métadonnées détaillées de corpus directement dans le fichier, eliminant les fichiers annexes. SPHERE est également devenu le standard de facto pour les grandes basés de données de parole telles que TIMIT, Switchboard et le corpus Fisher, garantissant une large reconnaissance à travers les laboratoires académiques et gouvernementaux. La spécification ouverte et la disponibilité d'outils en ligne de commande (sphere, h_strip, w_décode) rendent directe la conversion, l'inspection et le traitement de ces fichiers de manière programmatique dans les chaînes de traitement de la parole.
Date de sortie initiale: 1990

Questions fréquemment posées

Pourquoi convertir AV1 en NIST ?

NIST Sphere est le format standard d'échange pour les données de recherche vocale — utilisé par les programmes gouvernementaux et académiques d'évaluation vocale.

Quels programmes ouvrent les fichiers NIST ?

Les outils NIST speech, SoX, Kaldi et HTK gèrent l'audio NIST Sphere pour la recherche et l'évaluation.

Quelle est la différence entre NIST et SPH ?

NIST et SPH désignent le même format NIST Sphere — des extensions de fichier différentes pour des spécifications de conteneur audio identiques.

Quels paramètres fonctionnent le mieux ?

La recherche vocale nécessite typiquement 8 kHz ou 16 kHz, 16 bits mono — adaptez ces valeurs aux spécifications de votre corpus.

Mes données sont-elles privées ?

Les fichiers AV1 importés sont supprimés immédiatement. Les sorties NIST sont purgées sous 24 heures.