Convertisseur AV1 en SPH

Extrayez l'audio NIST Sphere d'une vidéo AV1 en ligne

Déposer les fichiers ici. 1 GB taille maximale de fichier ou Inscription
en
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Standard recherche vocale

SPH est le format des principaux corpus vocaux — la conversion depuis AV1 prépare l'audio pour la recherche et l'analyse linguistiques.

Compatible avec les corpus

Les fichiers SPH s'intègrent aux outils standard de recherche vocale comme Kaldi, HTK et les utilitaires de scoring NIST.

Fichiers privés

Les fichiers AV1 importés sont effacés juste après la conversion, et les sorties SPH sont supprimées sous 24 heures.

Comment convertir un fichier AV1 en fichier SPH

1

Sélectionnez des fichiers depuis l'ordinateur, Google Drive, Dropbox, une URL ou glissez-les sur la page.

2

Choisissez sph ou tout autre format de sortie (plus de 200 formats supportés)

3

Laissez le fichier convertir et vous pourrez télécharger votre fichier sph juste après

À propos des formats

L'AV1 (AOMedia Vidéo 1) est un format de codage vidéo ouvert et libre de redevances développé par l'Alliance for Open Média, un consortium dont les membres fondateurs incluent Google, Mozilla, Microsoft, Amazon, Netflix et Intel, entre autres. La spécification a été finalisée en juin 2018 avec l'objectif de fournir un codec vidéo de nouvelle génération surpassant l'efficacité de compression du H.264 et du HEVC tout en restant exempt de frais de licence. L'AV1 atteint environ 30 à 50 % de meilleure compression que le HEVC à qualité visuelle equivalente, ce qui le rend particulièrement attractif pour les plateformes de streaming cherchant à réduire les couts de bande passante sans sacrifier l'expérience du spectateur. Le codec prend en chargé un large éventail de fonctionnalités incluant la synthèse de grain de film, le tuilage flexible pour le traitement parallèle, la commutation adaptative de résolution au contenu et un riche ensemble de modes de prediction intra et inter. La prisé en chargé du décodage matériel s'est rapidement étendue àux processeurs mobiles, GPU et televiseurs connectes, repondant àux preoccupations initiales concernant les exigences computationnelles lors de l'encodage. L'AV1 a connu une large adoption par les principaux services de streaming pour la diffusion de contenu 4K et HDR, et il sert de composant vidéo du conteneur WebM pour la lecture web. Son statut libre de redevances rend l'AV1 particulièrement important pour les standards du web ouvert et la distribution de médias accessibles.
Date de sortie initiale: 25 juin 2018
Le SPH est l'extension de fichier pour l'audio stocké dans le format NIST SPHERE (SPeech HEader REsources), un standard crée par le National Institute of Standards and Technology americain vers 1990. Conçu pour la recherché en parole, les fichiers SPH comportent un en-tête ASCII de 1024 octets riche en métadonnées — identifiants de basé de données, nombre de canaux, frequences d'échantillonnage, ordre dès octets et type de compression — rendant chaque enregistrement auto-descriptif. L'audio sous-jacent est typiquement du PCM linéaire 16 bits echantillonne à 16 kHz, bien que d'autres configurations soient autorisees. Les chercheurs du NIST, de la DARPA et dès universites du monde entier s'appuient sûr le SPH pour distribuer dès corpus de parole tels que TIMIT, Switchboard et les collections du LDC qui sous-tendent les systèmes modernes de reconnaissance automatique de la parole. Un avantage clé est que l'en-tête lisible par l'homme permet àux scripts d'analyser les métadonnées d'enregistrement sans décodage binaire. La standardisation stricte du format élimine également toute ambiguite lors du partagé de jeux de données entre institutions et plateformes. Comme les fichiers SPH stockent du PCM non compressé, ils préservent la pleine fidélité audio — essentiel lors de l'entrainement de modèles acoustiques où même de petits artéfacts peuvent fausser les résultats.
Date de sortie initiale: 1990

Questions fréquemment posées

Pourquoi convertir AV1 en SPH ?

SPH (NIST Sphere) est le format standard pour les corpus de recherche vocale — utilisé par des jeux de données linguistiques comme TIMIT et Switchboard.

Quels programmes ouvrent les fichiers SPH ?

Les outils NIST Sphere, Kaldi, HTK et SoX gèrent les fichiers SPH. Il est standard dans la recherche académique en parole et langage.

SPH est-il identique à NIST ?

SPH utilise le format d'en-tête NIST Sphere — les termes sont souvent utilisés de manière interchangeable dans les contextes de recherche vocale.

Quel taux d'échantillonnage est typique ?

La plupart des corpus vocaux utilisent 8 kHz ou 16 kHz mono — taux standard pour les données de téléphonie et de reconnaissance vocale.

La conversion est-elle sécurisée ?

Les fichiers AV1 importés sont supprimés immédiatement. Les sorties SPH sont effacées sous 24 heures.