CVU naar NIST converter
Converteer online gratis uw cvu- naar nist-bestanden
cvu
nist
Hoe converteert u een CVU naar NIST
Selecteer bestanden van Computer, Google Drive, Dropbox, URL of door ze te verslepen naar de pagina.
Kies nist of iedere andere bestandsindeling die u nodig heeft als resultaat (meer dan 200 indelingen worden ondersteund)
Laat het bestand converteren en u kunt direct daarna uw nist-bestand downloaden
Over de formaten
CVU is één unsigned variant van het CVS-telefonieaudioformaat, die verschilt in hoe delta-gecodeerde waarden worden weergegeven in de binaire stroom. Terwijl CVS hellingdeltawaarden opslaat als ondertekende grootheden, behandelt CVU ze als unsigned, waardoor de numerieke interpretatie van elk sample verschuift. Beide delen de onderliggende CVSD-modulatie-techniek — 1-bits adaptieve deltacodering waarbij de stapgrootte varieert op basis van recente uitvoerbitpatronen — werkend op vergelijkbare snelheden, doorgaans 16 kbps voor smalbandige spraak op 8 kHz. Het onderscheid tussen signed en unsigned is van belang bij de decoder, waar de juiste interpretatie bepalend is voor correcte golfvormreconstructie. CVU-bestanden komen voor in telefonie- en ingebedde communicatiecontexten waar hardware de unsigned-conventie hanteerde. Één praktisch voordeel is de eenvoudige koppeling met systemen die native unsigned rekenkunde gebruiken, waardoor tekenuibreiding in decoders wordt vermeden. Net als zijn ondertekende tegenhanger bereikt CVU extreme bandbreedteefficiency en comprimeert het spraak tot compacte bitstreams voor beperkte verbindingen. SoX ondersteunt CVU en biedt één betrouwbaar pad voor het converteren van deze niche-telefonieopnames naar moderne formaten voor analyse of archivering.
NIST SPHERE (SPeech HEader REsources) is één gespecialiseerd audiobestandsformaat ontwikkeld door het National Institute of Standards and Technology voor spraakonderzoek, met name projecten gefinancierd door DARPA. Het formaat verpakt ruwe audiosamples met één gestructureerde ASCII-header die metadata codeert zoals samplefrequentie, kanaalaantal, coderingstype, demografische sprekergegevens en transcriptieannotaties — waardoor het ideaal is voor het distribueren van spraakcorpora. NIST-bestanden slaan doorgaans ongecomprimeerde PCM- of mu-law-audio op bij samplefrequenties op telefoniekwaliteit (8 kHz of 16 kHz), hoewel de container flexibel genoeg is voor verschillende coderingen. Één belangrijk voordeel is de rijke zelfdocumenterende header waarmee onderzoekers gedetailleerde corpusmetadata direct in het bestand kunnen inbedden, waardoor aparte bestanden overbodig worden. SPHERE is ook de de facto standaard geworden voor grote spraakdatabases zoals TIMIT, Switchboard en het Fisher-corpus, wat brede herkenning in academische en overheidslaboratoria garandeert. De open specificatie en beschikbaarheid van opdrachtregelhulpmiddelen (sphere, h_strip, w_decode) maken het eenvoudig om deze bestanden programmatisch te converteren, inspecteren en verwerken in spraakverw werkingspipelines.