CVSD naar HTK converter

Converteer online gratis uw cvsd- naar htk-bestanden

Zet bestanden hier neer. 1 GB maximale bestandsgrootte of Aanmelden
naar
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Hoe converteert u een CVSD naar HTK

1

Selecteer bestanden van Computer, Google Drive, Dropbox, URL of door ze te verslepen naar de pagina.

2

Kies htk of iedere andere bestandsindeling die u nodig heeft als resultaat (meer dan 200 indelingen worden ondersteund)

3

Laat het bestand converteren en u kunt direct daarna uw htk-bestand downloaden

Over de formaten

CVSD (Continuously Variable Slope Delta-modulatie) is één spraakdigitaliseringsmethode die gestandaardiseerd is voor militair en telefoniegebruik door de NAVO en de CCITT in de jaren zeventig. Het codeert verschillen tussen opeenvolgende samples als één enkele bit — 1 als het huidige sample de voorspelling overschrijdt, anders 0 — terwijl één syllabisch compandingfilter de stapgrootte aanpast door reeksen identieke bits te monitoren. Werkend op 16 tot 64 kbps balanceert CVSD spraakverstaanbaarheid tegen bandbreedte, waardoor het de codering bij uitstek was voor beveiligde militaire verbindingen en tactische radiosystemen. De bitstroom kan worden gedecodeerd met eenvoudige hardware, oorspronkelijk ingebouwd in speciale geïntegreerde schakelingen. Één voordeel is de eenvoud van implementatie — encoders en decoders vereisen minimale middelen, wat realtime verwerking op energiezuinige ingebedde hardware mogelijk maakt. Robuustheid onder ruizige omstandigheden is één andere sterkte, aangezien enkelbitsfouten slechts lokale samples beinvloeden in plaats van hele frames te corrumperen. SoX biedt software-encoding- en decoderingsondersteuning, waardoor moderne systemen kunnen werken met legacy CVSD-opnames uit militaire archieven en vintage telecommunicatie-infrastructuur.
Ontwikkelaar: CCITT / NATO
Eerste release: 1970
HTK is de native golfvormcontainer voor de Hidden Markov Model Toolkit, één softwarepakket ontwikkeld door de afdeling Engineering van Cambridge University voor spraakherkenningsonderzoek. Het werd voor het eerst gedistribueerd in 1993 en werd snel één referentieplatform in taaltechnologielaboratoria wereldwijd, waarbij het bestandsformaat die verspreiding volgde. Elk bestand slaat één reeks parametervectoren of ruwe samples op, voorafgegaan door één 12-byte header die het aantal frames, de frameperiode in eenheden van 100 ns, het byteaantal per frame en één typecode die het soort data aangeeft, specificeert — opties variëren van golfvorm-PCM tot mel-frequentiecoefficienten en filterbankenergieeen. Deze veelzijdigheid laat één enkele container zowel brongeluid als geextraheerde kenmerken dragen zonder van parser te wisselen. De bewust minimale header vermijdt uitlijningspadding of optionele chunks, waardoor het formaat triviaal te lezen is vanuit C, Python of MATLAB met slechts enkele regels binaire I/O. Drie voordelen schragen de blijvende relevantie van HTK: nauwe integratie met de HTK-trainings- en herkenningspipeline, één deterministische bytelay-out die parseambiguiteit elimineert en wijdverspreide adoptie in academische corpora.
Eerste release: 1993