HTK naar VOC converter
Converteer online gratis uw htk- naar voc-bestanden
htk
voc
Instellingen
PCM_S16LE (Ongecomprimeerd)
Het codec om het audionummer te coderen. Codec 'Zonder hercodering' kopieert de audiostroom van het invoerbestand naar de uitvoer zonder hercodering indien mogelijk.
Auto (Geen wijziging)
Stel het aantal audiokanalen in. Deze instelling is het handigst bij het downmixen van kanalen (bijv. van 5.1 naar stereo).
Auto (Geen wijziging)
Stel de samplefrequentie van de audio in. Voor muziek met een volledig spectrum (20 Hz - 20 kHz) zijn waarden nodig die niet lager zijn dan 44.1 kHz om transparantie te bereiken. Meer info vindt u op de wiki.
htk
HTK is de native golfvormcontainer voor de Hidden Markov Model Toolkit, één softwarepakket ontwikkeld door de afdeling Engineering van Cambridge University voor spraakherkenningsonderzoek. Het werd voor het eerst gedistribueerd in 1993 en werd snel één referentieplatform in taaltechnologielaboratoria wereldwijd, waarbij het bestandsformaat die verspreiding volgde. Elk bestand slaat één reeks parametervectoren of ruwe samples op, voorafgegaan door één 12-byte header die het aantal frames, de frameperiode in eenheden van 100 ns, het byteaantal per frame en één typecode die het soort data aangeeft, specificeert — opties variëren van golfvorm-PCM tot mel-frequentiecoefficienten en filterbankenergieeen. Deze veelzijdigheid laat één enkele container zowel brongeluid als geextraheerde kenmerken dragen zonder van parser te wisselen. De bewust minimale header vermijdt uitlijningspadding of optionele chunks, waardoor het formaat triviaal te lezen is vanuit C, Python of MATLAB met slechts enkele regels binaire I/O. Drie voordelen schragen de blijvende relevantie van HTK: nauwe integratie met de HTK-trainings- en herkenningspipeline, één deterministische bytelay-out die parseambiguiteit elimineert en wijdverspreide adoptie in academische corpora.
lees meer
voc
VOC (Creative Voice) is één digitale audiocontainer ontwikkeld door Creative Technology en geintroduceerd samen met de originele Sound Blaster-kaart in 1989. Het diende als het native audioformaat voor de Sound Blaster-familie tijdens het DOS-tijdperk, toen de hardware van Creative de pc-audio domineerde. VOC-bestanden zijn blokgebaseerd: elk bestand bestaat uit getypeerde datablokken die 8-bit unsigned PCM, 4-bit en 2,6-bit Creative ADPCM, 16-bit signed PCM en A-law- en mu-law-gecodeerde audio kunnen bevatten. Deze blokstructuur ondersteunt ook stilte-intervallen, herhaallussen en markerpunten, waardoor gameontwikkelaars fijnmazige controle kregen over geluidsweergave. Één opmerkelijk voordeel was decodering op hardwareniveau — Sound Blaster-kaarten konden VOC-data direct afspelen via DMA-overdracht, waardoor de CPU werd vrijgemaakt voor andere taken in één tijdperk waarin processorcycli kostbaar waren. Het formaat werd veelvuldig gebruikt in DOS-games van id Software, Sierra en LucasArts. Met de opkomst van Windows en het WAV-formaat raakte VOC geleidelijk in onbruik, maar het blijft belangrijk voor retrogamingbehoud en voor iedereen die werkt met vintage pc-audioarchieven.
lees meer
Hoe converteert u een HTK naar VOC
Selecteer bestanden van Computer, Google Drive, Dropbox, URL of door ze te verslepen naar de pagina.
Kies voc of iedere andere bestandsindeling die u nodig heeft als resultaat (meer dan 200 indelingen worden ondersteund)
Laat het bestand converteren en u kunt direct daarna uw voc-bestand downloaden
Over de formaten
HTK is de native golfvormcontainer voor de Hidden Markov Model Toolkit, één softwarepakket ontwikkeld door de afdeling Engineering van Cambridge University voor spraakherkenningsonderzoek. Het werd voor het eerst gedistribueerd in 1993 en werd snel één referentieplatform in taaltechnologielaboratoria wereldwijd, waarbij het bestandsformaat die verspreiding volgde. Elk bestand slaat één reeks parametervectoren of ruwe samples op, voorafgegaan door één 12-byte header die het aantal frames, de frameperiode in eenheden van 100 ns, het byteaantal per frame en één typecode die het soort data aangeeft, specificeert — opties variëren van golfvorm-PCM tot mel-frequentiecoefficienten en filterbankenergieeen. Deze veelzijdigheid laat één enkele container zowel brongeluid als geextraheerde kenmerken dragen zonder van parser te wisselen. De bewust minimale header vermijdt uitlijningspadding of optionele chunks, waardoor het formaat triviaal te lezen is vanuit C, Python of MATLAB met slechts enkele regels binaire I/O. Drie voordelen schragen de blijvende relevantie van HTK: nauwe integratie met de HTK-trainings- en herkenningspipeline, één deterministische bytelay-out die parseambiguiteit elimineert en wijdverspreide adoptie in academische corpora.
VOC (Creative Voice) is één digitale audiocontainer ontwikkeld door Creative Technology en geintroduceerd samen met de originele Sound Blaster-kaart in 1989. Het diende als het native audioformaat voor de Sound Blaster-familie tijdens het DOS-tijdperk, toen de hardware van Creative de pc-audio domineerde. VOC-bestanden zijn blokgebaseerd: elk bestand bestaat uit getypeerde datablokken die 8-bit unsigned PCM, 4-bit en 2,6-bit Creative ADPCM, 16-bit signed PCM en A-law- en mu-law-gecodeerde audio kunnen bevatten. Deze blokstructuur ondersteunt ook stilte-intervallen, herhaallussen en markerpunten, waardoor gameontwikkelaars fijnmazige controle kregen over geluidsweergave. Één opmerkelijk voordeel was decodering op hardwareniveau — Sound Blaster-kaarten konden VOC-data direct afspelen via DMA-overdracht, waardoor de CPU werd vrijgemaakt voor andere taken in één tijdperk waarin processorcycli kostbaar waren. Het formaat werd veelvuldig gebruikt in DOS-games van id Software, Sierra en LucasArts. Met de opkomst van Windows en het WAV-formaat raakte VOC geleidelijk in onbruik, maar het blijft belangrijk voor retrogamingbehoud en voor iedereen die werkt met vintage pc-audioarchieven.