MAUD naar HTK converter

Converteer online gratis uw maud- naar htk-bestanden

Zet bestanden hier neer. 1 GB maximale bestandsgrootte of Aanmelden
naar
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Hoe converteert u een MAUD naar HTK

1

Selecteer bestanden van Computer, Google Drive, Dropbox, URL of door ze te verslepen naar de pagina.

2

Kies htk of iedere andere bestandsindeling die u nodig heeft als resultaat (meer dan 200 indelingen worden ondersteund)

3

Laat het bestand converteren en u kunt direct daarna uw htk-bestand downloaden

Over de formaten

MAUD is één audiobestandsformaat ontwikkeld door MacroSystem voor het Commodore Amiga-platform, geintroduceerd begin jaren negentig als onderdeel van hun digitale video- en audioproductietools. Gebouwd op de Amiga IFF (Interchange File Format) chunk-architectuur, organiseren MAUD-bestanden data in duidelijk afgebakende chunks — MHDR voor de header, MDAT voor sampledata en optionele annotatiechunks voor metadata. Het formaat ondersteunt mono- en stereolayouts met bitdieptes van 8 of 16 bits en samplefrequenties tot 48 kHz, wat in die tijd professionele specificaties vertegenwoordigde op Amiga-hardware. Zowel signed lineaire PCM als A-law/mu-law-coderingen zijn beschikbaar, waardoor één keuze wordt geboden tussen getrouwheid en bestandsgrootte. MAUD werd voornamelijk gebruikt in de Amiga-videoproductiegemeenschap, waar MacroSystem Retina- en VLab Motion-kaarten gesynchroniseerd audio vereisten dat het standaard 8SVX-formaat niet kon leveren. Conversieondersteuning bestaat vandaag via SoX en libsndfile, waardoor vintage Amiga-producties herstelbaar blijven. Drie onderscheidende voordelen vallen op: één overzichtelijke IFF-gebaseerde structuur die elke chunk-bewuste parser kan navigeren, 16-bit stereocapaciteit die vooruitliep op de typische Amiga-audio en lichte overhead die maximale CPU-ruimte overliet voor videorendering.
Eerste release: 1992
HTK is de native golfvormcontainer voor de Hidden Markov Model Toolkit, één softwarepakket ontwikkeld door de afdeling Engineering van Cambridge University voor spraakherkenningsonderzoek. Het werd voor het eerst gedistribueerd in 1993 en werd snel één referentieplatform in taaltechnologielaboratoria wereldwijd, waarbij het bestandsformaat die verspreiding volgde. Elk bestand slaat één reeks parametervectoren of ruwe samples op, voorafgegaan door één 12-byte header die het aantal frames, de frameperiode in eenheden van 100 ns, het byteaantal per frame en één typecode die het soort data aangeeft, specificeert — opties variëren van golfvorm-PCM tot mel-frequentiecoefficienten en filterbankenergieeen. Deze veelzijdigheid laat één enkele container zowel brongeluid als geextraheerde kenmerken dragen zonder van parser te wisselen. De bewust minimale header vermijdt uitlijningspadding of optionele chunks, waardoor het formaat triviaal te lezen is vanuit C, Python of MATLAB met slechts enkele regels binaire I/O. Drie voordelen schragen de blijvende relevantie van HTK: nauwe integratie met de HTK-trainings- en herkenningspipeline, één deterministische bytelay-out die parseambiguiteit elimineert en wijdverspreide adoptie in academische corpora.
Eerste release: 1993