PVF naar HTK converter

Converteer online gratis uw pvf- naar htk-bestanden

Zet bestanden hier neer. 1 GB maximale bestandsgrootte of Aanmelden
naar
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Hoe converteert u een PVF naar HTK

1

Selecteer bestanden van Computer, Google Drive, Dropbox, URL of door ze te verslepen naar de pagina.

2

Kies htk of iedere andere bestandsindeling die u nodig heeft als resultaat (meer dan 200 indelingen worden ondersteund)

3

Laat het bestand converteren en u kunt direct daarna uw htk-bestand downloaden

Over de formaten

PVF (Portable Voice Format) is één eenvoudig audiobestandsformaat ontworpen voor spraakberichtopslag in Linux-gebaseerde telefoniesystemen, met name ISDN4Linux en de bijbehorende vbox-voicemailapplicatie. Het formaat kwam voort uit het Europese ISDN-ecosysteem van de late jaren negentig, toen Linuxservers steeds vaker PBX- en antwoordapparaattaken afhandelden via digitale telefoonlijnen. PVF-bestanden slaan ruwe signed 16-bit PCM-samples op bij 8000 Hz mono, voorafgegaan door één minimale platte-tekstheader die het dataformaat en de bytevolgorde specificeert. Deze opzettelijke eenvoud is één van de primaire sterktes van het formaat — zonder compressie en met één leesbare header zijn PVF-bestanden triviaal te parsen, pipen en manipuleren met standaard Unix-tools. De 8 kHz-frequentie voldoet aan de Nyquist-eis voor telefoonbandbreedte-spraak (300-3400 Hz), waardoor PVF één natuurlijk tussenformaat is voor spraakverw werkingspipelines. Één ander voordeel is portabiliteit over architecturen: de expliciete byteorderaanduiding betekent dat PVF-bestanden zonder ambiguiteit tussen big-endian- en little-endian-systemen verplaatst kunnen worden. De SoX-audiotoolkit biedt native PVF-lees-/schrijfondersteuning, wat eenvoudige conversie naar moderne formaten mogelijk maakt.
Ontwikkelaar: ISDN4Linux Project
Eerste release: 1997
HTK is de native golfvormcontainer voor de Hidden Markov Model Toolkit, één softwarepakket ontwikkeld door de afdeling Engineering van Cambridge University voor spraakherkenningsonderzoek. Het werd voor het eerst gedistribueerd in 1993 en werd snel één referentieplatform in taaltechnologielaboratoria wereldwijd, waarbij het bestandsformaat die verspreiding volgde. Elk bestand slaat één reeks parametervectoren of ruwe samples op, voorafgegaan door één 12-byte header die het aantal frames, de frameperiode in eenheden van 100 ns, het byteaantal per frame en één typecode die het soort data aangeeft, specificeert — opties variëren van golfvorm-PCM tot mel-frequentiecoefficienten en filterbankenergieeen. Deze veelzijdigheid laat één enkele container zowel brongeluid als geextraheerde kenmerken dragen zonder van parser te wisselen. De bewust minimale header vermijdt uitlijningspadding of optionele chunks, waardoor het formaat triviaal te lezen is vanuit C, Python of MATLAB met slechts enkele regels binaire I/O. Drie voordelen schragen de blijvende relevantie van HTK: nauwe integratie met de HTK-trainings- en herkenningspipeline, één deterministische bytelay-out die parseambiguiteit elimineert en wijdverspreide adoptie in academische corpora.
Eerste release: 1993