IRCAM에서 HTK로 변환하는 컨버터

온라인에서 무료로 ircam 파일을 htk로 변환하세요

여기에 파일을 드롭하세요. 1 GB 최대 파일 크기 또는 회원 가입
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

IRCAM에서 HTK로 변환하는 방법

1

컴퓨터, Google Drive, Dropbox, URL에서 선택하거나 이 페이지에서 드래그하여 선택해 주세요.

2

htk 또는 기타 필요한 결과 형식을 선택하세요(200가지 이상의 형식 지원)

3

파일 변환을 실행한 뒤 바로 htk 파일을 다운로드할 수 있습니다

형식 정보

IRCAM 사운드 파일은 작곡가 피에르 불레즈가 파리에 설립한 세계적인 컴퓨터 음악 연구소인 Institut de Recherche et Coordination Acoustique/Musique에서 유래했습니다. 이 포맷은 1980년대 초에 IRCAM의 연구 요구를 충족하기 위해 만들어졌으며, 이후 과학과 사운드의 교차점에서 활동하는 학술 및 예술 커뮤니티에 채택되었습니다. IRCAM 파일은 매직 넘버, 샘플레이트, 채널 수, 리니어 PCM(16/32비트 정수 및 32비트 부동소수점), mu-law, A-law 변형을 지원하는 인코딩 유형 필드를 포함하는 1024바이트 헤더로 시작합니다. 헤더 블록은 자유 형식의 주석 텍스트도 수용하여 연구자가 실험 메타데이터를 오디오 파일에 직접 임베딩할 수 있습니다. 기본적으로 비압축 페이로드를 사용하므로 녹음은 연속적인 분석 및 재합성 사이클을 통해 완전한 충실도를 유지합니다 — 이는 심리음향 실험에 필수적입니다. Csound, libsndfile, SoX 같은 소프트웨어가 이 포맷을 기본적으로 읽고 씁니다. 주요 장점으로는 파싱 모호성을 제거하는 잘 정의된 헤더, 과학적 DSP 작업에 필수적인 부동소수점 샘플 지원, 지속적인 도구 지원을 보장하는 컴퓨터 음악 커뮤니티에서의 깊은 뿌리가 있습니다.
개발자: IRCAM
최초 출시: 1983
HTK는 음성 인식 연구를 위해 Cambridge 대학교 공학부에서 개발한 소프트웨어 모음인 Hidden Markov Model Toolkit의 네이티브 파형 컨테이너입니다. 1993년에 처음 배포된 HTK는 전 세계 전산 언어학 연구실에서 빠르게 레퍼런스 플랫폼이 되었으며, 그 파일 포맷도 함께 보급되었습니다. 각 파일은 프레임 수, 100 ns 단위의 프레임 주기, 프레임당 바이트 수, 데이터 종류를 나타내는 유형 코드를 지정하는 12바이트 헤더가 앞에 붙은 파라미터 벡터 시퀀스 또는 원시 샘플을 저장합니다 — 옵션은 파형 PCM에서 멜 주파수 켑스트럼 계수와 필터 뱅크 에너지까지 다양합니다. 이러한 다용도성 덕분에 파서를 변경하지 않고도 하나의 컨테이너에 원본 오디오와 추출된 특성 모두를 담을 수 있습니다. 의도적으로 최소화된 헤더는 정렬 패딩이나 선택적 청크를 피하여, C, Python 또는 MATLAB에서 몇 줄의 바이너리 I/O로 읽을 수 있는 포맷을 만듭니다. 세 가지 장점이 HTK의 지속적인 관련성을 뒷받침합니다: HTK 학습 및 인식 파이프라인과의 긴밀한 통합, 파서 모호성을 제거하는 결정적 바이트 레이아웃, 학술 코퍼스에서의 광범위한 채택입니다.
최초 출시: 1993