HTK에서 SLN로 변환하는 컨버터

온라인에서 무료로 htk 파일을 sln로 변환하세요

여기에 파일을 드롭하세요. 1 GB 최대 파일 크기 또는 회원 가입
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

HTK에서 SLN로 변환하는 방법

1

컴퓨터, Google Drive, Dropbox, URL에서 선택하거나 이 페이지에서 드래그하여 선택해 주세요.

2

sln 또는 기타 필요한 결과 형식을 선택하세요(200가지 이상의 형식 지원)

3

파일 변환을 실행한 뒤 바로 sln 파일을 다운로드할 수 있습니다

형식 정보

HTK는 음성 인식 연구를 위해 Cambridge 대학교 공학부에서 개발한 소프트웨어 모음인 Hidden Markov Model Toolkit의 네이티브 파형 컨테이너입니다. 1993년에 처음 배포된 HTK는 전 세계 전산 언어학 연구실에서 빠르게 레퍼런스 플랫폼이 되었으며, 그 파일 포맷도 함께 보급되었습니다. 각 파일은 프레임 수, 100 ns 단위의 프레임 주기, 프레임당 바이트 수, 데이터 종류를 나타내는 유형 코드를 지정하는 12바이트 헤더가 앞에 붙은 파라미터 벡터 시퀀스 또는 원시 샘플을 저장합니다 — 옵션은 파형 PCM에서 멜 주파수 켑스트럼 계수와 필터 뱅크 에너지까지 다양합니다. 이러한 다용도성 덕분에 파서를 변경하지 않고도 하나의 컨테이너에 원본 오디오와 추출된 특성 모두를 담을 수 있습니다. 의도적으로 최소화된 헤더는 정렬 패딩이나 선택적 청크를 피하여, C, Python 또는 MATLAB에서 몇 줄의 바이너리 I/O로 읽을 수 있는 포맷을 만듭니다. 세 가지 장점이 HTK의 지속적인 관련성을 뒷받침합니다: HTK 학습 및 인식 파이프라인과의 긴밀한 통합, 파서 모호성을 제거하는 결정적 바이트 레이아웃, 학술 코퍼스에서의 광범위한 채택입니다.
최초 출시: 1993
SLN(Signed Linear)은 8000 Hz 모노의 16비트 부호 있는 리니어 PCM 샘플을 저장하는 헤더 없는 원시 오디오 포맷으로, Digium(현 Sangoma Technologies)이 개발한 오픈소스 PBX 프레임워크인 Asterisk와 가장 밀접하게 관련되어 있습니다. Asterisk 내에서 SLN은 네이티브 내부 오디오 표현으로 사용됩니다: 모든 코덱 트랜스코딩 작업이 중간 단계로 부호 있는 리니어를 거칩니다. 이는 SLN이 Asterisk 코덱 변환 아키텍처의 중추임을 의미합니다. 이 포맷은 원시 샘플만 포함합니다 — 헤더, 메타데이터, 프레이밍 없음 — 따라서 파라미터가 사전에 알려져 있어야 합니다. 이 자기 설명의 부재가 제한적으로 보일 수 있지만, 실제로 전화 통신에서는 샘플 포맷이 규약에 의해 고정되어 있고 수천 개의 동시 채널에서 모든 오버헤드 바이트가 중요하기 때문에 장점이 됩니다. 8000 Hz 레이트는 전통적 전화 통신의 G.711 표준과 일치하여 전체 300~3400 Hz 음성 대역을 캡처합니다. Asterisk는 광대역 오디오를 위한 확장 변형(sln16, sln32, sln48)도 지원합니다. SLN 파일은 디코딩이 필요 없고 직접 메모리 매핑만 하면 되므로, 고밀도 VoIP 환경에서의 실시간 믹싱, 컨퍼런싱, 프롬프트 재생에 이상적입니다.
최초 출시: 1999