MPEG를 SPH로 변환기
MPEG 동영상에서 SPH 오디오를 빠르게 추출
mpeg
sph
동영상에서 음성 코퍼스로
MPEG 동영상에서 대화를 추출하고 NIST SPHERE로 패키징합니다 — 음성 연구 데이터셋 구축 시 수동 추출을 건너뜁니다.
음성 연구 형식
SPH는 음성 데이터 교환 표준입니다 — MPEG에서 추출하면 연구용 오디오가 생성됩니다.
안전한 파일
MPEG 업로드는 변환 직후 삭제됩니다. SPH 출력물은 24시간 내에 삭제됩니다.
MPEG에서 SPH로 변환하는 방법
컴퓨터, Google Drive, Dropbox, URL에서 선택하거나 이 페이지에서 드래그하여 선택해 주세요.
sph 또는 기타 필요한 결과 형식을 선택하세요(200가지 이상의 형식 지원)
파일 변환을 실행한 뒤 바로 sph 파일을 다운로드할 수 있습니다
형식 정보
MPEG(MPEG-1)는 1993년 8월 동영상 전문가 그룹이 ISO/IEC 11172로 발표한 기초적인 비디오 및 오디오 압축 표준입니다. 동영상과 관련 오디오의 손실 압축에 대한 최초의 국제 표준으로, 이후 사실상 모든 비디오 코덱에 영향을 미친 원리와 기술을 확립했습니다. MPEG-1 비디오는 움직임 보상 예측, 이산 코사인 변환 코딩, 가변 길이 엔트로피 인코딩을 결합하여 압축을 달성하며, I-프레임(인트라 코딩), P-프레임(예측), B-프레임(양방향 예측)의 세 가지 프레임 유형으로 구성됩니다. 이 표준은 오디오와 비디오를 합쳐 약 1.5Mbps의 비트레이트를 목표로 하여, SIF 해상도(NTSC의 경우 352x240)에서 VHS 테이프에 필적하는 화질을 생성합니다. 이 압축 수준은 1x 속도 CD-ROM 드라이브의 데이터 처리량에 맞추기 위해 특별히 선택되었으며, 1990년대 초 소비자에게 디지털 비디오를 가져다 준 Video CD 형식을 가능하게 했습니다. 오디오 구성 요소, 특히 Layer III(MP3)는 역사상 가장 영향력 있는 오디오 형식이 되었습니다. I/P/B 프레임 구조, 움직임 추정 방식, 블록 기반 변환 코딩은 MPEG-2부터 H.264 이후까지 모든 주요 비디오 코덱이 따르는 아키텍처 템플릿을 확립했습니다. 압축 효율 면에서 오래전에 초월되었지만, MPEG-1은 사실상 모든 미디어 소프트웨어에서 여전히 지원됩니다.
SPH는 1990년경 미국 국립표준기술연구소가 만든 NIST SPHERE(SPeech HEader REsources) 포맷에 저장된 오디오의 파일 확장자입니다. 음성 연구를 위해 설계된 SPH 파일은 데이터베이스 식별자, 채널 수, 샘플레이트, 바이트 순서, 압축 유형 등의 메타데이터로 채워진 1024바이트 ASCII 헤더를 포함하여, 모든 녹음이 자기 설명적입니다. 기본 오디오는 일반적으로 16 kHz에서 샘플링된 16비트 리니어 PCM이지만, 다른 구성도 허용됩니다. NIST, DARPA 및 전 세계 대학의 연구자들은 현대 자동 음성 인식 시스템의 기반이 되는 TIMIT, Switchboard, LDC 컬렉션과 같은 음성 코퍼스 배포에 SPH를 사용합니다. 핵심 장점은 사람이 읽을 수 있는 헤더로, 스크립트가 바이너리 디코딩 없이 녹음 메타데이터를 파싱할 수 있습니다. 이 포맷의 엄격한 표준화는 기관과 플랫폼 간 데이터셋 공유 시 모호성을 제거합니다. SPH 파일이 비압축 PCM을 저장하므로 완전한 오디오 충실도가 보존됩니다 — 작은 아티팩트조차 결과를 왜곡할 수 있는 음향 모델 훈련에 매우 중요합니다.
자주 묻는 질문
MPEG를 SPH로 왜 변환하나요?
SPH는 NIST Sphere 음성 데이터 교환 형식의 변형입니다.
SPH 파일은 어떻게 여나요?
NIST 도구, SoX, Kaldi, HTK에서 SPH를 처리합니다.
오디오만 추출되나요?
네 — MPEG 파일의 영상 부분은 폐기됩니다. 오디오 트랙만 SPH로 저장됩니다.
여러 파일을 변환할 수 있나요?
여러 MPEG 동영상을 한 번에 업로드하고 각각에서 SPH 오디오를 동시에 추출하세요.
업로드가 안전한가요?
MPEG 파일은 변환 직후 삭제됩니다. SPH 출력물은 24시간 내에 서버에서 제거됩니다.