mp3의 원리
pc하드웨어 이해하기
하나님-사람 2012-06-29 , 조회 (5437) , 추천 (0) , 스크랩 (0)
출처
원문

MP3의 원리

MP3란 음악 등 소리 데이터를 저장한 컴퓨터 파일로 ‘MPEG-1 Audio Layer 3’을 줄인 말이다. 이는 CD에 가까운 고음질을 유지하면서 데이터를 그보다 약 12분의 1 이하로 줄일 수 있는 압축 기술을 담고 있어 개발 당시 멀티미디어 혁명으로 불렸었다. 여기에서 MPEG이란 동화상 전문가 단체(Moving Picture Experts Group)의 약자로 국제 표준화기구 속에 있는 동영상 연구모임이다. 이들은 비디오나 오디오 압축에 대한 표준들을 담당하고 있어 이 조직에서 정하는 것을 MPEG 표준이라고 부른다. 따라서 MPEG는 전문가 모임과 기술표준이라는 두 가지 뜻을 담고 있는데, 보통 초기부터 후자인 기술표준 규약으로 불려오고 있다. MPEG-1은 맨 처음 버전 을 의미하며, Layer 3의 의미는 MPEG 오디오의 압축비 중 세 번째를 가리키는 말이다.

 

 

파일압축의 원리

MP3의 원리를 알기 위해서는 데이터 압축의 원리를 이해해야 한다. 파일 압축은 저장 공간을 절약하거나 데이터 전송시간을 줄이기 위해 데이터 크기를 줄이는 것이다. 가장 기본적인 압축원리는 데이터 원본에서 공란이나 연속된 글자, 그리고 반복된 글자의 조합 등과 같은 반복 패턴을 적은 수의 비트로 바꿈으로써 파일 크기를 줄이는 것이다. 압축 방법에는 크게 엔트로피 코딩(Entropy coding)과 사전(Dictionary coding) 코딩이 있다.


엔트로피 코딩은 연속된 문자가 중복되었을 때 이를 짧은 코드로 만들어 길이를 줄이는 것이다. 예를 들어 A라는 문자가 10번 나오고 B라는 문자가 10번 나오고 C가 5번 나온다면 연속된 ABC 문자에 짧은 코드를 할당해서 전체 길이를 줄이는 것이다. 예를 들어 A:10B:10C:5 이런 식으로 표기하는 것이다.

 

엔트로피 코딩의 예

 

사전 코딩은 특정 문자를 어떤 인덱스로 표현하는 것으로 예를 들면, ABCABCABCDEFDEFGHIGHI 라는 문자가 나온다고 하면 ABC:1, DEF:2, GHI:3 으로 정의하고 1112233 라고 표현하는 것이다.

 

사전 코딩의 예

 

 

음향파일의 압축은 데이터 파일의 것과 다른 면이 있다

WAV 파일은 음향 데이터를 원음 그대로 덩어리째 저장하는 방식으로, 윈도 시스템의 기본 포맷 방식인데 비압축형 오디오 포맷이어서 파일의 크기가 크다. 한편 FLAC 파일은 무손실 포맷 방식으로, 소리 없는 구간 등 동일한 샘플의 블록들에 대한 반복 길이 부호화를 통해 오디오 소스를  온전한 모습으로 보존하면서 원래 파일 크기를 40~50%로 줄여준다.

 

음성이 MP3 파일로 변환되는 과정

 

그러나 MP3는 WAV 파일이나 FLAC 파일과는 전혀 다른 심리음성학을 이용한 압축방식이다. 우리가 아는 바와 같이 소리는 종파매질의 진동방향과 진행방향이 서로 평행한 파동이다. 이 음파는 사람의 인식여부와 관계없이 기계적으로 거의 모두를 저장할 수 있다. 하지만 사람의 경우 너무 작거나 너무 낮은 소리와 너무 높은 소리는 인식할 수 없다. 연구자들은 이 사실을 이용하여 녹음된 오디오 파일에서 사람이 들을 수 없는 부분을 잘라내고 다시 연결한 것이 바로 MP3 압축파일이다.

 

소리의 높고 낮음은 오직 음파의 진동수 에 의존한다. 낮은 소리는 진동수가 작고, 높은 소리는 진동수가 크다. 한편 소리의 크기는 음파의 세기와 관련이 있다. 또한 음파의 세기는 물리적으로 볼 때 음파가 단위시간동안 단위면적을 지나며 나르는 에너지를 말하는 데, 이는 진폭의 제곱뿐만 아니라 음파의 진동수의 제곱, 음파의 속도 및 매질의 밀도에 비례한다.

 

I = 음파의 세기, ρ = 매질의 밀도 ω = 진동수 ,
A=진폭, v= 파동이 전달되어나가는 속력

 

사람의 귀로 들을 수 있는 음파는 사람에 따라 또는 음의 크기에 따라 다르지만 보통 1초에 매질이 20~20,000번 진동하는 범위의 소리(audio frequency, 가청주파수)만을 인식하는 것으로 알려져 있다. 

 

WAV파일이 모든 대역의 주파수를 기록하는데 반해서 MP3는 사람의 가청주파수대만을 남기고 나머지는 압축을 한다. 이 때 MP3는 일반 WAV보다 약 12% 이하의 크기가 된다. 기본적으로 MP3는 잘라내어 버린 부분이 있기에 음질을 100% 까지 재생 수는 없다.

 

MP3파일을 만드는 과정

 

 

MP3 파일 속은 어떻게 되어 있을까?


우리가 흔히 보는 MP3 파일은 여러 개의 음향접속단위(AAU,Audio Access Unit)들과 노래제목, 가수 등의 부가 정보가 들어있는 1개의 음향 꼬리표(Audio tag)로 이루어져 있다.

 

 

각 AAU는 또다시 머리부분(Header), CRC, SideInfo, 음향데이터로 구성되어 있다. 음향데이터는 실질적인 데이터가 담겨있는 메인 데이터영역을 말한다.

 

*프레임 - 전송되는 정보의 일정한 단위, 크기 또는 경계를 가리키는 용어

 

 

MP3 플레이어는 어떻게 작동할까?


MP3 플레이어는 MP3파일을 사람이 들을 수 있도록 하는 장치로 여러 가지 부품과 소프트웨어로 구성되어있다. 이 기기는 종전의 카세트테이프 플레이어와 비교해볼 때 큰 차이를 가지고 있다. 이것의 핵심은  DSP, MICOM 그리고 코덱이며 디지털신호의 처리와 관련이 깊다. DSP(Digital Signal Processor)는 음원의 막대한 양의 디지털 신호를 기계장치가 빠르게 처리할 수 있도록 해주는 집적회로이다. MICOM(MIcroprocessor COMputer)은 기기의 중심적인 지휘자로 입·출력관련 및 각 구성요소를 제어하고 있다. 또한 코덱(CODEC)은 음성의 아나로그 신호를 디지털 신호로 변환하는 코더(COder)와 디지털 신호를 음성 또는 영상으로 변환하는 디코더(DEcorder)의 합성어이다. 음악을 감상하는 경우 압축된 파일을 풀어서 보는 것이 중요하기 때문에 압축된 파일을 풀어주는 프로그램이나 장치를 코덱이라 한다.

 

MP3 플레이어의 구성도

 

 

한국은 MP3 플레이어의  종주국


1997년 국내 업체인 새한정보시스템이  MP3파일을 재생할 수 있는 휴대용 플레이어를 개발했는데, 이것이 최초의 MP3 플레이어이다. 그래서 한국은 1998년 2월 세계 최초로 휴대용 MP3 플레이어 `엠피맨(mpman-F10)'을 내놓게 되었다. 엠피맨은 손바닥만 한 크기에 무게는 65g으로 지금과 비교하면 엄청 큰 덩치를 갖고 있었지만, 당시에는 획기적인 제품이었다. MP3플레이어 시장은 급속히 성장하여 이를 만든 우리나라의 벤처기업이 한 때 세계적인 주목을 받기도 했다. 왜냐하면 우리가 개발한 MP3플레이어가 종전 카세트테이프 플레이어의 대명사인 소니의 워크맨을 순식간에 옛것으로 만들어 시장에서 퇴출시켜버렸기 때문이다. 첨단 기술과 함께 더해진 깜찍한 디자인은 세계 시장을 놀라게 했다. 그런데 이후 애플의 등장으로 시장의 판도는 많이 바뀌었다. 현재는 애플이 기본적으로 MP3가 콘텐츠 비즈니스라는 점을 간파하여 국산 MP3 플레이어를 누르고 세계 1위를 거머쥐고 있다.

 

관련링크 : 통합검색 결과 보기

 

 

  1. MPEG의 버전 및 이용분야

    MPEG-1: 저장매체에서 동영상과 그것과 관련된 오디오에 대한 저장과 복원에 대한 표준.
    MPEG-2: 통신, 저장매체, 방송매체로부터의 동영상 압축 표준. 디지털 TV, DVD에 사용됨.
    MPEG-3: 고선명 텔레비전(HDTV)을 목표로 하였으나 MPEG-2에 흡수됨
    MPEG-4: 낮은 비트율에서 객체중심의 동영상 압축 표준. 시청각 자료를 객체 단위로 부호화하여 이동통신 동영상 지원에 적절.
    MPEG-7: 멀티미디어 정보를 기술(Description)하기 위한 표준화 작업. 동영상 데이터 검색 및 전자상거래 등에 적합하도록 개발된 차세대 동영상 압축 재생기술.
    MPEG-21: 디지털컨텐츠의 제작, 유통, 보안 등 전과정을 관리할 수 있는 기술.

  2. Layer에 따른 최대 압축비

    Layer 1은 4:1, Mayer 2는 8:1, Layer 3은 12:1에 해당한다.

  3. 진동수

    진동수(frequency)는 주파수라고도 하며 1초동안 같은 상태가 반복되는 회수를 말함.

 

 

 

곽효길 / 대성중학교 교사, 서울과학교사모임
http://navercast.naver.com/contents.nhn?contents_id=4262

추천 스크랩 전체목록