'개발'에 해당되는 글 46건

2008.09.29 RGB, YUV
2008.09.29 코덱별 특징
2008.09.29 영상압축 알고리즘의 종류와 특징
2008.09.29 영상압축
2008.09.29 DCT ?

2008. 9. 29. 18:25

RGB, YUV

2008. 9. 29. 18:25 in 개발/Image Processing

(1) RGB 방식

...(중략)... 거의 자연색상 그대로 표현하기 위해서는 각각 8비트의 크기가 필요하다. R=8비트, G=8비트, B=8비트 이면 모두 2²⁴, 즉 16,000,000 가지의 색상을 표현할 수 있다.
그리고 모두 8비트 만으로 표현되는 시스템에서는 R=3비트, G=3비트, B=2비트를 할당하여 256가지 색상을 표현한다. 이와 같이 제한된 비트를 가지는 시스템에서는 일반적으로 사람 눈이 가장 둔감한 파랑색에 비트수를 적게 할당한다.

	R	G	B
Red	255	0	0
Green	0	255	0
Cyan	0	0	255
Magenta	255	255	0
Yellow	0	255	255
Black	0	0	0
White	255	255	255
Dark	76	76	76
Gray	123	123	123
Light Gray	204	204	204

(2) YUV 방식

YUV와 YIQ는 TV에 사용되는 색 표현방식이다. YUV방식은 사람의 눈이 색상보다는 밝기에 민감하다는 사실에 착안한 방식으로, 색을 밝기(Luminance)인 Y성분과 색상(Chrominance)인 U와 V 성분으로 구분한다. Y성분은 오차에 민감하므로 색상성분인 U와 V보다 많은 비트를 코딩한다. 전형적인 Y:U:V의 비율은 4:2:2 이다.
YUV 방식은 CD-I와 DYI (Digital Video Interactive)에서도 사용된다. 만일 RGB 값이 주어졌을 경우, YUV 값은 =>

Y = 0.3R + 0.59G + 0.11B
U = (B-Y) x 0.493
V = (R-Y) x 0.877

반대로 YUV값이 주어졌을 경우, RGB값은 =>

R = Y + 0.956U + 0.621V
G = Y + 0.272U + 0.647V
B = Y + 1.1061U + 1.703V

Posted by 고단한개발자

2008. 9. 29. 18:24

코덱별 특징

2008. 9. 29. 18:24 in 개발/Image Processing

일반적으로 코덱은 비디오 파일을 압축하는 방식을 말하는데, 음악파일을 압축하는 방식이 거의 MPEG로 통일되어간다면 동영상 쪽은 춘추전국시대라고 할 수 있다. 이는 제조회사별로 다른 압축 방식을 쓰기 때문인데, 음악파일(MP3나 RA파일 등)이 소프트웨어적으로 제작되고 재생되는 반면에 동영상은 하드웨어적으로 제작되고 재생되는 경우가 많기 때문이다. 가장 많이 쓰는 압축방식에는 인텔사의 인디오(5.0)과 에플사의 MOV. 인디오가 IBM의 규격화한 압축방식이라면, MOV는 매킨토시에 규격화한 압축방식이다. 그러나 현재는 이러한 제한없이 양쪽 컴퓨터에서 아무런 문제 없이 사용한다. Video for Windows가 제공하는 압축 코덱은 RLE와 Microsoft Video, Intel Indeo, 그리고 Cinepak 모두 4가지가 있다.

Codec별 특성

ASF 파일
마이크로 소프트 사에서 제안한 스트림 포맷. 이 포맷은 앞으로 스트림 방식의 표준으로 선택될 가능성이 높은 파일 방식이다.

RA 파일
리얼 미디어라는 비디오 스트림 방식에서 사용되는 파일 포맷 방식. RA파일은 본래 인터넷 라디오 방송을 하기 위한 포맷으로 계발되었지만, 현재는 비디오 까지 포함하는 스트림 방식으로 계발되었다. 오디오 RA파일은 압축률은 뛰어나지만 음질이 MP3나 SWA에 비해 떨어지는 단점이 있다. 비디오 RA 파일 역시 압축률은 높지만, 화질이 떨어진다. 둘다 인터넷 방송용으로 많이 사용된다.

MPEG 파일
MPEG 파일 형식은 비디오 신호의 압축과 재생시 실시간 알고리즘 개발에 주목적을 두고 활동화는 표준화 그룹에서 제안한 파일 형식. MPEG 파일 형식은 MPG 라고 하는 확장자를 가지며 별도로 MPEG 보드가 설치된 컴퓨터에서만 운용되는 파일 형식으로서 비디오 CD 등에 담긴 파일 내용을 볼 때에 많이 활용하고 있는 형식. 486 PC에서는 완벽하지는 않지만, 펜티엄 100MHz 이상의 컴퓨터/램 16MB 이상이면 소프트웨어적으로 재생이 가능. MPEG 전용 보드를 사용하여야 완벽한 재생이 이루어진다. MPEG 파일은 윈도95에서는 직접 지원되지 않고 있으나, 윈도우 98에서는 기본으로 지원하고 있다.

MOV파일
MOV 파일은 QuinckTime 플레이어로 재생된다. MOV 파일 형식은 원래 매킨토시 컴퓨터에서 활용되는 파일 형식. 이를 윈도 환경에서도 구현하도록 재생 모듈을 개발하여 지원하고 있는 파일 형식. 매킨토시와 윈도 환경에서 함께 동작하도록 하는 CD 타이틀은 MOV파일 형식을 주로 사용한다.

Intel Indeo
인텔에서 개발한 코덱으로 여러 버전이 있다. 시네팩과 함께 널리 사용되고 압축 시간이 시네팩보다 빠르다. 16 비트 칼라에 효과적이다. 24비트로 이미지를 압축했을 경우, 시스템이 24비트로 설정 되있지 않더라도 마치 24비트 처럼 좋은 Quality의 영상을 재생할 수 있다. 특히 16비트나 24비트의 파일을 압축하고 재생할 경우 더욱 진가가 나타난다. 그러나, 다른 코덱에 비해 버전업이 느리다는 있다. 요즘에 시디롬 타이틀은 이것으로 많이 제작된다.

MIcrosoft Video
RLE와는 다르게 8비트는 물론이고 16비트, 24비트의 영상까지 압축할수 있다. 뛰어난 Quality와 압축률이 장점이나 압축률을 너무 높이면 이미지가 끊어지고 파일의 용량도 많아지는 단점이 있다.

Cinepak
래디우스(Radius)에서 개발된 코덱으로 압축에 많은 시간이 소용되나 가장 높은 압축을 할 수 있다. 256 칼라를 사용할 경우에 특히 효과적이다. 일반 압축 알고니즘과는 달리 다른 symetrical이라는 알고니즘을 이용하며 압축 시간이 비교적 다른 코덱에 비해 오래 걸린다는 단점이 있지만 압축된 영상을 재생시 다른 코덱에 비해 빠르게 압축을 풀어준다는 점과 뛰어난 압축률과 좋은 Quality를 얻을 수 있다는 장점 있다. 또, 위의 네가지중 파일 용량을 가장 적게 만들어 준다. 그래서 주로 CD-ROM 타이틀 제작시 많이 사용된다. 역사가 아주 오래되었다.

RLE (Run Lengh Encoded)
2차원 애니메이션 제작에 효과적이며 일반 비디오에는 사용할 수 없다. 다른 코덱에 비해서 압축 효율성은 떨어지나 영상의 수평층(Horizontal Band)에서 유사한 색상의 길이와 깊이를 기억하는 방식의 압축 알고니즘을 사용. 그래서, 많은 영역에 걸쳐 같거나 유사한 색상을 사용하는 애니메이션을 압축하는데 많은 효과를 볼수 있다. 그러나 8비트 이상의 영상은 압축할수 없다는 것이 단점.

XDM 파일
씽 테크놀로지(Xing Technology)에서 발표한 스트림 웍스(StreamWorks) 방식에서 사용하는 비디오 파일 방식

Posted by 고단한개발자

2008. 9. 29. 18:24

영상압축 알고리즘의 종류와 특징

2008. 9. 29. 18:24 in 개발/Image Processing

① M-JPEG(Motion JPEG) : 디지털 비디오 편집에 있어서 가장 많이 사용되고 있는 압축방식이며 스틸이미지 압축의 대명사인 JPEG포맷을 동영상용으로 확장한 개념입니다. 압축비를 자유롭게 설정할 수 있는 가변압축비가 지원되고 관련된 하드웨어도 절대다수를 차지하고 있습니다.
압축개념에 있어서 공간적 압축방식만을 사용하기 때문에 임의의 프레임에 접근이 용이하여 디지털 비디오 편집에 적당하며 실사간 압축을 지원하는 하드웨어들이 많이 출시되어 있어 관련된 장비가 많은 편입니다. 단, 하드웨어 칩셋을 사용한 압축방식(최근 고성능 CPU를 사용한 소프트웨어 방식도 있음)의 특성상 칩셋과 드라이버가 다르면 같은 M-JPEG방식이라도 호환이 되지 않는 것이 단점이라고 볼 수 있습니다. DV방식이 보편화되기 전까지 절대적인 위치였으나 PC사양의 고성능화와 IEEE-1394인터페이스의 보급에 힘입은 DV방식의 약진에 주춤하고 있는 추세입니다.

② DV(Digital Video) : DV방식은 아날로그방식으로 촬영된 소재를 컴퓨터에서 캡쳐(컴퓨터에서 영상을 디지털로 전환하여 데이터로서 저장하는 것)할 때 압축비와 캡쳐포맷을 설정하는 M-JPEG방식과 달리 촬영시 비디오 카메라에서 이미 5:1의 고정 압축비와 720X480, 29.97fps(NTSC)의 포맷으로 압축저장 된다는 특징이 있습니다. 이로 인해 캡쳐의 과정이 IEEE-1394인터페이스에 의한 파일전송 수준으로 간단해졌다는 것과 포맷이나 압축비의 설정이 필요없다는 장점이 있습니다.
M-JPEG와 마찬가지로 공간적 압축방식만을 사용하므로 디지털 비디오 편집에 적당한 포맷이며 초당 3.6MB의 전송률도 최근 PC의 비약적인 발전으로 충분히 소화가능한 데이터량이 되었습니다. IEEE-1394인터페이스의 사용으로 디지털 방식의 연결을 사용하므로 장비특성에 의해 호환이 되지 않는 비디오 장비가 있다는 것이 단점입니다만, 최근 OHCI라는 IEEE-1394 인터페이스 관련 칩셋의 표준화가 완성됨에 따라 가장 각광받고 있는 편집용 디지털 비디오 포맷이 되어가고 있습니다.

③MPEG(Moving Picture Experts Group) : 디지털 비디오 편집보다는 매체용 포맷으로 더 각광받고 있는 디지털 비디오 포맷으로 동영상에 관련된 거의 모든 압축방식에 관한 내용을 포괄할 정도로 다양한 압축방식과 포맷을 규정하고 있습니다.
수많은 내용중 많이 사용되는 것은 VideoCD에 주로 사용되는 MPEG1과 DVD에 사용되고 있는 MPEG2, 인터넷등의 네트워크용 영상포맷으로 사용되는 MPEG4등이 있습니다. 공간적 압축방식과 더불어 시간적 압축방식을 사용하여 화질에 비해 압축효율이 월등하며, 관련된 하드웨어와 소프트웨어가 가장 많은 포맷입니다.
MPEG1은 352x240 29.97fps (NTSC VCD기준)의 포맷으로 요즈음의 기준으로는 그다지 고화질이 아니지만 PC수준에서 다루기 용이한 데이터 사이즈로 현재도 가장 많은 사용자층을 가지고 있습니다.
MPEG2는 720X480, 29.97fps(NTSC 표준DVD기준)의 포맷으로 현재 실용화된 가장 고화질의 매체용 포맷이라고 할 수 있습니다. MPEG4는 현재 인터넷방송에 주로 사용되고 있으며 네트워크 전송대역폭에 따라 압축비가 결정되며 현재까지 최고의 압축비를 자랑하는 포맷입니다.

④Cinepak : Radius사에서 개발한 소프트웨어 방식의 압축포맷으로 해상도와 압축비의 자유로운 설정이 가능하며 하프사이즈(320X240)에서 용량대비 화질이 우수하고 재생시 시스템에 걸리는 부하가 작아 멀티미디어 CDROM타이틀에 가장 많이 사용되었습니다.
최근에는 사용빈도가 많이 줄었으며 압축시 시간이 많이 소요된다는 단점이 있습니다.

⑤Indeo(Intel Video) : 인텔사에서 개발한 소프트웨어 방식 압축포맷인데 초기엔 별로 각광받지 못하다가 인텔사의 강력한 드라이브와 버전업에 따른 기능 및 화질의 향상으로 최근 들어 멀티미디어 CDROM타이틀 및 화상회의, 자료용 영상등에 많이 사용되고 있습니다.
압축속도가 크게 향상됨은 물론 다양한 포맷에 적용이 가능하고 가변압축비와 용량대비 화질도 우수해졌습니다.

Posted by 고단한개발자

2008. 9. 29. 18:23

영상압축

2008. 9. 29. 18:23 in 개발/Image Processing

MPEG (Motion Joint Photograhic Experts Grout)

1. MJPEG 기술 소개

MJPEG(Motion JPEG)은 JPEG(Joint Photographic Experts Group)영상을 기초로 JPEG프레임사이에 시간정보를 넣어 나열한 동영상 스트림의 일종이다. MJPEG을 이해하려면 먼저 JPEG에 대한 기술을 알아야 한다. JPEG은 국제표준화기구인 CCITT와 ISO에 의해 정의된 정지영상(Continuous Tone Still Image) 압축에 대한 국제표준으로, 이진영상을 제외한 그레이레벨 영상이나 컬러영상 등 거의 모든 2차원 정지영상을 압축하기 위해 필요한 사항을 명시하고 있다. JPEG은 손실이 없는 압축방법 (Lossless Compression: Predictive Coding)과 손실이 있는 압축방법 (Lossy Compression: Transform Coding) 모두를 지원하며, 응용에 따라 사용할 수 있는 여러 가지 동작모드를 가지고 있다.

JPEG이 제정되기 이전에도 영상을 압축하기 위해 여러 가지 방법들을 사용되고 있었다. 그러나 모든 분야가 다 그렇듯이 정해진 표준규격이 없다는 것은 상호 간에 호환성의 문제를 발생시켜 시장 및 기술발전을 저해하는 결과를 낳는 요인이 된다. 영상 압축의 경우도 마찬가지여서 당시 각 기업마다 서로 다른 압축방법을 사용해서 제품을 만들었기 때문에 사용자와 제작자가 모두 불편을 겪고 있었다. 이러한 불편함을 없애고 응용의 확대와 영상압축기술의 발전을 위해 국제표준으로 제정된 것이 바로 JPEG이다.

JPEG기술은 사진과 같은 자연영상을 약 20:1이상 압축할 수 있는 성능을 가지고 있어, 현재 사용되고 있는 정지 영상 파일 포맷 중에서는 가장 높은 압축률로 영상을 압축하여 저장할 수 있다. 그러나, JPEG는 기존의 영상 파일 포맷과는 달리 영상을 압축할 때 영상 정보의 일부를 손실하기 때문에 의료 영상과 같이 매우 중요한 영상을 저장하는 데는 사용할 수 없다. JPEG의 압축기술에 대해 간략하게 알아보자면 표준안에는 기본적인 구성과 기능, 정밀도 및 오차에 대한 권고사항만 명시되어 있고, 실제 구현에 관련된 부분에는 상당한 융통성을 부여하고 있다. 따라서 제작자는 기술적인 요구, 효율 및 응용 등에 따라 조금씩 다른 JPEG시스템을 구현할 수 있으며 대표적인 방법은 다음과 같다.

◈ DCT(Discrete Cosine Transform)압축 방법 : JPEG의 기본 압축 방법으로, DCT에 기 반한 유손실 압축 방법이다.

◈ 점진적 전송이 가능한 압축 방법 : 영상 파일을 읽어오는 중에 화면 출력을 할 수 있도 록 한 압축 방법이다.

◈ 계층 구조적 압축 방법 : 피라미드 코딩 방법이라고 하며, 하나의 영상 파일에 여러 가 지 해상도를 갖는 영상을 한번에 저장하는 방법이다.

◈ 무손실 압축 방법 : JPEG표준에는 DCT가 아닌 2D-DPCM을 이용한 압축 방법을 이용 하여 무손실로 영상을 압축할 수 있는 방법도 있다.

JPEG에는 이러한 여러 가지 압축방법중에서 최소한의 기본적인 시스템 요구사항이 정의되어 있는데, 이를 베이스라인 모드(Baseline Mode) 라 한다. 모든 JPEG을 지원하는 시스템은 베이스라인모드는 필수적으로 지원해야 한다.

홈오토메이션 장비에 들어가는 MJPEG(Motion JPEG)은 베이라인 모드를 사용하는 JPEG을 기반으로 JPEG정지영상에 시간정보를 포함하여 동영상처럼 구현하는 기술로 표준은 정해져 있지 않으나 업계에서는 동영상을 구현할 때 MPEG보다 쉽게 구현할 수 있기 때문에 많이 사용하고 있는 기술이다. 간단하게 구현되 MJPEG Codec에 대해 설명하면 각 화면을 연속된 프레임의 비트스트림으로 만들고 프레임과 프레임 사이에 프레임에 대한 정보를 삽입하여 재생될 때 삽입된 정보를 이용하여 시간동기화라든지, 영상크기등 참고하여 동영상처럼 재생하게 된다.

2. 홈오토메이션장비에서의 MJPEG의 용도

홈오토메이션 장비에서 MJPEG의 용도는 방문객의 영상이나 세대에 설치된 카메라 영상을 네크워크를 통해 HomePDA나 인터넷상으로 확인을 할 수 있는 시스템에 사용되는 기술이다. 가정에 방문객이 방문했을 때 세대주가 비디오도어폰으로 확인을 못할 경우 즉, 세대주가 근거리에 있을 경우 방문객을 네트워크를 통해 HomePDA로 확인을 하거나 원거리에 있을 경우 방문객을 인터넷상으로 확인할 수 있는 시스템에 사용된다. 자세히 설명하면, 세대주가 외출시 방문자를 아파트의 공동현관이나 세대 현관카메라의 영상을 MJPEG으로 압축을 하여 세대주가 근거리에 외출시에는 네트워크를 통해 세대주의 HomePDA에 송신을 하게되고 이때 HomePDA는 수신된 압축영상 스트림을 복원하여 화면에 디스플레이하여 세대주에게 방문객을 확인할 수 있게 하는데 사용된다. 또한 세대주가 원거리 외출시에는 방문객을 MJPEG으로 저장을 하여 세대주가 인터넷으로 세대주의 홈오토장비에 접속할 때 방문객의 정보를 보여주거나 외출 후 세대에서 홈오토장비로 방문객을 검색할 때 저장된 MJPEG영상을 보여줄 때 사용된다. 또한 세대내에 카메라를 설치하여 세대에서 일어나는 화면을 MJPEG으로 압축하여 네트워크를 통하여 HomePDA나 인터넷을 통해 볼 수 있게 하는데 사용되어지는 기술이다.

3. MJPEG의 다양한 활용방안

MJPEG은 영상이 필요한 다양한 분야에서 응용될 수 있다. MJPEG을 PC용 웹카메라나 TV수신카드등을 이용하여 개인이 필요한 영상을 만들 수 있으며, 이외에 DVR 업체에서는 카메라 영상을 저장할 목적으로 사용할 수 있다. 또한 웹서버카메라에 사용할 경우 일반사용자가 인터넷상에서 웹으로 카메라에 접속할 경우 웹카메라서버가 가리키고있는 영상을 내용을 볼 수 있다. 따라서 MJPEG은 인터넷의 다양한 전송속도 환경에서도 문제가 없고 적은 비용으로 여러 사용자에게 동시에 영상을 전송하는 것도 가능하므로 주로 많이 사용되고 있다.

4. MJPEG의 발전추이

현재 정지영상의 대표로 불리는 JPEG에서 현재 가장 중요한 프로젝트는 JPEG2000이다. JPEG 2000은 기존의 JPEG에다 다양한 기능을 종합한 차세대 정지영상규격이며 특히 국제전기통신연합(ITU)-R SG8과 ISO/IEC JTC1/SC29/WG1에서 동시에 표준화를 수행하고 있다.

JPEG2000은 자연영상, 과학영상, 의료영상, 원격탐사영상, 문서영상, 그래픽영상 등과 같이 서로 다른 특성을 갖는 다양한 형태의 정지영상에 하나의 통합된 부호를 부여하는 것으로 현재 표준화가된 상태이다. 기존의 JPEG가 정지영상 압축표준으로 선정된 후 다양한 응용사례와 하드웨어가 공급되어 멀티미디어 서비스에 크게 이바지하였으나 21세기에 사용하기에는 제한된 성능 때문에 응용분야의 한정이 문제가 되어 왔다. 즉 저조한 압축성능, 통합되지 못한 유/무손실 압축시스템, 대용량 영상에의 적용 불가능, 잡음환경에서의 낮은 전송 안정성, 그래픽 등과 같은 인위영상의 압축성능 저하, 복합문서의 압축성능의 열화 등이 그것이다.

JPEG 표준화 이후 JPEG 무손실(Lossless) 압축기법의 표준화도 완성되었으나 이들이 하나의 통합된 시스템으로 구현되지 못하는 단점을 가지고 있다. JPEG2000이 사용될 응용분야는 의료영상, 인터넷영상, 원격탐사, 영상저장, 그래픽스 및 컴퓨터 합성영상, 팩시밀리, 인쇄 및 출판영상, 레이저 인쇄, 디지털카메라, 스캐너 및 디지털 복사기, 경제 문서, 보안용 카메라, 지구영상처리, 사진 및 미술품의 디지털도서관 등 정지영상이 관련된 전분야를 망라하고 있다. JPEG2000은 지난 97년 11월 시드니에서 열린 표준화회의에서 총 26개의 압축방식이 제안되었으나 미국의 한 대학에서 제안한 웨이블렛 기반의 압축기법이 채택되었다.

JPEG2000은 프린터, 스캐너, 디지털카메라, 컴퓨터, 인터넷 등에 응용될 수 있어 HP, 캐논, 후지, 코닥 등 관련 업체들의 활동이 활발하다. 이들은 JPEG2000이 DIG2000이라는 영상포맷을 지원할 수 있도록 제안하고 있어 다른 분야에서 개발되고 있는 정지영상 기술이 JPEG2000에 포함되도록 노력하고 있다. JPEG2000의 특허는 초기 과제 설정 시 JPEG에서와 같이 무료로 하기로 결정되어 이를 계속 추구하고 있다. 또한 현재 업계에서는 JPEG2000을 응용한 MJPEG2000(Motion JPEG2000)에 대한 제품도 활발히 진행되고 있다.

5. MJPEG 기술 확보 범위

     당사 MJPEG 보유 기술
     - Linux용 JPEG 라이브러리
     - Windows용 JPEG 라이브러리
     - Linux용 MJPEG Codec
     - Windows용 MJPEG Codec

MJPEG을 바탕으로 만든 DVR System 제품을 출시한바 있다. 현재 당사는 보다 나은 성 능을 위해 다음과 같은 기술을 연구개발하고 있다.

     - Linux용 JPEG2000 라이브러리
     - Windows용 JPEG2000 라이브러리
     - Linux용 MJPEG2000 Codec
     - Embedded Linux용 MJPEG2000 Codec
     - Windows용 MJPEG2000 Codec

위의 MJPEG 기술개발 완료시 홈오토메이션 장비뿐 아니라 여러분야에 적용시켜 고화질 의 영상을 사용자에게 제공할 수 있다고 본다.

MPEG-4(Moving Picture Experts Group)

Netcam-3000 시스템에서 사용되는 영상 압축복원기술인 MPEG-4

1. MPEG 소개

MPEG(Moving Picture Experts Group)은 멀티미디어 환경에 가장 핵심이 되는 기법인 디지털 동영상의 압축 부호화를 위한 국제적인 표준안으로 정식 명칭은 ISO/IEC JTC1/ SC29/WG11 이다. 사실 동영상의 압축 부호화는 MPEG 이외에도 하드웨어/소프트웨어 업체를 중심으로 활발한 연구가 진행되어 왔다. 영상에 대한 국제 표준으로 가장 기본적이고 오래된 것으로는 BT.601 표준이 있다. 이것은 TV신호를 디지털로 표현하는 표준으로 1982년 ITUR(International Telecommunications Union-Radio Communication Sector: 무선통신 분야의 표준화를 담당하는 기구)에서 제정하였다. 하지만 이 표준은 영상 압축을 하지 않은 표준이기 때문에 너무나 데이터량이 많았다. 따라서 데이터량을 줄이기 위해 압축을 지원한 표준이 필요하게 되었는데, 이때 처음 제정된 표준이라고 할 수 있는 것이 요즘 화상회의나 화상전화에 많이 사용되는 H.261이다. 이것은 실제로 MPEG에 많은 영향을 준 표준이기도 한다.

H.261 표준은 1990년에 만들어진 표준인데 이때부터 많은 표준이 제정되었다. 이후로 정지영상의 표준인 JPEG 표준이 완성됐으며 MPEG은 1992년에 첫 MPEG 표준인 MPEG-1(공식명칭: ISO/IEC 11172) 표준이 완성되었다. MPEG-1/2/4에 대해 자세히 알아보면 MPEG-1/2의 압축 알고리즘은 JPEG 정지화상 압축 알고리즘과 H.261 동화상 압축알고리즘등을 발전 계승시킨 것이다.

MPEG에서는 모든 프레임을 개별 정지화상으로 압축하는 것이 아니라, 인접프레임사이에 유사점이 많다는 점을 이용한다. 즉, 동작보상을 하는데 있어 예측과 보간을 이용한다. 그러나 임의 접근과 같은 VCR식 제어가 가능해야하는 등 여러 이유로 인해 MPEG 비디오에서는 자신이 갖고 있는 정보만으로도 복원될 수 있는 프레임이 규칙적으로 삽입돼야 한다. 이러한 프레임은 JPEG과 아주 유사하게 정지화상으로 압축된다. MPEG의 프레임 타입에는 세가지 종류가 있다.

먼저 I-프레임(Intra-coded frame)은 데이터 스트림의 어느위치에도 올 수 있으며, 데이터의 임의 접근을 위해 사용되며, 다른 이미지들의 참조없이 부호화된다. I-프레임은 정지화상 압축방법(JPEG)을 이용하지만, JPEG과는 달리 MPEG에서는 실시간으로 압축이 이루어진다. I-프레임의 압축은 MPEG에서 가장 낮은 압축률을 보인다. I-프레임은 매크로블럭 내에서 지정된 8×8블럭으로 나누고, DCT 기법을 사용한후, DC계수는 DPCM방법으로 부호화하는데, 연속한 블록사이의 차이값을 계산한 후 가변길이 코딩을 사용해 변환한다.

두 번째로 P-프레임(Predictive-coded frame)을 살펴보면 부호화와 복호화를 행할 때 이전의 I-프레임의 정보와 이전의 P-프레임의 정보를 사용한다. P-프레임은 연속되는 이미지들의 전체 이미지가 바뀌는 것이 아니라 이미지의 블록이 옆으로 이동한다는 점에 착안한 것이다. 즉, 움직임이 있는 경우 앞 화면에 있는 물체자체의 모양에는 큰 변화 없이 옆으로 이동하는 경우가 대부분이므로, 이전의 화면과 현재의 화면의 차이가 매우 적은 것을 이용해 차이값만 부호화하는 것이다.

마지막으로 B-프레임(Bidirectional-coded frame)은 부호화와 복호화를 행할 때 이전, 이후의 I-프레임과 P-프레임 모두를 사용한다. B-프레임을 사용하면 높은 압축률을 얻을수 있다. B-프레임은 이전의 I-프레임 또는 P-프레임과 B-프레임 이후의 I-프레임 또는 P-프레임의 차이값을 가진다. MPEG 비디오의 핵심기술은 이전프레임과 현재의 프레임의 차이를 이용해 움직임을 추정하고 이를 보상해주는 ME/MC(Motion Estimaiton/Motion Compensation)기법과 유효 데이터를 최소화하기 위한 변환 부호화인 DCT의 적용이라고 볼 수 있다. 움직임(동작)보상과 DCT라는 부호화의 기본적인 구조는 H.261과 같지만, 기본적으로 H.261은 통신매체를 대상으로 하고 MPEG-1은 저장매체를 위한 것이기 때문에 섬세한 부분에서는 몇몇부분에서 차이가 난다.

MPEG은 I와P-프레임외에 Bidirectional 프레임이라는 또 하나의 B-프레임이 추가된다. MPEG-2 표준에 대해 알아보면 MPEG-2는 기술적으로 H.261 표준과 MPEG-1 표준의 연장선상에 있지만, 이러한 기존의 표준들보다 훨씬 다양한 영역에 적용될 수 있으며, 다음과 같은 특징을 갖는다.

높은 화질의 영상을 제공할 수 있기 때문에 고선명 TV화질까지 포함할 수 있고 각화면을 프레임단위나 필드단위로 처리할수 있으며 순차수사(Progressive Scanning)의 영상, 격행주사(Interlaced Scanning)의 영상처리가 가능하다. 또한 화면의 크기나 프레임의 비율이 다른경우를 동시에 효율적으로 처리할수 있는 계층적 분해 능력(Scalability)을 가지고 있다.

MPEG-2는 뛰어난 성능과 유연성을 가진 특성으로 인해 멀티미디어 스트리밍에 중요한 부분을 차지하고 있다. 또한, MPEG-2는 자체에 오디오와 비디오의 계층화, 부호화 및 복호화지연, 저장 및 전송시의 잡음에 의한 에러대책, MPEG-1 및 H.261 표준과의 순방향 호환성(Forward Compatibility), 랜덤 억세스 및 채널 변경(ChannelHopping), 앞/뒤로 가기/정지/빨리 가기등 특수효과, 서라운드 오디오를 위한 다채널 음향 및 다국어 음성수용, 여러프로그램의 다중화, 암호화, 편집기능, ATM전송과같은 가변데이터율처리등을 지원하기 때문에 복잡한 구조이지만 스트리밍에 있어 중요한 부분을 차지하고 있는 압축기술이다.

MPEG-4는 1994년 64Kbps 이하의 전송율에서 고화질의 영상을 제공할수 있는 동영상 압축표준을 목표로 출발한 것으로 고성능멀티미디어 통신 서비스를 고려해 기존 방식뿐만 아니라 새로운 기능을 지원하기 위한 영상의 내용에 근거한 영상신호의 부호화를 목표로 하고 있는 압축표준으로 주로 멀티미디어 통신을 목표로 한다. MPEG-4표준은 제작사, 서비스 공급자, 사용자의 요구를 만족시키기 위한 방법을 제공하려는데 초점을 두고 있다.

제작자에게는 제작상의 최대효율을 올리기위해 디지털 TV나 애니메이션 그래픽, 웹페이지와 같은 내용을 다루는데 있어 훨씬 재사용이 높고 유연한 작업을 할수 있도록 했고, 서비스 제공자들은 MPEG-4를 이용해서 서비스 제공 지역에 따라 적합하게 해석돼 서비스가 제공될수 있도록 투명하게 정보를 활용할 수 있도록 했다.

사용자에게는 제작자가 설정해 놓은 범위내에서 최대한 상호 작용할 수 있도록 했다. MEG-4는 멀티미더 전송 통합 프레임워크(DMIF, Delivery Multimedia Integration Framework)를 응용 프로그램과 네트워크 사이에 둬 네트워크를 통한 원거리 응용프로그램에 명령을 내릴수 있도록 편의성을 제공한다. 이 DIMF 구조를 구현해 단순한 인터페이스를 가진 응용프로그램이 자세한 네트워크에 대한 고려를 하지 않아도 되게 했다. 이러한 다양한 기능을 하나의 알고리즘으로 구현하는 일은 불가능하기 때문에 MPEG-4에서는 많은 압축 요소를 표준 메뉴형식으로 수용해 응용에따라 선택할 수 있도록 했다. 즉, 압축에 필요한 도구들을 정하고, 이 도구를 결합해 여러 압축알고리즘을 만들며, 하나이상의 알고리즘과 프로파일을 MSDL(MPEG-4 Syntactic Description Language)이라는 언어를 새로 만들어 정의 한다. 따라서 MPEG-4 응용 프로그램간의 데이터 송수신은 우선 상대가 어떤 프로파일, 알고리즘, 도구의 복호기를 갖고 있는지 확인해 복호가능한 모드로 교신하고 필요한 경우, 복호에 필요한 프로그램을 먼저 다운로드한훈 내용물을 전송하다.

2. Netcam-3000의 MPEG-4 용도

위와 같은 MPEG-4기술은 Netcam-3000에서 감시가 필요한곳의 영상을 원격지로 전송되는데 필요하다. 개발이 완료된 Netcam-2000의 경우 동영상 압축방식이 MPEG-1으로 수신 단말측의 대역폭이 작으면 영상을 보기가 어려워 낮은 비트율에서도 동영상전송이 가능한 MPEG-4방식으로 Netcam-3000을 준비중이다. MPEG-4기술은 Netcam-3000서버의 영상압축부분과 원격지에서 사용되는 Viewer 부분의 영상복원에서 사용된다.

먼저 Netcam-3000 서버에서는 카메라영상으로부터 MPEG-4 방식으로 압축을 하며, 원격지로부터 영상전송에 대한 요청이오면 MPEG-4 방식으로 압축된 영상을 네트워크로 전송하게 된다. 원격지에서는 Viewer 프로그램에 MPEG-4 스트림을 복원할 수 있는 코덱을 삽입하여 Netcam-3000서버에 접속하여 카메라 영상을 요청하여 수신된 MPEG-4 스트림을 복원시켜준다. 또한 MPEG-4는 IMT-2000의 동영상전송의 표준이므로 향후 Netcam-3000영상을 IMT-2000 단말기에서도 영상전송이 가능할 것이다. 이와 같이 MPEG-4 영상압축복원 기술은 Netcam-3000서버에서 눈의 역할을 하는 중요한 기술이다.

3. MPEG-4의 응용범위

MPEG-4 영상압축 복원 기술은 Netcam-3000 뿐만 아니라 여러 가지 응용분야에 이용할 수 있다. 개인간 통신 또는 다자간 영상회의, 영상전화등에 사용될 수 있으며 멀티미디어 전자우편, 멀티미디어 대화형 데이터베이스, 멀티미디어 비디오 텍스, 멀티미디어를 이용한 교육, 대화형 훈련, 오락등에 이용될 수 있다.

4. MPEG-4의 발전추이

현재 동영상 압축기술은 MPEG-4를 이후로 압축에 대한 표준화는 거의 하고있지 않다. MPEG-4 다음 버전인 MPEG-7의 경우 압축이 목적이 아닌 멀티미디어의 검색에 목적을 두고 있기 때문이다. 그러나 MPEG-4 표준안 그룹에서는 1998년 초기 버전이 완성된이후에 여러 가지 제안들을 받아서 버전을 업데이트를 하고 있는 실정이다. 따라서 동영상 압축에 대한 기술은 더 이상 진보되지 않고 향후 몇 년간 MPEG-4를 기준으로 시장이 형성될 것이다.

5. MPEG-4 기술 확보 범위

당사에서는 다음과 같은 항목을 만족하는 MPEG-4코덱을 개발중에 있다.

     - ISO/IEC 14496-2, MPEG4 SOP @LEVEL3
     - 525/60(NTSC) up to 720x480 @ 30fps, 625/50(PAL) up to 720x576 @ 25fps
     - Supports I, P & B Frame Compression
     - Flexible GOP Structure : Variable M,N - IBBP, IBP, IP, I frame only
     - Bit rate control : VBR/CBR
     - Color Format : 4:2:2 to 4:2:0 conversion
     - Error Concealment/Resilience : Resync Marker
     - Adaptive Field/Frame Modes, Field/Frame DCT
     - Alternate & Zigzag Scan Support
     - Random Access within Video Stream

Posted by 고단한개발자

2008. 9. 29. 17:47

DCT ?

2008. 9. 29. 17:47 in 개발/Image Processing

변환을 통해 대상 정보를 압축하기 용이하도록 가장 적합한 표현으로 바꾸는 것이다. 즉 변환 자체는 압축이 아니다.

영상 압축을 위해 DCT(discrete cosine transform)방식을 많이 사용한다. 이 DCT를 이용하면 영상을 공간영역에서 주파수 영역으로 변환할 수 있으며, 영상 데이터는 변화가 적으므로 낮은 주파수, 특히 0 주파수(DC)성분이큰 값을 가지게 되고 높은 주파수 성분은 상대적으로 낮은 값을 갖게되므로서, 대부분의 정보가 낮은 주파수 쪽으로 몰리게 되므로 양자화 과정을 적절히 거치면 높은 압축률로 우수한 화질을 얻을 수 있다.

벡터 양자화 기법은 특히 음성(speech) 부호화에 적합하다.

from more http://mmlab.snu.ac.kr/~shlee/MMCW/comp4_6.htm

영상 압축에 많이 이용되는 알고리즘으로는 JPEG, MPEG, DVI, AVI등이 있고 압축율도 2:1 정도에서부터 200:1까지 매우 다양하다. JPEG이나 MPEG은 국제 표준으로 정해져 있는 압축 알고리즘으로 압축 기법으로는 DCT(Discrete Cosine Transform)-변환 코딩의 한 형태-를 이용하며 JPEG은 정지영상을, MPEG은 동영상을 압축하는 규격이다. AVI는 마이크로 소프트의 윈도우 운영체계에서 기본으로 사용하는 동영상 압축 규격이며 Video for Windows등이 이를 지원한다.

영상 압축 연산에서 DCT(Discrete Cosine Transform)가 많은 종류의 다양한 영상에 대해 가장 잘 동작함이 밝혀졌다. DCT는 푸리에 변환가 유사하지만 차이점은 DCT가 매우 작은 크기의 영상을 간편하게 표현하는데 더 낫다는 것이다. 작은 픽셀 블록이 일반적으로 블록 코딩에 쓰이기 때문에, DCT를 많이 쓰는 것이다. 그러나 DCT는 퓨리에 변환보다 더 많은 계산량을 요구한다.