Loading...
Introduction

Visual Media란?

영상미디어란 시각적으로 소비 및 활용하는 디지털 영상을 말하며, TV, 휴대폰, 인터넷 등을 통해 소비되는 2D 영상뿐만 아니라 VR/AR 영상, 입체공간 영상을 포함합니다.

  • UHD/8K/16K 고화질 2D 영상
  • HMD 등을 활용한 VR/AR 영상
  • 멀티뷰 3D, 라이트필드, 홀로그램 등 입체공간 영상

최근 들어 디지털 영상미디어가 질적/양적으로 팽창하고 있으며, 인공지능 기술과 접목되어 지능화/고도화 되면서 자율주행/국방/의료/교육 등 타 산업으로도 기술/서비스가 확산 되고 있습니다.

따라서 영상미디어 분야의 중요성과 파급력은 앞으로도 점점 커질 것으로 전망됩니다.

영상미디어 연구를 위한 핵심 기술로는 "영상처리", "머신러닝", "컴퓨터비전" 등이 있으며, 우리 연구실은 개발된 기술의 국제표준화를 통해 실감나는 디지털 세상을 만드는 데 기여하는 것을 지향합니다.
Visual Media의 예시 표준화 회의
Our Vision

Research Goal

"Human & Machine Vision 모두를 위한
영상미디어 처리 기술을 개발합니다."

연구 목표 다이어그램
핵심 목표

최소한의 데이터량으로 인간의 시각적 품질(Visual Quality)과 기계의 지능형 비전(Machine Vision Intelligence) 성능을 동시에 극대화하며, 이를 국제 표준(International Standards)에 기여합니다.

Research Focus
01
Neural Image & Video Coding

딥러닝 기반 차세대 영상 압축 기술

02
Video Coding for Machines

머신 비전을 위한 영상 압축

03
Neural Holography

신경망 기반의 홀로그램 생성/압축 및 복원 기술

Research Focus 01

Neural Image & Video Coding (NVC)

전통적인 Hand-crafted 코덱(AVC, HEVC, VVC 등)을 넘어, End-to-End 최적화된 신경망 기반 영상 압축 기술을 연구합니다. Learned Image Coding을 활용하여 기존의 Hand-crafted 방법론을 대체하고, 시각 데이터를 훨씬 더 효율적으로 압축하는 차세대 기술입니다.

Tool-based Approach
Easy adaptation to existing architecture & extension to inter-coding
End-to-End Approach
Totally new design, works fine for image. (Researching video extension)
tool-based E2E-based
Research Focus 02

Video Coding for Machines (VCM)

저희 연구실은 인간 시각 뿐만 아니라 Machine Vision Model(분류, 탐지, 분할 등)을 위한 최적화된 영상 압축 기술을 개발합니다. 화소(Pixel) 자체를 압축하는 대신, 신경망의 "중간 특징맵(Intermediate Features)"을 압축하여 데이터 크기를 획기적으로 줄이면서도 머신 비전 태스크의 성능 저하를 최소화하는 FCM 기술을 연구합니다.

Joint Optimization
Bitrate (bpp) vs Machine Performance (mAP)
FCTM 파이프라인
Research Focus 03

Neural Holography

홀로그래피는 물체의 빛을 공간상에 그대로 재현하여 기존 3D 디스플레이의 문제인 수렴-초점 불일치가 없는 이상적인 기술입니다. 하지만 방대한 데이터량과 높은 해상도를 요구합니다.

저희는 방대한 홀로그램 데이터를 효율적으로 처리하는 신경망 기반 홀로그램 압축 및 생성 기술을 연구합니다.

NHVC (Neural Hologram Video Coding)
Phase Hologram Image/Video Compressor & Generator
Neural Holography 파이프라인