[CV] Computer Vision 이란?
카테고리: CV
태그: CV
인공지능과 컴퓨터비전
인공지능(AI)은 인간의 지능, 즉 인지, 지각, 기억, 이해, 사고 능력을 컴퓨터 시스템으로 구현하는 것을 목표로 한다.
이러한 지능을 구현하려면, 먼저 지각 능력을 컴퓨터 시스템으로 옮기는 것이 중요하다.
특히 인간이 다른 감각에 비해 시각에 크게 의존하여 세상을 배우고 이해한다는 점을 고려할 때, 시각 지각 능력의 구현은 인공지능 발전의 핵심 과제 중 하나라고 할 수 있다.
컴퓨터비전(CV)은 인간의 시각 능력을 기술적으로 구현하여 컴퓨터가 인간처럼 사물을 인지하고 해석할 수 있도록 하는 기술이다.
결론적으로, CV는 인간의 시각적 지각을 모방하며, 이는 AI가 현실 세계를 이해하고 학습하는 데 필수적인 역할을 한다.
컴퓨터 비전
CV는 시각 지각 능력(Visual perception & intelligence)을 컴퓨터 시스템으로 구현하는 것이라고 볼 수 있다.
예전에는 고전적인 기계 학습 방법론을 주로 사용했다.
고전적인 기계 학습 방법론
- Feature Extraction:
입력 이미지에서 전문가의 분석에 기반한 특징들을 추출하는 방식이다. - 모델 학습:
추출된 특징과 해결하고자 하는 목표(task) 사이의 관계를 간단한 모델을 통해 학습하는 방식이다.
이 방식은 사람이 수작업으로 특징을 설계해야 하기 때문에 분석 과정이 복잡하고 시간이 많이 소요되는 방식이다.
딥러닝
현재는 딥러닝 방법론이 대부분의 컴퓨터 비전 작업에서 사용되고 있다.
- End-to-End 학습: 전문가가 Feature Extraction을 직접 설계하지 않아도 입출력 쌍만으로 네트워크가 학습 과정을 자동으로 진행하는 방식이다.
이 방법은 구현이 간편할 뿐 아니라 성능까지 뛰어나 대부분의 분야에서 활용되고 있다.
고전적인 기계 학습 방법론 vs 딥러닝
전문가가 직접 특징을 설계하는 것이 더 정확할 것이라는 반문이 있을 수 있다.
- 사람이 데이터를 분석할 때 중요한 정보를 간과할 가능성이 높다.
- 정보를 수식적으로 표현하는 방식에 따라 모델 성능이 크게 좌우될 수 있다.
반면, 딥러닝은 데이터와 학습 알고리즘을 통해 중요한 정보를 추출하기 때문에 상대적으로 정확도가 높다.
- 사람이 직접 특징을 분석하는 과정은 딥러닝에서의 Gradient Descent에 해당한다고 볼 수 있다.
- 데이터를 기반으로 중요한 정보를 추출하는 작업에서는 딥러닝이 사람보다 더 효율적이고 정확한 방식이다.
댓글남기기