ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • Chapter01 소개
    공부/Computer Vision 기본 개념부터 최신 모바일 응용 예까지 2024. 9. 11. 13:39
    728x90

    1. 왜 컴퓨터 비전인가?

    2. 컴퓨터 비전 문제는 어떻게 해결하나?

    1. 과학적 접근과 공학적 접근

    컴퓨터 비전의 목표

    1. 사람의 시각에 맞먹는 인공 시각을 만든다

    필연적으로 인간의 시각이 어떻게 작동하는 지 원리를 밝혀낸 다음 컴퓨터로 모방해야함

    =>과학적 접근

    과학적 접근의 2가지 어려움(1. 인간의 시각 과정을 완전히 밝혀낼 수 없음 2. 현재 기술과 컴퓨터로 시뮬레이션 불가능)

    2. 한정된 범위에서 특정한 임무를 달성하는 인공 시각을 만든다

    =>공학적 접근

    이 책에서 제시하는 대부분의 알고리즘

     

    컴퓨터 비전이 어려운 본질적 이유?

    1. 역문제(inverse problem)

    입력 영상은 3차원, 컴퓨터 비전은 2차원으로부터 3차원을 알아내는 과정

    사람은 영상을 보면 필요한 3차원 정보를 쉽게 추론해내지만 현재 그런 추론 기능을 갖는 알고리즘이 존재하지 않음

    2. 컴퓨터 비전이 풀어야 하는 문제 대부분이 불량 문제(ill-posed problem)

    문제의 답이 유일하지 않음

    3. 여러 변형이 동시에 일어남

    4. 영상 획득 과정에서 발생하는 여러 종류의 광학적 잡음

    2. 계층적 처리

    컴퓨터 비전의 처리 과정

    전처리(preprocessing)는 주로 영상 처리(image processing)가 담당 ex)잡음 제거, 초점이 흐린 영상 개선 등

    특징 추출(feature extraction)은 영상에서 에지, 선분, 원, 코너, 텍스처 등의 특징을 추출하는 단계

    ex)Haar-like, HOG, SIFT, SURF 등

    여기까지가 저급 비전(low-level vision)

     

    고급 비전(high-level vision)은 앞에서 추출한 특징을 입력 받아 분석하고 해석하여 고급 묘사(high-level description)을 출력하는 단계

    3. 문제 해결 도구

    자료구조와 알고리즘

    수학

    기계학습

    3. 시스템 설계

    컴퓨터 비전 시스템 설계 과정

    문제 이해=>데이터베이스 수집=>알고리즘 설계와 구현=>성능 평가

    1. 문제 이해

    자신이 맡은 문제에 대해 직관적이고 철저한 이해 선행

    2. 데이터베이스 수집

    고품질의 데이터베이스를 확보한 후 진행해야 효과적

    수집한 샘플은 보통 2개의 집합으로 나뉨

    - 학습집합(=훈련집합) : 시스템을 학습시키는 데 사용할 집합

    - 테스트 집합 : 완성된 시스템의 성능을 평가하는 데 사용할 집합

    =>2개를 합쳐서 데이터베이스라고 부름

    데이터베이스를 이용해서 시스템을 학습시키려면 샘플 영상에 적절한 label을 붙여줘야함

    이러한 label을 ground truth라고 부름

    컴퓨터 비전 시스템이 알아내야 하는 정답

    3. 알고리즘 설계와 구현

    알고리즘 설계

    보통 적절한 알고리즘을 찾을 때까지 다양한 알고리즘을 적용해 보는 휴리스틱한 방식 사용

    프로그래밍

    인텔에서 개발한 OpenCV 라이브러리, Matlab 등

    4. 성능 평가

    오류의 경향을 세밀하게 분석할 때는 혼동 행렬(confusion matrix) 사용

    보통 FPR(거짓 긍정률), FNR(거짓 부정률), 정확률(precision), 재현율(recall)로 측정

    정확률은 TP와 FP 중에 TP의 비율=>찾은 것 중에 맞게 찾은 거의 비율

    재현율은 TP와 FN 중에 TP의 비율=>찾아야하는 것 중에 맞게 찾은 거의 비율

    F-score는 정확률과 재현율을 결합해서 표현하는 지표

    정확률과 재현율을 같은 비중으로 보면 F_1 측정

     

    강건(robust)?

    시스템이 작동하는 외부 환경이 변할 때 성능을 얼마나 잘 유지하는가?

    ex)조명의 변화 또는 대상물을 찍는 거리나 각도가 변함에도 불구하고 성능이 그대로 유지되거나 적은 양만 저하되는 경우=>강건하다

    4. 인접 학문

    영상처리

    영상을 입력으로 받아 처리하여 새로운 영상을 출력

    새로운 영상은 주어진 목적을 달성하는 데 더 적합한 형태

    주로 컴퓨터 비전의 전처리 과정에 사용

    컴퓨터 비전

    영상을 입력 받아, 분석 및 해석하여 고급 묘사 출력

    컴퓨터 그래픽스

    입력된 고급 묘사를 바탕으로 영상을 생성하거나 합성

    패턴 인식

    온갖 종류의 데이터를 패턴으로 간주하고 분석과 분류 작업 수행

    5. 학습을 위한 자원

    - 도서

    - 학술지 및 학술대회 ex)IEEE, IJCV, ICCV, CVPR 등

    - 웹 사이트

    댓글

Designed by Tistory.