이미지란, 숫자로 구성된 3D array로 앞에서 말한 숫자는 0부터 255까지로 이루어져 있습니다.
이미지 데이터를 분석하고 분류하는데 있어서는 여러가지 challenge가 존재합니다.
1. Viewpoint : 어느 시각에서 보느냐에 따라 달라 보이는 것
2. Illumination : 조명(밝기)에 따라 이미지가 달라 보이는 것
3. Deformation : 우리가 일반적으로 알고 있는 모습과는 다른 형태
4. Occlusion : 어딘가에 은폐, 은닉하여 알아보기 힘든 것
5. Background Clutter : 배경에 융화되어 잘 보이지 않는 것
6. Intraclass Variation : 같은 이름으로 분류되지만 그 형태가 다양한 경우
원래는 모델을 만들 때 predict하는 모델 하나만을 만들어 image를 매개변수로 집어넣고, 예측을 진행하여 이 image가 어느 class_label에 속하는지 분류하였다.
def predict(image):
return class_label
이전의 이미지 분석 방법을 이용한 예시 중에는 Lena가 있습니다.
Lena는 위에 보이는 한 여성의 사진으로 이 이미지를 분석한 방법으로는 선의 배열의 규칙을 찾아서 각각을 저장한 다음 이를 합쳐서 이미지를 저장 및 분류하는 것이 있습니다. 그러나 이내 이러한 방법의 비효율성이 눈에 띄어 현재에는 다른 방법을 사용합니다.
Data-driven approach는 현재 흔히 사용하는 이미지 데이터 분석/분류 기법입니다.
1. 이미지와 레이블에 대한 데이터를 수집한다.
2. 이미지 분류기를 훈련시키기 위해 머신러닝을 사용한다.
3. 테스트 데이터로 분류기를 평가한다.
Data-driven approach를 구현하는 방법은 train과 predict 총 2개의 함수를 사용하는 방법입니다.
train에서는 모델을 도출하고, predict에서는 모델을 테스트 이미지에 대해서 예측을 시켜 label을 반환하는 방식입니다.
위의 방식을 사용하는 분류기에는 여러 종류가 존재합니다.
최근접 이웃 분류기: 최근접 이웃 분류기는 가장 간단한 이미지 분류 알고리즘으로 소개됩니다. 이는 테스트 이미지에 가장 가까운 훈련 세트 이미지를 찾아 해당 이미지의 레이블을 테스트 이미지의 예측 레이블로 사용하는 방식입니다. 최근접 이웃 분류기는 정확도가 높지만, 특히 대규모 데이터셋에서는 계산 비용이 많이 듭니다.
k-최근접 이웃 분류기: k-최근접 이웃 분류기는 최근접 이웃 분류기보다 개선된 방식으로, 테스트 이미지에 가장 가까운 k개의 훈련 세트 이미지를 찾아 이들의 레이블의 과반수를 사용하여 테스트 이미지의 예측 레이블을 결정합니다. k-최근접 이웃 분류기는 최근접 이웃 분류기보다 계산 비용이 적지만, 과적합 문제가 발생할 수 있습니다.
선형 분류: 선형 분류는 선형 함수를 사용하여 이미지 픽셀을 레이블 점수에 매핑하는 인기있는 이미지 분류 알고리즘으로 소개됩니다. 강의는 선형 분류기의 기본 아키텍처 및 손실 함수와 경사 하강법을 사용하여 분류기를 훈련시키는 과정을 다룹니다.
소프트맥스 분류기: 소프트맥스 분류기는 레이블 점수 대신 각 클래스에 대한 확률 점수를 출력하는 선형 분류기의 변형으로 소개됩니다.
'AI > Computer Vision' 카테고리의 다른 글
[Computer Vision] cs231n lecture4 - Backpropagation andNeural Networks part 1 (0) | 2023.05.12 |
---|---|
[Computer Vision] cs231n lecture3 - Loss Functions and Optimization (0) | 2023.03.24 |
댓글