딥러닝을 위한 이미지 처리 기반의 데이터 증강
- Alternative Title
- Image processing based data augmentation for deep learning
- Abstract
- 이미지를 다루는 심층 학습 분야에서는 CNN 구조의 모델을 많이 사용한다. CNN 모델의 매개변수가 학습데이터보다 많을 때, 훈련 성능은 좋지만 테스트 성능이 좋지 않은 과적합이 발생할 수 있다. 이처럼 일반화 능력이 떨어질 때, 단순히 데이터 수집을 통한 해결은 비용이 들고 효율적이지 못하다. 일반화 성능을 향상시키는 방법으로 데이터 증강법과 규제화이 있다. 데이터 증강법은 원본 데이터를 뒤집기, 자르기, 색 지터(color jitter) 등의 처리를 통해서 데이터의 다양성을 확보하는 방법이다. 규제화은 학습 중 파라미터나 중간 특징(feature)을 규제하는 방법을 통해서 과적합을 방지하는 것이다. 데이터 증강법에서는 Fast R-CNN, Style Gan 등과 같은 심층 신경망을 활용하는 방법이 있지만, 추가적인 모델 학습과 데이터 처리가 비용이 든다. 반면, Random Erasing, Cutout, Hide-and-Seek 같은 방법은 비용이 적게 들지만, 이미지의 일부를 무작위로 지우기에 확률에 의존한다.
본 논문은 이미지 분류 모델에 대한 효율적이면서 효과적인 데이터 증강법을 제안하고자 한다. 기존의 증강법 중에 지우기(erasing) 기법들은 객체나 배경에 상관없이 확률적으로 지우기에 최적화할 요소가 다분하다. 기존의 학습된 분류 모델의 분석을 통해서 각 이미지의 CAM(Class Activation Map)을 통해 추가적인 모델 없이 객체의 추정이 가능하다. 이를 바탕으로 객체의 일부의 폐색하여, 효과적인 지우기 데이터 증강법을 제안하고자 한다. Resnet과 CIFAR10을 활용하여 CAM을 활용한 지우기 기법의 성능을 확인한다.|This paper presents a novel approach within the domain of basic data augmentation techniques, specifically focusing on erasing methods. Traditional erasing methods suffer from a drawback of randomly erasing areas, failing to provide various levels of occlusion for objects. Techniques like Random Erasing and Cutout sometimes erase irrelevant background instead of the object, and Hide-And-Seek may also only erase the background, excluding the object. Utilizing Grad-CAM enables the effective erasure of objects of interest within images without requiring additional models. By applying this to Random Erasing, we achieved a more uniform level of various occlusions, thereby enhancing the model's generalization performance. The point of applying the erasing augmentation method was set during the middle epochs of training, allowing the model to sufficiently learn the features of the data. Subsequently, training with augmented data surpassed the performance of the traditional erasing methods.
- Author(s)
- 오주현
- Issued Date
- 2024
- Awarded Date
- 2024-02
- Type
- Dissertation
- URI
- https://repository.sungshin.ac.kr/handle/2025.oak/3100
http://dcollection.sungshin.ac.kr/common/orgView/000000014920
- Alternative Author(s)
- Juhyeon Oh
- Affiliation
- 성신여자대학교 일반대학원
- Department
- 일반대학원 미래융합기술공학과
- Advisor
- 이규중
- Table Of Contents
- Ⅰ. 서론 1
Ⅱ. 관련 연구 3
1. 규제화 연구 3
2. 데이터뱅크 증강법 4
Ⅲ. 제안 방법 11
1. 지우기 증강법 문제점 11
2. 제안 알고리즘 12
3. Class Activation Mapping(CAM) 16
4. 실험 세팅 및 결과 비교 18
Ⅳ. 결론 22
1. 요약 22
2. 한계 및 향후 연구 22
- Degree
- Master
- Publisher
- 성신여자대학교 일반대학원
-
Appears in Collections:
- 미래융합기술공학과 > 학위논문
- 공개 및 라이선스
-
- 파일 목록
-
Items in Repository are protected by copyright, with all rights reserved, unless otherwise indicated.