본문으로 바로가기

Numpy Image File with torchvision.datasets

category AI 2022. 4. 22. 17:17

Deep Learning Model을 학습하려다 보면 다양한 형태의 Dataset을 마주하게 된다.

대부분의 Vision 관련 DL Model은 Dataset으로 JPG, PNG 등의 형태를 사용하게된다.

 

종종 Numpy Array Image를 Input으로 사용해야하는 경우가 있는데, torchvision.datasets의 경우 '.npy' 확장자를 지원하지 않아 customize를 해야한다.

 

datasets's IMG_EXTENSIONS

 

Customize하는 방법은 어렵지 않다.

 

먼저 Training Dataset을 위한 Transforms를 구현한다.

 

그 다음 numpy array image를 load해 PIL 확장자로 바꿔주는 함수를 선언한다.

numpy array image를 load하는 함수

다음으로 torchvision.datasets.DatasetFolder()를 사용해 dataset을 정의한다.

datsets.DatasetFolder

여기까지 왔다면 '.npy'확장자로 training dataset을 준비했고,
이제 "torch.utils.data.DataLoader()"를 사용해 학습을 시작하면 된다.

 

 


MisoYuri's Deck
블로그 이미지 MisoYuri 님의 블로그
VISITOR 오늘 / 전체