Opening
- 의료 영상 분석을 하기에 앞서 일반 영상과 달리 의료 영상이 가지는 특성에 대해서 찾아보고 설명해 봅시다.
- [예시 답안]
- light source에 따른 다양한 의료 영상 데이터 종류
- 가시광선을 이용한 의료 영상: 내시경(Endoscopy), 현미경(Microscopy)
- 방사선을 이용한 의료 영상: X-ray, CT(Computed Tomography), PET(Positron Emmision Tomography)
- 자기장을 이용한 의료 영상: MRI(Magnetic Resonance image)
- 人Co BLOG :: 의료 영상 분석의 개요
Check-up 항목
- 의료 데이터는 주로 데이터 imbalance 문제가 많이 발생하는 분야입니다. 어떤 방법으로 이 문제를 해결할 수 있을까요?
- [예시 답안]
- 데이터를 샘플수가 적은 클래스를 Minor class라고 칭하는데, Minor class의 샘플수를 증대시키는 Oversampling을 수행하거나, 샘플수가 다른 클래스를 압도하는 Major class의 샘플수를 Minor class 비율로 자르거나 감소시키는 Undersampling을 수행하여 데이터의 balance 함을 맞춰줌으로써 해결할 수 있습니다.
- Undersampling: 데이터에 내재된 정보의 손실이 크다는 단점이 있음
- (1) 데이터를 일정 개수를 기준으로 클러스터링 한 다음 중심값 만을 취하도록 하는 Clustering Centroid기법
- (2) Minor class 비율만큼 나누어서 여러 개의 셋을 만들고 각 셋에 대한 모델을 만들고 앙상블을 하는 기법
- Oversampling
- (1) SMOTE: 데이터를 벡터 공간상에 흩뿌린 후, 같은 클래스의 데이터들끼리 이음으로써 생긴 수선 안의 값을 취함
- (2) Auto Encoder 활용한 방법 (3) GAN 활용한 방법
- Ingraining Hierarchical Knowledge to Deep Learning 대장정의 시작
- Undersampling: 데이터에 내재된 정보의 손실이 크다는 단점이 있음
Closing
- 의료영상 모델에서 중요하게 여기는 평가지표는 무엇인가요? 그 이유에 대해서 생각해 봅시다.
- [예시 답안]
- 의료의 경우 질병이 있는데 정상이라고 진단하는 것이 훨씬 위험하기 때문에 이럴 때 Accuracy를 사용하면 문제가 됩니다. 때문에 Recall 값이 100%가 되도록 하는 것이 중요합니다. 즉, False Negative 값(질병이 있는데 정상이라고 분류하는 것)이 작아지도록 해야 합니다.
- 컴퓨터 비전, 머신러닝, 딥러닝을 이용한 의료영상분석 4-6. Evaluation of classification model
- 분류 성능평가지표 - Precision(정밀도), Recall(재현율) and Accuracy(정확도)
참고자료
'성장하기' 카테고리의 다른 글
[E-16] 흐린 사진을 선명하게 (0) | 2021.03.04 |
---|---|
[E-15] 트랜스포머로 만드는 대화형 챗봇 (0) | 2021.03.01 |
[서평] 비즈니스 머신러닝 (1) | 2021.02.22 |
[E-13] 어제 오른 내 주식, 과연 내일은? (0) | 2021.02.22 |
[E-12] 인공지능으로 세상에 없던 새로운 패션 만들기 (0) | 2021.02.18 |
댓글