상세 컨텐츠

본문 제목

메디컬 이미지

인공지능/컴퓨터 비전

by Ryuzy 2025. 9. 24. 12:14

본문

반응형

1. 메디컬 이미지

메디컬 이미지는 MRI, CT, X-ray, 초음파 등 의료 장비로 촬영된 영상으로, 환자의 신체 내부 구조와 질환 상태를 진단하고 치료 계획을 세우는 데 활용되는 특수한 이미지 데이터입니다. 일반적인 사진과 달리 메디컬 이미지는 대부분 흑백이거나 3차원 볼륨 데이터로 구성되며, 각 픽셀 값이 조직 밀도나 생리학적 의미를 담고 있어 단순한 색상 정보 이상을 제공합니다. 이 데이터는 환자의 건강과 직접적으로 연결되기 때문에 민감한 개인정보 규제를 따르며, 라벨링 또한 의학적 전문 지식을 가진 의료진이 직접 수행해야 합니다. 따라서 AI 연구에서 메디컬 이미지는 데이터 수집과 활용에 제한이 크지만, 정확한 분석은 생명과 직결되므로 높은 신뢰성과 설명 가능성이 요구되는 중요한 영역입니다.

 

 

2. 일반 이미지와 메디컬 이미지와의 차이점

1. 이미지의 출처와 목적

  • 일반 이미지: 카메라나 스마트폰으로 찍은 사진, CCTV 영상, 인터넷에 있는 이미지 등. 목적은 보통 사물 인식, 얼굴 인식, 자율주행 객체 탐지 등과 같은 일반적인 시각 문제 해결입니다.
  • 메디컬 이미지: X-ray, CT, MRI, 초음파처럼 의학적 진단을 위해 의료 장비로 촬영한 이미지입니다. 목적은 질병 진단, 병변 탐지, 장기 세그멘테이션 등과 같이 사람의 건강과 직접 연결됩니다.

 

2. 데이터의 형태

  • 일반 이미지: 대부분 3채널(RGB), 색상이 있는 2D 이미지입니다. 크기는 자유롭고, 인터넷에서 쉽게 구할 수 있습니다.
  • 메디컬 이미지:
    • 흑백(1채널, Grayscale)이 많은 경우가 있습니다 (예: X-ray).
    • 3차원(3D) 형태일 때도 많습니다 (CT/MRI는 여러 장의 슬라이스로 구성 → 3D 볼륨 데이터).
    • 픽셀 값이 단순한 밝기 정도가 아니라 물리적/생리학적 의미를 가집니다. 예: CT 픽셀 값(Hounsfield Unit)은 조직의 밀도를 나타냅니다.

 

3. 데이터의 라벨링 난이도

  • 일반 이미지: 사람이 쉽게 라벨링할 수 있습니다 (고양이/강아지, 차/사람, 위치 박스 등). 크라우드소싱도 가능합니다.
  • 메디컬 이미지: 전문의(의사, 방사선과 전문의)가 직접 주석(Annotation)을 달아야 합니다. 예를 들어, MRI에서 종양 영역을 구분하려면 전문가의 지식이 필요합니다. 따라서 라벨링 비용과 시간이 훨씬 많이 듭니다.

 

4. 데이터의 민감성과 규제

  • 일반 이미지: 개인정보 문제는 있지만, 대체로 공개 데이터셋이 많습니다 (ImageNet, COCO, CIFAR 등).
  • 메디컬 이미지: 환자의 개인 건강 정보(PHI, Personal Health Information)와 연결되기 때문에 보안·윤리·법적 규제가 매우 강합니다. 의료 데이터는 HIPAA(미국), GDPR(유럽) 같은 규제를 따라야 하며, 공개 데이터셋도 제한적입니다.

 

5. 처리와 학습의 특수성

  • 일반 이미지: CNN, Transformer 기반 모델을 그대로 적용해도 잘 동작합니다.
  • 메디컬 이미지:
    • 데이터가 3D이거나 특수 포맷(DICOM 파일 등)이어서 전처리 과정이 복잡합니다.
    • 데이터 양이 적으므로 전이학습(Transfer Learning)이나 데이터 증강(Data Augmentation)이 특히 중요합니다.
    • 결과 해석이 매우 중요합니다. 의사는 단순히 "암이다/아니다"만 보지 않고, 왜 그렇게 판단했는지 설명이 필요합니다 → Explainable AI가 핵심.

 

6. 오류의 영향

  • 일반 이미지: 고양이를 개로 잘못 분류해도 큰 문제는 없습니다.
  • 메디컬 이미지: 암을 정상으로 잘못 진단하거나, 반대로 정상 환자를 암으로 진단하면 생명과 직결되는 심각한 문제로 이어질 수 있습니다. 그래서 정확도 외에도 민감도, 특이도, F1-score 같은 다양한 평가 지표가 요구됩니다.

 

 

3. 메디컬 이미지 포멧

의료 영상은 일반 사진(JPEG, PNG)과 달리 진단용 데이터라는 특수성을 가지고 있어서, 저장되는 파일 포맷도 일반 이미지와 다릅니다.

 

1. DICOM

DICOM(Digital Imaging and Communications in Medicine)은 의료 영상 표준 포맷으로, CT, MRI, X-ray, 초음파 등에서 생성되는 이미지를 저장·전송·관리하기 위해 사용됩니다. 단순히 영상 픽셀 데이터만 담는 것이 아니라 환자 정보, 검사 일시, 촬영 장비 설정, 해상도와 같은 다양한 메타데이터를 함께 포함하여 의료 현장에서 영상과 진료 정보를 일관되게 다룰 수 있게 해줍니다. DICOM 파일은 보통 .dcm 확장자를 가지며, PACS 시스템과 연계되어 의료진이 안전하게 조회·공유할 수 있으며, 의료 영상 분석 AI에서도 가장 많이 활용되는 핵심 데이터 형식입니다.

 

PACS 시스템

PACS(Picture Archiving and Communication System)는 병원과 의료기관에서 CT, MRI, X-ray, 초음파 등 다양한 의료 영상을 디지털 형태로 저장, 관리, 전송, 조회할 수 있도록 하는 시스템입니다. 과거에는 필름 형태로 보관하던 영상을 디지털화하여 중앙 서버에 저장하고, 의료진이 언제 어디서나 네트워크를 통해 안전하게 접근할 수 있게 해줍니다. PACS는 의료 영상 표준인 DICOM(Digital Imaging and Communications in Medicine) 형식을 기반으로 동작하며, 전자의무기록(EMR)이나 병원정보시스템(HIS)과 연계되어 진료 효율을 높이고, 영상 손실이나 훼손을 막으며, 원격 진료와 협진에도 활용됩니다.

 

 

2. DICOM Data Dictionary

DICOM 표준에서 정의한 모든 데이터 요소(Data Element)의 목록으로, 각 데이터 요소의 의미, 형식, 식별자를 체계적으로 정리해 놓은 일종의 "사전"입니다.

  • Tag (태그)
    • 각 데이터 요소를 식별하는 고유 번호. (Group, Element) 쌍으로 표현됩니다.
    • 예: (0010,0010) → 환자 이름(Patient’s Name)
  • Name(이름): 사람이 읽기 쉬운 설명형 이름입니다. 
    • 공백·문장부호 포함 가능하며 문서/UI에 적합합니다.
    • 예: "Patient's Name", "Study Date", "Series Description"
  • Keyword(키워드): 공백 없이 CamelCase로 된 코드 친화적 식별자입니다. 
    • 프로그램/쿼리에서 사용합니다.
    • 예: PatientName, StudyDate, SeriesDescription
  • VR (Value Representation)
    • 데이터 값의 형식(Type)을 정의.
    • 예: PN(Person Name), DA(Date), UI(Unique Identifier), US(Unsigned Short)
  • VM (Value Multiplicity)
    • 값이 몇 개 들어갈 수 있는지 정의.
    • 예: 1 → 하나의 값만, 1-n → 여러 개 값 가능
  • Description (설명)
    • 데이터 요소의 용도나 설명.

 

 3. NIfTI

NIfTI(Neuroimaging Informatics Technology Initiative)는 주로 뇌 MRI 같은 의료 영상을 연구할 때 쓰는 파일 형식으로, 하나의 파일(.nii 또는 압축 .nii.gz)에 3차원(필요하면 시간까지 포함한 4차원) 영상 묶음을 통째로 담습니다. 파일 안에는 영상 크기, 픽셀 간격(부피 픽셀=보셀 크기), 그리고 실제 공간에서의 위치·자세를 알려주는 좌표 정보가 함께 들어 있어 병원이나 장비가 달라도 영상을 정확히 맞춰서 비교·분석하기 쉽습니다. 쉽게 말해, 진단용 DICOM을 연구·학습에 쓰기 편하도록 정리해 둔 형태라고 보면 되며, 파이썬의 nibabel 같은 도구로 손쉽게 열고 저장해 딥러닝 학습에 많이 활용합니다.

 

4. WSI

WSI(Whole Slide Imaging, 전절편 디지털화)는 병리 유리 슬라이드를 스캐너로 전 영역을 고배율(보통 20x·40x)로 스캔해 기가픽셀급의 거대 이미지를 만드는 기술입니다. 결과는 여러 축소 수준을 가진 타일형 피라미드 구조로 저장되어(예: SVS, NDPI, MRXS, SCN, 그리고 DICOM-WSI 표준) 뷰어에서 빠르게 확대·이동할 수 있습니다. 헤더/메타데이터에는 픽셀 크기(µm/px), 배율, 염색 정보(H&E 등), 조직 위치 등이 들어가며, 원격 판독·교육·품질관리와 함께 ROI 주석을 이용한 세포/조직 분할·종양 분류 등 디지털 병리 AI 학습에 널리 활용됩니다. 파일이 매우 크므로 QuPath 같은 타일 스트리밍 뷰어와 OpenSlide 같은 라이브러리를 쓰고, 저장·전송 시 스토리지·네트워크 부하와 비식별화 정책을 함께 고려하는 것이 중요합니다.

 

 

  • Radiology(영상의학): X-ray, CT, MRI, 초음파, PET 같은 의료 영상을 이용해 질병을 진단·치료하는 분야입니다. 몸 안을 비침습적으로 찍어 이상 소견(종양, 염증, 골절 등)을 판독하는 전문의가 영상의학과 전문의입니다.
  • Pathology(병리학): 수술·생검 등으로 얻은 조직·세포·체액을 현미경과 분자검사로 분석해 확정 진단을 내리는 분야입니다. 종양의 종류·등급·침윤 여부 등을 판단하는 병리과 전문의가 담당합니다.

 

 

 

반응형

'인공지능 > 컴퓨터 비전' 카테고리의 다른 글

수화 인식 데이터  (0) 2025.09.04
Sokoto Coventry Fingerprint Dataset  (0) 2025.09.03
ViT(Vistion Transformer)  (0) 2025.09.02
차량 파손 데이터셋  (0) 2025.03.13
Segmentation  (0) 2025.03.10

관련글 더보기