메디컬 이미지는 MRI, CT, X-ray, 초음파 등 의료 장비로 촬영된 영상으로, 환자의 신체 내부 구조와 질환 상태를 진단하고 치료 계획을 세우는 데 활용되는 특수한 이미지 데이터입니다. 일반적인 사진과 달리 메디컬 이미지는 대부분 흑백이거나 3차원 볼륨 데이터로 구성되며, 각 픽셀 값이 조직 밀도나 생리학적 의미를 담고 있어 단순한 색상 정보 이상을 제공합니다. 이 데이터는 환자의 건강과 직접적으로 연결되기 때문에 민감한 개인정보 규제를 따르며, 라벨링 또한 의학적 전문 지식을 가진 의료진이 직접 수행해야 합니다. 따라서 AI 연구에서 메디컬 이미지는 데이터 수집과 활용에 제한이 크지만, 정확한 분석은 생명과 직결되므로 높은 신뢰성과 설명 가능성이 요구되는 중요한 영역입니다.
의료 영상은 일반 사진(JPEG, PNG)과 달리 진단용 데이터라는 특수성을 가지고 있어서, 저장되는 파일 포맷도 일반 이미지와 다릅니다.
DICOM(Digital Imaging and Communications in Medicine)은 의료 영상 표준 포맷으로, CT, MRI, X-ray, 초음파 등에서 생성되는 이미지를 저장·전송·관리하기 위해 사용됩니다. 단순히 영상 픽셀 데이터만 담는 것이 아니라 환자 정보, 검사 일시, 촬영 장비 설정, 해상도와 같은 다양한 메타데이터를 함께 포함하여 의료 현장에서 영상과 진료 정보를 일관되게 다룰 수 있게 해줍니다. DICOM 파일은 보통 .dcm 확장자를 가지며, PACS 시스템과 연계되어 의료진이 안전하게 조회·공유할 수 있으며, 의료 영상 분석 AI에서도 가장 많이 활용되는 핵심 데이터 형식입니다.
PACS(Picture Archiving and Communication System)는 병원과 의료기관에서 CT, MRI, X-ray, 초음파 등 다양한 의료 영상을 디지털 형태로 저장, 관리, 전송, 조회할 수 있도록 하는 시스템입니다. 과거에는 필름 형태로 보관하던 영상을 디지털화하여 중앙 서버에 저장하고, 의료진이 언제 어디서나 네트워크를 통해 안전하게 접근할 수 있게 해줍니다. PACS는 의료 영상 표준인 DICOM(Digital Imaging and Communications in Medicine) 형식을 기반으로 동작하며, 전자의무기록(EMR)이나 병원정보시스템(HIS)과 연계되어 진료 효율을 높이고, 영상 손실이나 훼손을 막으며, 원격 진료와 협진에도 활용됩니다.

DICOM 표준에서 정의한 모든 데이터 요소(Data Element)의 목록으로, 각 데이터 요소의 의미, 형식, 식별자를 체계적으로 정리해 놓은 일종의 "사전"입니다.

NIfTI(Neuroimaging Informatics Technology Initiative)는 주로 뇌 MRI 같은 의료 영상을 연구할 때 쓰는 파일 형식으로, 하나의 파일(.nii 또는 압축 .nii.gz)에 3차원(필요하면 시간까지 포함한 4차원) 영상 묶음을 통째로 담습니다. 파일 안에는 영상 크기, 픽셀 간격(부피 픽셀=보셀 크기), 그리고 실제 공간에서의 위치·자세를 알려주는 좌표 정보가 함께 들어 있어 병원이나 장비가 달라도 영상을 정확히 맞춰서 비교·분석하기 쉽습니다. 쉽게 말해, 진단용 DICOM을 연구·학습에 쓰기 편하도록 정리해 둔 형태라고 보면 되며, 파이썬의 nibabel 같은 도구로 손쉽게 열고 저장해 딥러닝 학습에 많이 활용합니다.


WSI(Whole Slide Imaging, 전절편 디지털화)는 병리 유리 슬라이드를 스캐너로 전 영역을 고배율(보통 20x·40x)로 스캔해 기가픽셀급의 거대 이미지를 만드는 기술입니다. 결과는 여러 축소 수준을 가진 타일형 피라미드 구조로 저장되어(예: SVS, NDPI, MRXS, SCN, 그리고 DICOM-WSI 표준) 뷰어에서 빠르게 확대·이동할 수 있습니다. 헤더/메타데이터에는 픽셀 크기(µm/px), 배율, 염색 정보(H&E 등), 조직 위치 등이 들어가며, 원격 판독·교육·품질관리와 함께 ROI 주석을 이용한 세포/조직 분할·종양 분류 등 디지털 병리 AI 학습에 널리 활용됩니다. 파일이 매우 크므로 QuPath 같은 타일 스트리밍 뷰어와 OpenSlide 같은 라이브러리를 쓰고, 저장·전송 시 스토리지·네트워크 부하와 비식별화 정책을 함께 고려하는 것이 중요합니다.



| 수화 인식 데이터 (0) | 2025.09.04 |
|---|---|
| Sokoto Coventry Fingerprint Dataset (0) | 2025.09.03 |
| ViT(Vistion Transformer) (0) | 2025.09.02 |
| 차량 파손 데이터셋 (0) | 2025.03.13 |
| Segmentation (0) | 2025.03.10 |