Стандарты визуализации и форматы файлов играют существенную роль в аннотировании медицинских снимков. В этой статье рассказывается о различиях между двумя самыми популярными стандартами медицинской визуализации, DICOM и NIfTI.
Одно из самых существенных достижений в сфере аннотирования медицинских снимков — применение машинного обучения для оценки изображений с целью более точной и быстрой медицинской диагностики.
До того, как будут применены машинное обучение (ML), искусственный интеллект (AI) или любые другие алгоритмы диагностики, нам нужно разобраться, какое ПО аннотирования способно обрабатывать два самых популярных формата файлов снимков, а именно DICOM и NIfTI.
Что такое стандарт DICOM?
Стандарт DICOM — Digital Imaging and Communications in Medicine (DICOM) — используется для обмена снимками и информацией, он популярен уже более десятка лет. Рост популярности DICOM начался ещё в середине девяностых. Он состоит из нескольких слоёв, что позволяет отправителям и получателям снимков обмениваться информацией об анализируемых изображениях.
Сегодня почти каждое устройство, используемое в радиологии (в том числе КТ, МРТ, УЗИ и рентгенографии), оснащено поддержкой стандарта DICOM. Согласно информации разработчика стандарта, DICOM «позволяет передавать медицинские снимки в среде устройств разных производителей и упрощать разработку и расширение систем архивации изображений и коммуникации».
В устройствах для создания снимков в других областях медицины, включая патологоанатомию, дерматологию, эндоскопию и офтальмологию, тоже начинают использовать стандарт DICOM.
В другие слои включены связи с базами данных и возможность извлечения пользователями информации о медицинских снимках. Медицинские устройства для создания снимков могут определять, где хранятся снимки, упрощая их получение и анализ в реальном времени. В третий слой поддержки входят информация управления снимками, качества, хранилища, безопасности и плана лечения пациентов.
Одна из самых важных и ценных основ DICOM — это встроенная в стандарт информационная модель. Одно его определение гласит:
«Информационные объекты DICOM — это определения информации, подвергаемой обмену. Можно воспринимать их как шаблоны многократного использования при генерации нового снимка или другого объекта DICOM. Каждый тип снимка, а следовательно, и информационный объект, имеет определённые характеристики».
Например, «снимок КТ требует наличия в заголовке изображения дескрипторов, отличающихся от дескрипторов снимка УЗИ или офтальмологического снимка».
Информационные объекты также называются классами Service Object Pairs (SOP). Каждый SOP имеет уникальные идентификаторы и шаблон, поэтому при обмене данными, будь то аннотированный снимок или план лечения пациента, два участвующих в передаче устройства передают как можно больше подробностей, необходимых соответствующему пользователю.
Руководства по стандарту DICOM контролирует National Electrical Manufacturers Association (NEMA), также называемая standard facilitator. А теперь давайте сравним DICOM с ещё одним широко используемым стандартом медицинских и исследовательских снимков — NIfTI.
Что такое стандарт NIfTI?
The Neuroimaging Informatics Technology Initiative (NIfTI) был создан для работы с пользователями и производителями медицинских устройств с целью решения некоторых проблем и недостатков других стандартов визуализации. Стандарт NIfTI был специально разработан для устранения этих проблем в сфере нейровизуализации с упором на функциональную магнитно-резонансную томографию (fMRI, ФМРТ).
Одной из самых важных проблем, с которыми нейрохирурги сталкивались при работе со старыми форматами изображений, в частности, с форматом файлов Analyze 7.5, было отсутствие информации об ориентации объектов на снимках.
Ориентация была неопределённой и нечёткой, что заставляло анализирующих изображение специалистов добавлять к снимкам подробные примечания об ориентации объектов на изображениях. В частности, нередко возникали трудности с определением того, какую часть мозга видит врач; эта существенная проблема требовала решения.
NIfTI решил эту проблему следующим образом:
«В формате NIfTI первые три измерения зарезервированы для задания трёх пространственных измерений (x, y и z), а четвёртое измерение зарезервировано для задания временных точек t». Другие измерения хранят «параметры распределения на основе вокселей и векторные данные». Согласно определению NIfTI, «основная задача NIfTI — предоставление скоординированного целевого обслуживания, обучения и исследований для ускорения разработки и повышения удобства информационных инструментов в сфере нейровизуализации».
NIfTI состоит из двух стандартов, NIfTI-1 и NIfTI-2, причём второй является 64-битным усовершенствованием первого. Он не заменяет NIfTI-1, а используется параллельно и поддерживается широким ассортиментом медицинских нейровизуальных устройств и операционных систем. NIfTI спонсируется и контролируется National Institute of Mental Health и National Institute of Neurological Disorders and Stroke.
А теперь давайте рассмотрим различия между DICOM и NIfTI.
В чём разница между DICOM и NIfTI?
1. У файлов NIfTI меньше метаданных
В файле NIfTI не требуется заполнять такое количество тегов, как в файлах снимков DICOM. В них гораздо меньше метаданных для проверки и анализа; однако это в некотором смысле является недостатком, поскольку DICOM предоставляет пользователям различные слои данных о снимке и пациенте.
Включенный в Encord оверлей метаданных
2: Файлы DICOM часто более громоздкие
DICOM описывается как «надёжный» стандарт, однако он может вызывать сложности у пользователей. Передачей данных DICOM руководят строгие правила форматирования, гарантирующие поддержку принимающим устройством классов SOP и синтаксисов передачи, например, формата файла и шифрования, использованного для передачи данных.
При передаче файлов DICOM одно устройство «переговаривается» с другим. Если одно устройство не может обработать информацию, которую пытается отправить другое, «оно проинформирует запрашивающее устройство, чтобы отправитель мог откатиться к другому объекту (например, к предыдущей версии) или отправить информацию в другую точку получения».
Поэтому обработка, передача, считывание и запись файлов NIfTI обычно выполняются проще и быстрее, чем для файлов снимков DICOM. Это похоже на разницу между текстовым файлом (NIfTI) и файлом Word (DICOM). Один содержит больше подробностей, в то время как другой проще, меньше и удобнее в использовании. Во многих случаях дополнительные слои данных оказываются ненужными для анализа снимков в разных областях медицины.
3. В файлах DICOM можно хранить больше информации
Как говорилось выше, файлы DICOM позволяют медицинским специалистам хранить в различных слоях больше информации. Можно создавать структурированные отчёты и даже фиксировать снимки, чтобы другие клиницисты и дата-саентисты могли чётко увидеть, на чём основано мнение/рекомендация.
Поэтому несмотря на то, что файлы DICOM иногда сложнее обрабатывать, в них хранится более детализированная информация, применимая в большем диапазоне применений.
4. DICOM работает с 2D-слоями, а NIfTI может отображать 3D-детали
В файлах NIfTI снимки и другие данные хранятся в 3D-формате. Он специально спроектирован таким образом, чтобы преодолеть проблемы пространственной ориентации других форматов файлов медицинских снимков.
Файлы снимков DICOM и ассоциированные данные составлены из 2D-слоёв. Это позволяет просматривать различные срезы изображения, что особенно полезно при анализе человеческого тела и различных органов.
Двухмерная многопланарная реконструкция (Multiplanar Reconstruction, MPR) в Encord
5. Загрузка NIfTI может занимать больше времени; DICOM позволяет пользователям отображать по одному слою за раз
Хотя передача файлов DICOM часто занимает больше времени, файлы NIfTI могут дольше загружаться, поскольку данные изображения сохранены в 3D-формате. В то же время, после получения файла DICOM пользователи могут просматривать данные по одному изображению за раз или просто загрузить отдельное изображение с соответствующими метаданным, например, с промежуточными примечаниями по снимку.
Благодаря 2D-слоям файлов DICOM получается проще и быстрее работать с ПО аннотирования медицинских снимков или отправлять снимок и примечания на печать.
6. DICOM можно преобразовать в NIfTI
И последнее замечание, не являющееся различием: полезно знать, что медики и дата-саентисты могут преобразовывать формат DICOM в файлы NIfTI без потери качества снимков. В этом может помочь множество разных программных решений, поскольку единственная сложность заключается в комбинировании слоёв в единый снимок без утери аннотаций и метаданных.
Кто пользуется DICOM и для чего он применяется?
DICOM — это широко используемый в медицине формат снимков, файлы в нём создают специалисты различных областей, в том числе радиологии (для КТ, МРТ, УЗИ и рентгенографии), патологической анатомии, дерматологии, эндоскопии и офтальмологии.
Лечебные учреждения по всему миру используют DICOM не только потому, что он позволяет делиться снимками и аннотациями, но и из-за простоты передачи, обеспечения связи с медицинскими картами пациентов и другими ценными объектами медицинских метаданных.
DICOM особенно полезен при выявлении онкологических заболеваний. Если файлы DICOM размечены совместимыми с DICOM инструментами аннотирования медицинских снимков, аннотаторы могут обучать модели для более быстрого и эффективного выявления опухолей, обеспечивая существенное улучшение при раннем диагностировании.
Кто пользуется NIfTI и для чего он применяется?
Изначально NIfTI был создан для решения серьёзной проблемы ориентации в сфере нейровизуализации с упором на функциональную магнитно-резонансную томографию. Благодаря NIfTI нейрохирурги могут быстро выявлять в 3D на снимках объекты, например, правое и левое полушарие мозга. Это бесценная возможность при анализе снимков человеческого мозга, оценивать и аннотировать который крайне сложно.
Форматы файлов NIfTI также используют радиологи, а также команды учёных в медицинском секторе, занимающиеся исследованиями снимков.
Понравилась статья? Еще больше информации на тему данных, AI, ML, LLM вы можете найти в моем Telegram канале.
- Как подготовиться к сбору данных, чтобы не провалиться в процессе?
- Как работать с синтетическими данными в 2024 году?
- В чем специфика работы с ML проектами? И какие бенчмарки сравнения LLM есть на российском рынке?