Как стать автором
Обновить

Комментарии 6

Два исследования одного пациента часто настолько же отличаются, как и для разных пациентов.

Как в таком случае решается вопрос с мажоператорской воспроизводимостью результатов?
И каким методом решается вопрос о том, какой объем выборки будет оптимальным?

Правильно ли я поняла, что Вы говорите об исследованиях, проведенных одному пациенту разными операторами, из-за чего данные могут отличаться настолько сильно, что это затрудняет диагностику? Если так, то для нас (DS-ов) это не просто не проблема, а преимущество - чем больше разнообразия, тем устойчивее окажется обученная на этих данных сетка. Мы не знаем и не заморачиваемся тем, кто был оператором, для какого пациента проведены исследования и насколько они похожи\отличаются. Мы работаем не на уровне пациентов, а начиная с исследований, как написано в статье. И диагноз наши сетки не ставят - это делает только врач, в том числе, глядя на советы ИИ, но не слепо им следуя.

Вопрос про оптимальность выборки часто вообще не стоит, т.к. разметка таких данных - долгий и сложный процесс, поэтому приходится работать с тем, что есть. К тому же, это сильно зависит от решаемой задачи, формата данных и еще кучи других вещей. Например, 2D-сегментация\детекция конкретного рака (~2-5 слайсов на каждое исследование) для уверенной и устойчивой работы сеток потребует не менее 1-2 тысяч исследований (при условии сбалансированности датасета), равно как и любая работа в 3D, т.е. на уровне исследований, а не слайсов. А для той же 2D-сегментации крупного органа можно ограничиться меньшим количеством, т.к. в каждом будет много содержательных слайсов.

Про воспроизводимость результатов, немного не про это шла речь. Дело в том, что на практике много зависит от оборудования и навыков оператора. Поскольку я работаю с УЗД, в том числе доплером и SWE даже сила нажатая на область интереса может повлиять на качество результатов измерения, не говоря про выбор датчика и уже измерения которые произвели с помощью аппарата.

Возможно у исследований МРТ, КТ и ПЭТ ситуация немного другая

Ответ такой же :) Врач и оператор смотрят на данные с другой стороны. Многое, что важно им, не важно нам, и наоборот. Да, данные очень вариативны, и это зависит и от самого оборудования, и от выбранных параметров, и от работы оператора, и от подготовки пациента... Поэтому нам надо много разных исследований, чтобы сетка увидела как можно больше разных случаев. Тогда она будет работать устойчиво.

На данный момент действуют более десятка ГОСТов по применению ИИ в медицине, также на эту тему есть Методические Указания минздрава Москвы. Есть Российские компании, выпускающие сертифицированные программные продукты для анализа и рентгеновских снимков и КТ на основе применения нейронных сетей. Рекомендую ознакомиться, там найдёте ответы на практически все вопросы.

Вы не уловили суть данного материала - специфика именно МРТ данных, связанных, в первую очередь, с физикой процесса. ГОСТы и прочие регламенты тут совершенно ни при чем.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации