Комментарии / Профиль KatrinDynev / Хабр

Екатерина@KatrinDynev

Получаю магистерскую в ВШЭ и немного DS:)

ПрофильСтатьи2ПостыНовостиКомментарии13

Создание модели предсказания кода МКБ-10 на основе текста описания болезни

KatrinDynev 27 июн 2022 в 11:32

Ого класс) мне не попадались они

Создание модели предсказания кода МКБ-10 на основе текста описания болезни

KatrinDynev 27 июн 2022 в 07:45

благодаря работе мы знаем, что в медицине модели, даже простые, строятся хорошо (причём на плохих данных) в связи с особенностями «медицинского» ( а не естественного) языка.

Теперь важно получить реальные тексты анамнезов с разметкой, от какого либо Мед. Учреждения. !!НО!! В реальной жизни в клиниках используется не больше 5 кодов МКБ! Так как только по ним проходит финансирование, и врачи технически и фактически проставляют неверные мкб.

Так что да, практическое применение такое исследование ещё не получило

Создание модели предсказания кода МКБ-10 на основе текста описания болезни

KatrinDynev 25 июн 2022 в 07:09

Ещё раз, тексты взяты из Википедии, и совсем не напоминают содержание стандартного анамнеза. Например могут гласить о том кто открыл эту бактерию и в каком году…

Создание модели предсказания кода МКБ-10 на основе текста описания болезни

KatrinDynev 25 июн 2022 в 06:32

Эту базу я собирала сама) на русском языке ничего подобного не встречала)

Создание модели предсказания кода МКБ-10 на основе текста описания болезни

KatrinDynev 25 июн 2022 в 06:31

Это работает иначе просто) мы не можем допустить, чтобы не влиял на решение модели.

Сам по себе по отдельности он не несёт информации. Здесь использованы классические методы векторизация. Можно попробовать встраивание, которое способно сохранять семантику… на таких данных запариваться не хотелось)

Создание модели предсказания кода МКБ-10 на основе текста описания болезни

KatrinDynev 25 июн 2022 в 06:28

Вот именно, что тут использованы в большей мере свободные тексты, а не анамнезы, написанные медиками)

Создание модели предсказания кода МКБ-10 на основе текста описания болезни

KatrinDynev 25 июн 2022 в 06:26

Любая база данных больницы, у них такое есть, и по запросу выгружают)) займусь этим в следующем году

Создание модели предсказания кода МКБ-10 на основе текста описания болезни

KatrinDynev 24 июн 2022 в 20:22

Но)

В мире огромное множество известных болезней, и информации по каждой из них, по этому нормально предполагать, что в природе не нашлось бы врача, который бы знал абсолютно все. Точнее это невозможно. Это одна из концепций , типа врачей компьютер заменит в будущем ( мб).

Я, лично, компьютеру бы лечение не доверила (ровно как мы его не всегда доверяем врачу, обращаемся ещё к одному и прочее). Но если врач бы пользовался плодами ИИ и их мнения совпадали- меня бы такое устраивало в большей степени)

Создание модели предсказания кода МКБ-10 на основе текста описания болезни

KatrinDynev 24 июн 2022 в 20:17

Инсайт в том, что модель строится хорошая на таких плохих данных. Связано с тем, что медицинский язык наполнен терминами (не совсем естественный язык). А термины передают точную семантику)

Были бы хорошие данные и достаточные, реальные анамнезы, в идеале .. получилась бы рекомендательная система)

Создание модели предсказания кода МКБ-10 на основе текста описания болезни

KatrinDynev 24 июн 2022 в 14:14

Была бы разметка...))

Создание модели предсказания кода МКБ-10 на основе текста описания болезни

KatrinDynev 24 июн 2022 в 14:09

https://drive.google.com/drive/folders/1vKPo6d-ZBMPhy6k1deikmn07K_86FR6a?usp=sharing

Данные здесь

Разбор задачи Титаник на Kaggle (Baseline)

KatrinDynev 19 мар 2022 в 17:19

Замените train на df)

тут опечатка, спасибо за сигнал☺️

Разбор задачи Титаник на Kaggle (Baseline)

KatrinDynev 16 мар 2022 в 19:44

Вижу ошибки) но это моя первая публикация)