благодаря работе мы знаем, что в медицине модели, даже простые, строятся хорошо (причём на плохих данных) в связи с особенностями «медицинского» ( а не естественного) языка.
Теперь важно получить реальные тексты анамнезов с разметкой, от какого либо Мед. Учреждения. !!НО!! В реальной жизни в клиниках используется не больше 5 кодов МКБ! Так как только по ним проходит финансирование, и врачи технически и фактически проставляют неверные мкб.
Так что да, практическое применение такое исследование ещё не получило
Ещё раз, тексты взяты из Википедии, и совсем не напоминают содержание стандартного анамнеза. Например могут гласить о том кто открыл эту бактерию и в каком году…
Это работает иначе просто) мы не можем допустить, чтобы не влиял на решение модели.
Сам по себе по отдельности он не несёт информации. Здесь использованы классические методы векторизация. Можно попробовать встраивание, которое способно сохранять семантику… на таких данных запариваться не хотелось)
В мире огромное множество известных болезней, и информации по каждой из них, по этому нормально предполагать, что в природе не нашлось бы врача, который бы знал абсолютно все. Точнее это невозможно. Это одна из концепций , типа врачей компьютер заменит в будущем ( мб).
Я, лично, компьютеру бы лечение не доверила (ровно как мы его не всегда доверяем врачу, обращаемся ещё к одному и прочее). Но если врач бы пользовался плодами ИИ и их мнения совпадали- меня бы такое устраивало в большей степени)
Инсайт в том, что модель строится хорошая на таких плохих данных. Связано с тем, что медицинский язык наполнен терминами (не совсем естественный язык). А термины передают точную семантику)
Были бы хорошие данные и достаточные, реальные анамнезы, в идеале .. получилась бы рекомендательная система)
Ого класс) мне не попадались они
благодаря работе мы знаем, что в медицине модели, даже простые, строятся хорошо (причём на плохих данных) в связи с особенностями «медицинского» ( а не естественного) языка.
Теперь важно получить реальные тексты анамнезов с разметкой, от какого либо Мед. Учреждения. !!НО!! В реальной жизни в клиниках используется не больше 5 кодов МКБ! Так как только по ним проходит финансирование, и врачи технически и фактически проставляют неверные мкб.
Так что да, практическое применение такое исследование ещё не получило
Ещё раз, тексты взяты из Википедии, и совсем не напоминают содержание стандартного анамнеза. Например могут гласить о том кто открыл эту бактерию и в каком году…
Эту базу я собирала сама) на русском языке ничего подобного не встречала)
Это работает иначе просто) мы не можем допустить, чтобы не влиял на решение модели.
Сам по себе по отдельности он не несёт информации. Здесь использованы классические методы векторизация. Можно попробовать встраивание, которое способно сохранять семантику… на таких данных запариваться не хотелось)
Вот именно, что тут использованы в большей мере свободные тексты, а не анамнезы, написанные медиками)
Любая база данных больницы, у них такое есть, и по запросу выгружают)) займусь этим в следующем году
Но)
В мире огромное множество известных болезней, и информации по каждой из них, по этому нормально предполагать, что в природе не нашлось бы врача, который бы знал абсолютно все. Точнее это невозможно. Это одна из концепций , типа врачей компьютер заменит в будущем ( мб).
Я, лично, компьютеру бы лечение не доверила (ровно как мы его не всегда доверяем врачу, обращаемся ещё к одному и прочее). Но если врач бы пользовался плодами ИИ и их мнения совпадали- меня бы такое устраивало в большей степени)
Инсайт в том, что модель строится хорошая на таких плохих данных. Связано с тем, что медицинский язык наполнен терминами (не совсем естественный язык). А термины передают точную семантику)
Были бы хорошие данные и достаточные, реальные анамнезы, в идеале .. получилась бы рекомендательная система)
Была бы разметка...))
https://drive.google.com/drive/folders/1vKPo6d-ZBMPhy6k1deikmn07K_86FR6a?usp=sharing
Данные здесь
Замените train на df)
тут опечатка, спасибо за сигнал☺️
Вижу ошибки) но это моя первая публикация)