Comments 7
Неорганических химических веществ может быть огромное количество — от 10**18
Это не совсем так. Дело в том, что неорганические соединения с количеством химических элементов более 3 (кватернарные, квинтернарные и т.д.) склонны к вырождению, т.е. их свойства в основном определяются 2-3 элементами. Таким образом, формально ваше утверждение верно, но на практике — нет. С этим связана идея high-throughput materials design, поиска новых материалов путём простого перебора.
+1
blue_limon я наверное что-то не понимаю, но зачем майнить из пабмеда, если в NCBI это уже проиндексировано и поиск работает по индексу?
вот пример
www.ncbi.nlm.nih.gov/gene/?term=DEK%20poor%20prognosis
вот пример
www.ncbi.nlm.nih.gov/gene/?term=DEK%20poor%20prognosis
+1
Все-таки Вы майните *список работ* на тему генов, влияющих на прогноз, а не список таких генов.
+1
Малость позанудствую.
Поскольку PubChem — база данных химических соединений и смесей, Chem — это, по идее, сокращение от слова chemical, которое читается приблизительно как «кемикл». Это я к тому, что PubChem читается как «пабкем».
В этой статье я приведу примеры составления списка генов ответственных за плохой прогноз по выживаемости от рака и код поиска органических соединений и их номеров среди всех химических молекул базы ПабЧем.
Для поиска упоминаний в тексте растения используем .find(' plant'). В конце сохраняем файл с получившимися органическими соединениями и их номерами в ПабЧем-е.
Поскольку PubChem — база данных химических соединений и смесей, Chem — это, по идее, сокращение от слова chemical, которое читается приблизительно как «кемикл». Это я к тому, что PubChem читается как «пабкем».
+1
А не проще ли молекулы искать через скафандр (scifinder.cas.org)
0
Чую, что при таком коде где-то обязательно должна быть ошибка )) статическим анализатором бы это проверить...
0
Data mining в pubmed существенно интереснее, если поднять его локально. Особенно метаанализ. Полная база данных и апдейты скачиваются с ftp.
0
Sign up to leave a comment.
Data mining Pubmed и Pubchem — баз медицинской и биохимической информации