Комментарии 7
появление открытых баз данных химических соединений и реакций
А не подскажете пару-тройку источников таких данных? А то медицинские и биохемические базы зачастую либо очень маленькие, либо распространяются исключительно между университетами и крупными компаниями.
В качестве примера: есть ChemSpider (БД королевского химического общества Великобритании), PubChem (БД — общественное достояние), Binding Database, ChEMBL, еще несколько интересных баз данных есть тут.
Можно ещё упомянуть
CCCBDB (NIST) http://cccbdb.nist.gov
и ATB (University of Queensland) https://atb.uq.edu.au
With 977 468 314 structures, GDB-13 is the largest publicly available small organic molecule database to date. http://gdb.unibe.ch/downloads/
Довольно просто нагенерить базы химических соединений самому — взять базу доступных билдинг блоков (например с Zinc или emolecules) и по простым для комбинаторного синтеза реакциям сделать базу продуктов реакций, это порядка миллиардов соединений.
Довольно просто нагенерить базы химических соединений самому — взять базу доступных билдинг блоков (например с Zinc или emolecules) и по простым для комбинаторного синтеза реакциям сделать базу продуктов реакций, это порядка миллиардов соединений.
Очень хорошая статья
Проектов действительно много. Можно заниматься разнообразными исследованиями, не оторванными от постоянного взаимодействия с потенциальным заказчиком. Вещаю с магистерской группы биомедицины.
Зарегистрируйтесь на Хабре, чтобы оставить комментарий
Большие данные и машинное обучение: новые возможности для медицины