Comments 5
Не добрался до исходного текста ещё, но можно вопрос? GPT-4 содержал коллекции нуклеотидных последовательностей в обучающей выборке?
Очень интересный обзор, спасибо! Я не разбираюсь в биологии, но был опыт использования краудсорсингом для аннотирования данных, и взаимодействия с GPT-4. Сразу пришел в голову такой вопрос: совпадают ли те категории клеток, в которых чаще ошибается GPT, и те, где ошибаются/испытывают затруднения сами биологи? (Вижу в статье упоминание типов клеток, с которыми больше всего расхождений, но это ответ на чуть другой вопрос)
Если не совпадают, то это прям отличный простор для ускорения и масштабирования разметки в такой комбинации, естественно, с осторожностью в выводах и применении и должным контролем качества
Спасибо за интересный материал!
Вообще не понял.
1) почему речь именно про single cell? Начать можно было с профилирования тканей (либо событий типа пролиферации, воспаления) по обычному реалтайму;
2) нафиг гпт4? Почему не самописная локальная модель без лишних данных? Сложнее в исполнении, но точнее в перспективе и упаковывается в продукт ( наверняка множество РнД отделов биотеха этим и заняты);
3) обучается на литературных данных или специально подготовленных экспериментальных? Я бы доверял только специально созданным датасетам;
4) (мечтательно): профилировать и я могу, вот бы она праймеры подбирать умела...
Революция в клеточной биологии: Применение GPT-4 для РНК-секвенирования