Всем привет! Я хотел бы рассказать здесь о проекте EyeWire. Но сначала — пара слов о том, что собой представляет «общественная» наука (citizen science).
Многие из вас помнят такую платформу, как BOINC (статья на Geektimes, новость про BOINC для Android). Сейчас ее популярность, по ощущениям, снизилась, но ряд проектов всё еще активен, например Einstein@Home — поиск гравитационных волн от компактных объектов по данным с телескопа LIGO. Суть участия там состояла в том, чтобы установить к себе на компьютер программное обеспечение, обрабатывающее вычисления для одного или нескольких проектов и отослать результаты на сервер. Суммарная мощность вычислений множества настольных компьютеров довольно велика, но немного уступает топовым суперкомпьютерам. Например, на 2013 год платформа BOINC имела скорость около 9 ПФлопс, а самый новый суперкомпьютер (Тяньхе-2) — 33 ПФлопс, то есть в ~3,5 раза быстрее. Сегодня разрыв несколько больше: у BOINC скорость выросла вдвое (до 18 ПФлопс), а суперкомпьютеры уже вплотную подобрались к отметке в 100 ПФлопс и проектируются эксафлопс-суперкомпьютеры (1 ЭФлопс = 1000 ПФлопс = 1000000 ТФлопс). Тем не менее, какие-то результаты вычисления дали и если желаете, я проведу обзор таких результатов и их применения в реальном мире.
Альтернативой донорства компьютерного времени является более активное участие самого человека в проектах. Пример такого проявления «общественной» науки — проекты GalaxyZoo. Проект стартовал в 2007 году и до сих пор имеет достаточно большое количество поклонников. Сейчас не искал цифры, но ряд проектов отмечал значительное превышение активности над ожидаемой — например, самый первый проект по классификации имел порядка 70000 классификаций в час. В данных проектах, в основном, используется умение человеческого мозга находить паттерны (образы, подобные другим). В то время как для программы нужно прописать всю логику оценки, часто в мелких деталях, человек может оценивать картинку «целиком», при этом игнорируя дефекты изображения и несоответствие оси изображаемого предмета плоскости картинки (проще говоря, когда объект развернут в пространстве и виден сбоку или под каким-то углом). Считается, что обученные на примерах простые люди, не имеющие ученых степеней, могут делать выводы по содержимому изображений (например, отличать эллиптическую галактику от спиральной) статистически не хуже, чем сами ученые. Изначально проекты Galaxy Zoo носили астрономический характер, а позже на том же движке было запущено большое количество проектов из других областей науки — от поиска морских обитателей или животных на фотографиях до прочтения судовых журналов Британского Королевского морского флота (сам проект, Old Weather, имел цель восстановить погодные данные начала 20 века).
Наконец, проект о котором я хочу рассказать, в гораздо большей мере вовлекает участника — в нём есть часть от игры (с непременной «доской почета» и всякими статусами-значками), часть от социальной сети (довольно активный чат с милыми дискуссиями как по поводу того, что мы делаем, так и по беседами о жизни) и часть от науки (с научными публикациями с непременным соавтором Dr The EyeWirers).
EyeWire — проект по восстановлению 3D-структуры и связности нейронов в мозге мыши, а точнее той его части, которая связана с глазом (так называемый «коннектом»). Безусловно, хотелось бы узнать как эта часть мозга устроена у человека, но его мозг значительно сложнее и, что еще важнее, здоровый мозг на ломтики порезать никто не даст. Как и у Galaxy Zoo в EyeWire нет этапа длительного чтения инструкций — начать можно за считанные минуты после регистрации (ничего кроме логина, пароля и почты не спросят).
Большая зеленая кнопка «Start Playing» — и вперед, на тропу науки! Вот скриншот интерфейса в режиме «обзора».
Слева та самая кнопка, в центре 3D превью простой клетки (здесь в шутку называемой «усатой» — англ. moustache cell), справа «доска почета». После входа в режим игры вы попадаете внутрь одного из произвольно выбранных «кубов» — областей набора данных, где находятся ветки (дендриты) нашей клетки.
Движок игры, на основе данных о «кубах»-соседях строит предварительную модель той части дендрита, которая проходит через «куб». Можно заметить резкие грани, обрывы — это характерно для неполной модели. Наша задача как раз и состоит в том, чтобы достроить её. При этом важно как закрасить максимально точно области, относящиеся к дендриту (потому что любая из них может породить другой отросток), так и постараться не захватить лишних данных, иначе мы включим в модель кусок дендрита совсем другой клетки (это называется «слияние» — англ. merger). Для удобства модель сразу же визуализируется, когда вы добавляете фрагмент на плоскости. На первой же картинке видно, что закрашенное поле имеет пробел, его мы тоже закрасим, но важнее другой участок, который даст нам достроить дендрит. Вот он:
После закрашивания появляется сначала часть:
Потом мы добавляем остальное, кликая на другие светлые участки, и не выходя за черные линии (границы дендритов на срезе) Чтобы убедиться в полноте модели, переходим выше-ниже в плоскости, если нужно — меняем плоскость на другую (кнопкой на панели инструментов в правом верхнем углу или клавишей D). Финальный вид:
Отправляем куб. Получаем очки и переходим к следующему кубу. Для новичков авторы EyeWire придумали специальный интерактивный сценарий, который показывает правильность выполнения работы в реальном времени (а не после отправки куба), это упрощает начальный этап. Если вы хорошо работаете с 3D-структурами и вам слишком легко, не переживайте: для новичков доступны только простые клетки но вы сможете выбрать другую и, после дополнительного обучающего сценария, перейти к работе в клетках второго типа:
Думаю, этого достаточно для первого раза. Буду рад видеть вас на просторах EyeWire! Если будет интерес к статье, могу рассказать чуть больше про то, что происходит после того, как модель клетки построили, а также про еще более сложные части игры — где скауты ищут недостающие ветки или слияния, а косцы (англ. scythe) «подчищают» данные до финального результата.
Для заинтересовавшихся: кроме EyeWire есть проект Mozak Brainbuilder (нашел его при подготовке статьи) — на данный момент в бета-версии, предлагается строить модели нейронов рисованием ломаных линий по фото, детализация куда ниже EyeWire, но и требования не такие значительные. Также есть проект по поиску 3D-структур белков Fold.It для более точного таргетирования лекарств.
Спасибо за внимание!
UPD: Добавлена КПДВ.
UPD2: Спасибо Mad__Max, исправлена ошибка в единицах измерения производительности суперкомпьютеров
Многие из вас помнят такую платформу, как BOINC (статья на Geektimes, новость про BOINC для Android). Сейчас ее популярность, по ощущениям, снизилась, но ряд проектов всё еще активен, например Einstein@Home — поиск гравитационных волн от компактных объектов по данным с телескопа LIGO. Суть участия там состояла в том, чтобы установить к себе на компьютер программное обеспечение, обрабатывающее вычисления для одного или нескольких проектов и отослать результаты на сервер. Суммарная мощность вычислений множества настольных компьютеров довольно велика, но немного уступает топовым суперкомпьютерам. Например, на 2013 год платформа BOINC имела скорость около 9 ПФлопс, а самый новый суперкомпьютер (Тяньхе-2) — 33 ПФлопс, то есть в ~3,5 раза быстрее. Сегодня разрыв несколько больше: у BOINC скорость выросла вдвое (до 18 ПФлопс), а суперкомпьютеры уже вплотную подобрались к отметке в 100 ПФлопс и проектируются эксафлопс-суперкомпьютеры (1 ЭФлопс = 1000 ПФлопс = 1000000 ТФлопс). Тем не менее, какие-то результаты вычисления дали и если желаете, я проведу обзор таких результатов и их применения в реальном мире.
Альтернативой донорства компьютерного времени является более активное участие самого человека в проектах. Пример такого проявления «общественной» науки — проекты GalaxyZoo. Проект стартовал в 2007 году и до сих пор имеет достаточно большое количество поклонников. Сейчас не искал цифры, но ряд проектов отмечал значительное превышение активности над ожидаемой — например, самый первый проект по классификации имел порядка 70000 классификаций в час. В данных проектах, в основном, используется умение человеческого мозга находить паттерны (образы, подобные другим). В то время как для программы нужно прописать всю логику оценки, часто в мелких деталях, человек может оценивать картинку «целиком», при этом игнорируя дефекты изображения и несоответствие оси изображаемого предмета плоскости картинки (проще говоря, когда объект развернут в пространстве и виден сбоку или под каким-то углом). Считается, что обученные на примерах простые люди, не имеющие ученых степеней, могут делать выводы по содержимому изображений (например, отличать эллиптическую галактику от спиральной) статистически не хуже, чем сами ученые. Изначально проекты Galaxy Zoo носили астрономический характер, а позже на том же движке было запущено большое количество проектов из других областей науки — от поиска морских обитателей или животных на фотографиях до прочтения судовых журналов Британского Королевского морского флота (сам проект, Old Weather, имел цель восстановить погодные данные начала 20 века).
Наконец, проект о котором я хочу рассказать, в гораздо большей мере вовлекает участника — в нём есть часть от игры (с непременной «доской почета» и всякими статусами-значками), часть от социальной сети (довольно активный чат с милыми дискуссиями как по поводу того, что мы делаем, так и по беседами о жизни) и часть от науки (с научными публикациями с непременным соавтором Dr The EyeWirers).
EyeWire — проект по восстановлению 3D-структуры и связности нейронов в мозге мыши, а точнее той его части, которая связана с глазом (так называемый «коннектом»). Безусловно, хотелось бы узнать как эта часть мозга устроена у человека, но его мозг значительно сложнее и, что еще важнее, здоровый мозг на ломтики порезать никто не даст. Как и у Galaxy Zoo в EyeWire нет этапа длительного чтения инструкций — начать можно за считанные минуты после регистрации (ничего кроме логина, пароля и почты не спросят).
Большая зеленая кнопка «Start Playing» — и вперед, на тропу науки! Вот скриншот интерфейса в режиме «обзора».
Слева та самая кнопка, в центре 3D превью простой клетки (здесь в шутку называемой «усатой» — англ. moustache cell), справа «доска почета». После входа в режим игры вы попадаете внутрь одного из произвольно выбранных «кубов» — областей набора данных, где находятся ветки (дендриты) нашей клетки.
Движок игры, на основе данных о «кубах»-соседях строит предварительную модель той части дендрита, которая проходит через «куб». Можно заметить резкие грани, обрывы — это характерно для неполной модели. Наша задача как раз и состоит в том, чтобы достроить её. При этом важно как закрасить максимально точно области, относящиеся к дендриту (потому что любая из них может породить другой отросток), так и постараться не захватить лишних данных, иначе мы включим в модель кусок дендрита совсем другой клетки (это называется «слияние» — англ. merger). Для удобства модель сразу же визуализируется, когда вы добавляете фрагмент на плоскости. На первой же картинке видно, что закрашенное поле имеет пробел, его мы тоже закрасим, но важнее другой участок, который даст нам достроить дендрит. Вот он:
После закрашивания появляется сначала часть:
Потом мы добавляем остальное, кликая на другие светлые участки, и не выходя за черные линии (границы дендритов на срезе) Чтобы убедиться в полноте модели, переходим выше-ниже в плоскости, если нужно — меняем плоскость на другую (кнопкой на панели инструментов в правом верхнем углу или клавишей D). Финальный вид:
Отправляем куб. Получаем очки и переходим к следующему кубу. Для новичков авторы EyeWire придумали специальный интерактивный сценарий, который показывает правильность выполнения работы в реальном времени (а не после отправки куба), это упрощает начальный этап. Если вы хорошо работаете с 3D-структурами и вам слишком легко, не переживайте: для новичков доступны только простые клетки но вы сможете выбрать другую и, после дополнительного обучающего сценария, перейти к работе в клетках второго типа:
Думаю, этого достаточно для первого раза. Буду рад видеть вас на просторах EyeWire! Если будет интерес к статье, могу рассказать чуть больше про то, что происходит после того, как модель клетки построили, а также про еще более сложные части игры — где скауты ищут недостающие ветки или слияния, а косцы (англ. scythe) «подчищают» данные до финального результата.
Для заинтересовавшихся: кроме EyeWire есть проект Mozak Brainbuilder (нашел его при подготовке статьи) — на данный момент в бета-версии, предлагается строить модели нейронов рисованием ломаных линий по фото, детализация куда ниже EyeWire, но и требования не такие значительные. Также есть проект по поиску 3D-структур белков Fold.It для более точного таргетирования лекарств.
Спасибо за внимание!
UPD: Добавлена КПДВ.
UPD2: Спасибо Mad__Max, исправлена ошибка в единицах измерения производительности суперкомпьютеров