Comments 14
Такой поступок очень редко встречается в российских НИИ, вузах и академических институтах. Что привело вас к такой щедрости, к такому благородству? Почему вы, в отличие от «Яндекса», не стали продавать права на фотографии?
2) Рассказывая про датасет, вы написали: «a specialist now takes photographs by saving frames from the microscope’s camera». Снимки делает специалист вашей компании? Или специалист из университета?
Спасибо.
Это решение НИИ. Им к научным статьям нужно прикладывать данные, к тому же есть желание наладить взаимодействие с другими научными организациями, выполняющими похожие работы. Мы будем постепенно открывать всё больше данных, добавляя новые атрибуты к объектам и расширяя выборку за счет новых фотографий.
Съемку делает специалист НИИ. Хотя сейчас это уже может быть не только специалист по планктону, но и, к примеру, студент, который уже освоил использование микроскопа. Со своей стороны мы смотрим, как можно автоматизировать и эту часть процесса.
2. Если это специалист НИИ, тогда разрешение CC0 должно быть опубликовано не от вашего имени, а от имени самого НИИ. Если же это делает студент, который не работает в НИИ и в обязанности которого нет этой работы, тогда разрешение CC0 должно быть опубликовано от имени конкретного студента.
А изображений на текущий момент в гитхабе то нет....
Можно ли сотрудникам других научных учреждений получить тестовый доступ системе распознавания? Например, для ознакомления студентов и аспирантов с новым технологиям в этой сфере.
Как думаете, можно ли применить систему к микробиму других озер региона? Если кто-то из научного сообщества вызовется добавить фото других озер?
Это прямо один из наших планов на будущее - попробовать подключить другие водоемы. Что касается доступа к технологиям - есть планы открыть исходный код и модели.
Для других водоемов нужны данные из других регионов, планируется ли для этого подключать научные организации из других субъектов РФ?
За время разработки и эксплуатации мы несколько раз встречали нюансы, из-за которых достаточно сильно меняли архитектуру решения и мы считаем, что если дойдем до зимнего сезона без дополнительных сюрпризов, то в принципе можно начинать делиться наработками.
Также у нас еще есть несколько подходов к валидации распознанных изображений, которые мы бы хотели сначала протестировать и только потом выложить наиболее подходящий.
Ну и самое главное - наш full-stack хочет сделать рефакторинг перед релизом :)
было около полчаса на одну пробу, а стало то сколько? что то не смог найти эту инфу. статья классная, пишите еще. за датасет спасибо большое, будет интересно с ним поиграться на досуге, как раз сейчас учусь на магистратуре по специальности AI :)
Пока мы знакомим алгоритмы с разнообразием изображений, случается разное. Иногда удается распознать всё и сразу, иногда приходится всю пробу обрабатывать вручную - например с наступлением лета водоросли из отдельных объектов превратились в сплошной фон и до сих пор мешают распознаванию.
Само фотографирование по нашим замерам занимает ~20-25 минут, т.е. получается быстрее, чем проход по пробе, но самое главное - это можно поручить студенту, тогда экономия времени заведующего лабораторией получается стопроцентной при условии 100% распознавания.
У вас очень интересная сфера работы. Не нашел страницу вакансий на вашем сайте. Они у вас есть?
Исследуем микроорганизмы Байкала. Открытый проект MaritimeAI и Yandex Cloud