Pull to refresh

Comments 14

1) Вы опубликовали датасет при помощи инструмента Creative Commons CC0, то есть объявили, что все права на этот датасет перестали существовать, датасет перешёл в общественное достояние.

Такой поступок очень редко встречается в российских НИИ, вузах и академических институтах. Что привело вас к такой щедрости, к такому благородству? Почему вы, в отличие от «Яндекса», не стали продавать права на фотографии?

2) Рассказывая про датасет, вы написали: «a specialist now takes photographs by saving frames from the microscope’s camera». Снимки делает специалист вашей компании? Или специалист из университета?

Спасибо.
  1. Это решение НИИ. Им к научным статьям нужно прикладывать данные, к тому же есть желание наладить взаимодействие с другими научными организациями, выполняющими похожие работы. Мы будем постепенно открывать всё больше данных, добавляя новые атрибуты к объектам и расширяя выборку за счет новых фотографий.

  2. Съемку делает специалист НИИ. Хотя сейчас это уже может быть не только специалист по планктону, но и, к примеру, студент, который уже освоил использование микроскопа. Со своей стороны мы смотрим, как можно автоматизировать и эту часть процесса.

1. Спасибо. Из ваших слов я понял, что решение принимали в НИИ и вы не знаете подробностей об их мотивах. Собственно, причина моего вопроса в том, что на своём сайте НИИ не даёт никаких разрешений, не позволяет никому использовать свой контент. Вот отсюда и появляются подозрения.

2. Если это специалист НИИ, тогда разрешение CC0 должно быть опубликовано не от вашего имени, а от имени самого НИИ. Если же это делает студент, который не работает в НИИ и в обязанности которого нет этой работы, тогда разрешение CC0 должно быть опубликовано от имени конкретного студента.

А изображений на текущий момент в гитхабе то нет....

Но в json-файле есть ссылки на скачивание этих изображений.

С учетом количества изображений нам никакого git lfs не хватит уже сейчас, не говоря уже о пополнении датасета, поэтому сами изображения мы храним вне гитхаба.

  1. Можно ли сотрудникам других научных учреждений получить тестовый доступ системе распознавания? Например, для ознакомления студентов и аспирантов с новым технологиям в этой сфере.

  2. Как думаете, можно ли применить систему к микробиму других озер региона? Если кто-то из научного сообщества вызовется добавить фото других озер?

Это прямо один из наших планов на будущее - попробовать подключить другие водоемы. Что касается доступа к технологиям - есть планы открыть исходный код и модели.

Для других водоемов нужны данные из других регионов, планируется ли для этого подключать научные организации из других субъектов РФ?

За время разработки и эксплуатации мы несколько раз встречали нюансы, из-за которых достаточно сильно меняли архитектуру решения и мы считаем, что если дойдем до зимнего сезона без дополнительных сюрпризов, то в принципе можно начинать делиться наработками.
Также у нас еще есть несколько подходов к валидации распознанных изображений, которые мы бы хотели сначала протестировать и только потом выложить наиболее подходящий.
Ну и самое главное - наш full-stack хочет сделать рефакторинг перед релизом :)

было около полчаса на одну пробу, а стало то сколько? что то не смог найти эту инфу. статья классная, пишите еще. за датасет спасибо большое, будет интересно с ним поиграться на досуге, как раз сейчас учусь на магистратуре по специальности AI :)

Пока мы знакомим алгоритмы с разнообразием изображений, случается разное. Иногда удается распознать всё и сразу, иногда приходится всю пробу обрабатывать вручную - например с наступлением лета водоросли из отдельных объектов превратились в сплошной фон и до сих пор мешают распознаванию.

Само фотографирование по нашим замерам занимает ~20-25 минут, т.е. получается быстрее, чем проход по пробе, но самое главное - это можно поручить студенту, тогда экономия времени заведующего лабораторией получается стопроцентной при условии 100% распознавания.

Студент не работник вуза. Студент не выполняет служебное задание по трудовому соглашению. Фотографии, сделанные студентом, являются только его собственностью, а не собственностью вуза.

И это — очень опасное место вашей технологии.

У вас очень интересная сфера работы. Не нашел страницу вакансий на вашем сайте. Они у вас есть?

Sign up to leave a comment.