Как стать автором
Обновить

Комментарии 27

Спасибо за статью! Но в вашей статье прозвучал хороший вопрос — кто вообще работает за 25 р/час?
Никто. Задания с такой ценой и отложенной оплатой просто не берут (по крайней мере те, кто не «на удачу» задания выбирает).
В основном на Толоке сидят люди из дальних регионов, где работы совсем нет и они готовы работать за любые деньги. На самом деле, если задание сложное и на освоение инструкции исполнителям придется потратить некоторое время, то цена часа вырастает где-то до 70-120 руб.
25р в час — это даже для пенсионера из региона на «минималке» не заработок — просто волонтёрство какое-то. Но я не уверен, что даже этой суммы можно достигнуть, не делая задания на «отвяжись».

Сейчас зарегистрировался, чтобы посмотреть что это вообще такое.
За 2 часа заработал 8 центов. А ведь «яжпрограммист» — человек изначально подготовленный, и умеющий почти моментально извлекать суть из тонн «воды».

Готовы то может быть на любые деньги, но для того, чтобы на Толоке быть разметчиком, нужен компьютер и широкополосный доступ к интернету… окупят ли 25р/ч затраты на работу на толоке — не известно.

Я толокой оплачиваю мобильный. Не то, чтобы я не мог оплатить его иначе, просто это не требует от меня практически никаких трудозатрат.
Если исполнитель 3 раза из 5 отвечает быстрее, чем за 40 секунд, то система его заблокирует.

А на что в этой задаче можно тратить 40 секунд?
На странице с заданием размещено 40 фото. В среднем исполнители 40 фото проверяют за 1 мин 37 сек. Попробовав сам наиболее быстро проверить 40 фото, у меня вышло 52 сек, поэтому было решено, что если исполнитель выполняет быстрее, чем за 40 сек, то либо он невнимательно делает, либо является ботом.
Точно, вижу теперь!
Практически каждый человек знает, что такое машинное обучение...

Очень смелое утверждение.

оно просто немного опережает время, через лет любой программист что бы оставаться на плаву должен будет знать мл, а через 10 любой человек и гуманитарий будет обязан знать, что бы не остаться на отшибе вселенной
НЛО прилетело и опубликовало эту надпись здесь
пхпист?
Практически каждый человек знает, что такое машинное обучение, линейная регрессия, random forest.

Ну, конечно. Буквально сегодня слышал, как консьержка с соседкой обсуждали трансдуктивное машинное обучение.
Скажите, а кто такой Фейс и чем этот человек славен? Киркоров-то известен хотя бы рифмой «звезда-п?? да» в тексте своего экспромпта про розовую кофточку и микрофон, а также тем, что кинул какого-то зарубежного композитора-песенника в ментовку и на деньги, пригласив того сначала в отделение «Сбербанка» договориться о денежном вознаграждении.
фейс — это лицо молодежи
Удалось ли успешно обучить на этом датасете распознавалку Киркорова?
Мы не пробовали) Да и фото Фейса у нас нет, так как я поленился его загружать на Толоку)
Зря вы не сохраняете пропорции лиц, это достаточно стабильная характеристика, которую удобно детектировать. По-хорошему нужно не просто ужимать изображение в квадрат, а проходиться детектором лиц и обрезать вокруг каждого поле нужного размера. В противном случае сети придётся параллельно иметь шаблоны для определения по-разному искажённых преобразованием лиц.
Да, вы совершенно правы. Если бы это была реальная задача, а не игрушечный пример, то я:
1) Скачал бы фото Киркорова.
2) С помощью dlib нашел бы и вырезал все лица
3) Удалил бы все лица, которые меньше 299*299, а все, которые больше 299*299, привел бы к нужному размеру.
4) И уже полученные лица проверил через Толоку.
Среди стандартных шаблонов Толоки есть задание по выделению произвольных полигонов, оно адаптируется для задачи bounding boxes. Если возникнут трудности, можно обратиться в поддержку заказчиков.
«Как создать датасет, который отличает оттенки розового на кофточках журналисток?» :)
Подскажите, это только для классификации работает? Какие-то более сложные типы разметки возможно через Толоку делать? И вообще кто где ищет исполнителей? У нас это целая проблема, расскажите у кого как это происходит?
Так как на Толоке исполнителям задания подаются в написанной вами html, то можно сделать любой тип разметки, который только можно запихнуть в браузер. С готовыми шаблонами вы можете ознакомиться тут.
Возможно 90% задач это покрывает. У нас, например, разметчикам нужно установить специализированное ПО, потратить время на подробные объяснения задачи, и регулярно проверять качество, потому что его сложно формально проверить. Кто-нибудь в курсе, есть ли на рынке компании, которые занимаются разметкой? Мне тяжело поверить, что только у нас такая проблема, хотя может и так.
Регулярную проверку качества и отбор исполнителей можно организовать на Толоке, ограничивая доступ к боевым заданиям на основе значения навыка, получаемого в процессе выполнения проверочных.

Специализированное ПО толокерам устанавливать не получится, но как верно написал kucev выше, интерфейсы заданий в Толоке программируются на JS, поэтому теоретически их можно делать довольно сложными. Ещё могу посоветовать попробовать декомпозировать задачу на несколько частей, которые уже проще краудсорсить.

Если более подробно опишите свою задачу, сможем проконсультировать по её организации в Толоке.
Зарегистрируйтесь на Хабре, чтобы оставить комментарий