Интересная задача, но правда кажется, что здесь приведена только первая половина статьи с постановкой и выбранным методом, но практически без результатов и метрик качества :) . Очень бы хотелось увидеть финальный продукт, начало классное! Есть несколько смущающих меня моментов, может и Вы найдете какие-то идеи для себя.
Во-первых, хотелось бы обучать модель на одной игре, а валидировать на игре других команд, чтобы было по-честному.
Во-вторых, не знаю как Вам, но мне кажется, что спортивные сцены всегда по своей сути динамичны, поэтому классификатор может сильно лучше заработать, если на вход подавать не 1 кадр, а серию, например, из 3 кадров, вырванных с интервалом с несколько десятых секунды.
В-третьих, можно присмотреться к затратным сетям, описывающим постановку рук ног человека. С этой информацией классификатор должен справляться намного лучше, но и данные становятся сильно дороже. Опять же, от масок с большим количеством пустой информации можно перейти к более формальным данным, сильно снизив размерность задачи. Например, использовать координаты, ширину и высоту фигур людей, упорядоченных в каком-то определенном порядке.
В-четвертых, очень не хватает confusion matrix. Тот же переходный процесс от расстановки к игре и от игры к празднованию - очевидная проблема для классификации.
Как мне видится процесс разметки данных. Пишем скриптик, который в очень замедленном режиме будет воспроизводить видео. Даем оператору возможность нажимать 4 кнопки: c n p s - каждая маркирует начало каждой стадии игры. Т.о. получаем таймлайн разметки игры. В последствии выдираем кадры из размеченной части датасета, при этом стараясь не нарываться на переходные от одной стадии к другой фрагменты. Имея размеченный по времени датасет мы можем в тч играться с подачей в модель серий кадров, менять алгоритмы постобработки и тп. Опять же, мы точно знаем, сколько человек должно быть на площадке. Это может нам сильно помочь с выбором threshhold’ а динамически, просто отбирать 12+1 фигур, похожих на человека в кадре, а не играться с линией отсечения.
Во-первых - это весело. Во-вторых - хотелось бы видеть, что я/меня не топят, выключен свет на кухне, окно закрыто, да мало ли что еще. В конце концов, наконец узнать, где кот спит, когда меня нет дома.
А есть игрушки, которые можно по usb/bt/wi-fi соединить с телефоном и использовать телефоньи мозги, датчики, экран и тп? На взгляд дилетанта очевидно, насколько умнее можно сделать машинку/робота/коптер, соединив его с телефоном.
Как минимум, у меня уже 100 лет есть идея такого домашнего охранного устройства. Базовая станция, подключенная к электросети. На ней заряжается машинка, ну скажем см 20-40 длиной, дорожный просвет несколько см, чтобы переползать через пороги. В машинку установлен телефон. По команде из веб-интерфейса машинку при помощи телефона можно отправить по квартире с включенной камерой - просто своими глазами проверить, что дома все ОК, пока тебя нет. Можно записать маршрут - пусть сама ездит и возвращается на базу заряжаться по расписанию. Можно дооснастить подъемником телефона, чтобы рассматривать детали с бОльшей высоты. Подобных игрушек - море, остается только добавить контроллер и написать не самое сложное мобильное приложение.
Мне кажется, не слишком безопасно, что адреса ваших клиентов постоянно светятся в интерфейсе и знакомы персоналу настолько, что они по ним идентифицируют конкретные заказы. Понятно, что это не ПД в полном смысле этого слова, но тем не менее явно не бесполезная информация для разного рода мошенников. Да и просто возможны накладки, когда кто-то узнает, что заказывают его знакомые просто по адресу. Мне кажется, идентификаторы здесь уместнее. И да, чтобы 2 раза не вставать, еще пара моментов. Те самые адреса чаще всего прикрепляются степлером к пакету на бумажке, адрес написан от руки. Явно виден простор для автоматизации. 2. Хотелось бы иметь возможность отдавать пакеты в переработку прямо курьеру, принесшему новый заказ, ибо пакетов получается много.
Кажется, что в данных есть смещение, очень уж сильно текущая ЗП улетает временами от вакансий. Не может быть такой ситуации, что в калькуляторе отмечаются в основном джуны, а в вакансиях требуются сениоры? Понятно, что некоторое смещение всегда будет. На работном сайте чаще ищут инфу по зарплатам те, кто ищет, а ищут часто из-за низкой оплаты. И наоборот. Если уж пишут ЗП в вакансии, то часто это значит, что все горит, человек нужен вчера и ему готовы переплачивать. Но все равно как-то далековато.
https://linguatrip.com/blog/english-levels/ как вариант, такие оценки много где встречал. Насколько я понимаю, как-то так рассчитаны и книжки. 1 книга на семестр или год, в зависимости от интенсивности. Каждая книга на 1 уровень, те самые 100-200 часов. Я думаю, вы себя сильно недооцениваете.
Ну и еще немного пояснения. Мне кажется, B2 у меня был в конце школы, либо очень близко к тому, ездил на районную олимпиаду :). Меньше лексики и грамматики, зато больше беглости. В ВУЗе держал его же несколько лет. Лексики и грамматики добрал, потерял в беглости. После ВУЗа еще пару раз дотягивал куда-то туда курсами, сейчас сильно упал из-за 0 практики. По словарному запасу вроде как даже выше нормы. Зато просто 0 грамматики, ушло произношение, 0 беглости речи, в сумме недо-B1.
Точно не 1000, это с нуля можно до С дойти с такими объемами. Много где видел, что на каждую ступеньку английского надо около 100-200 часов. Плюс вспоминать должно быть дешевле, чем с 0 учить. Мне кажется, что при 2 занятиях в неделю + адекватной домашке я за полгода до B2 *в своем представлении* дотянусь. Лексика в пассивном словаре есть, ее надо вытянуть в актив. Натаскать основные конструкции, подчистить произношение, поработать над беглостью речи и письма. И как-то подтянуть грамматику так, чтобы эта работа не убила беглость. На этом я засыпался в предыдущие подходы.
Почему ты не учишь английский язык?
Потому что это отдельная работа, которая сейчас для меня не в приоритете. Есть миллион вещей, который можно и нужно выучить, чтобы оставаться конкурентоспособным. И честный B2+ не в топе моих личных приоритетов.
Я прекрасно читаю техническую литературу на английском без обращения к словарям и справочникам. С гуглотранслейтом могу составить кривоватое письмо. И, краснея, пользуясь от силы 1000-2000 слов и простейшей грамматикой, изъясниться устно. Меня поймут, но всем будет неловко.
Чтобы перейти на честный B2 мне нужно много работать над устной и письменной речью. Ориентировочно, ввалить в это 100ч времени. Что я получу взамен? Эфемерную возможность легкой переписки и речи. Вероятность, что это мне реально понадобится — процентов 5-10.
За те же условные 100ч можно выучить достаточно практических вещей, которые мне интереснее и с большей вероятностью встретятся в работе.
Плюс не забываем, что силы не бесконечные. 4 часа на английский в неделю так или иначе идут минусом к основному рабочему времени. Я тупо на 10% больше устаю и соразмерно снижается моя производительность труда. Не уверен, что и я и работодатель этого хотим.
В общем, у меня изрядно пригорает от того, что невладение идеальным английским сейчас воспринимается исключительно как лень.
Ну как такси, в том-то и дело. В части регионов это скорее почти профессиональное такси с профессиональными автопарками. В части — шабашащие автовладельцы на своих машинах. Как их там проверяют отбирают мы не знаем. Так что это не такси, а скорее сервис по «своду» клиента и желающего подзаработать автомобилиста. Пока оператору это удобно — они такси. Как только перестает быть удобным — сразу всплывают контрагенты, местные представители и тонна прослоек, а они опять начинают продавать только информационное сопровождение. Т.ч. ЯндексGO такое же такси, как Ebay — магазин.
Даже странно, что у слова «виктимшейминг» нет прямого аналога в русском языке. 2/3 комментариев в чем-то обвиняют потенциальную жертву, но никак не оператора потенциально опасной услуги. Правда, что мешает иметь отдельный штат операторов для линии безопасности? Чтобы все эти немногочисленные инциденты можно было разбирать максимально быстро и эффективно. В чем проблема? Можно ли решить ее звонком водителю? Если нет, то вызвать полицию по координатам. И в идеале это все решать в режиме звонка (когда это возможно), а не набора текста на телефоне. Понятно, что может быть все что угодно, что в интересах клиента делать все для своей безопасности, что риски невелики, но тем не менее.
Не поддерживаю от начала до конца. Я вот сейчас не могу сказать, хочу я работать условным столяром или не хочу. Я не умею в этой профессии ничего, я ей не учился, я не пробовал этим заниматься для души, я не пробовал этим заниматься за деньги. У меня просто нет знаний чтобы сказать, хочу я этим заниматься или нет. То же самое с 99% профессий кроме тех, в которых я оказался по большому счету случайно. По 1% профессий у меня к 30+ годам есть какое-то смутное ощущение, чем заняты эти люди, что им нравится в их работе, что нет и насколько я похож на этих людей. Кто его знает, может я бы мог плитку класть лучше всех в городе и быть счастливым? После обучения и получения соответствующего опыта, с нормальным инструментом, материалами и заказчиками? Откуда 15-летний подросток может получить знания, чтобы сделать осознанный выбор и разумно подготовиться к поступлению в куда ему там надо? Как он поймет, это он так опыта набирается, или он неправильно выбрал профессию? В общем, осознанный выбор профессии — это какой-то единорог для меня. Было бы круто, если бы он существовал, но я в него не верю.
А на тот мегапост был подробный ответ? Просто человек подсветил очень много моментов, не только и не столько проблемы конкретного курса, а системные вещи. Неэтичное ревью, хамство менеджера, неотлаженную систему автопроверки, странный возврат денег, очень много чего. Тут мне кажется проблема не только в программе курса.
А сама ситуация, при которой сбой в локере позволяет получить доступ к рабочему столу, точно не повод для беспокойства? Это ведь может стать входом и для более осмысленных атак, если я все правильно понимаю.
Интересная задача, но правда кажется, что здесь приведена только первая половина статьи с постановкой и выбранным методом, но практически без результатов и метрик качества :) . Очень бы хотелось увидеть финальный продукт, начало классное! Есть несколько смущающих меня моментов, может и Вы найдете какие-то идеи для себя.
Во-первых, хотелось бы обучать модель на одной игре, а валидировать на игре других команд, чтобы было по-честному.
Во-вторых, не знаю как Вам, но мне кажется, что спортивные сцены всегда по своей сути динамичны, поэтому классификатор может сильно лучше заработать, если на вход подавать не 1 кадр, а серию, например, из 3 кадров, вырванных с интервалом с несколько десятых секунды.
В-третьих, можно присмотреться к затратным сетям, описывающим постановку рук ног человека. С этой информацией классификатор должен справляться намного лучше, но и данные становятся сильно дороже. Опять же, от масок с большим количеством пустой информации можно перейти к более формальным данным, сильно снизив размерность задачи. Например, использовать координаты, ширину и высоту фигур людей, упорядоченных в каком-то определенном порядке.
В-четвертых, очень не хватает confusion matrix. Тот же переходный процесс от расстановки к игре и от игры к празднованию - очевидная проблема для классификации.
Как мне видится процесс разметки данных. Пишем скриптик, который в очень замедленном режиме будет воспроизводить видео. Даем оператору возможность нажимать 4 кнопки: c n p s - каждая маркирует начало каждой стадии игры. Т.о. получаем таймлайн разметки игры. В последствии выдираем кадры из размеченной части датасета, при этом стараясь не нарываться на переходные от одной стадии к другой фрагменты. Имея размеченный по времени датасет мы можем в тч играться с подачей в модель серий кадров, менять алгоритмы постобработки и тп. Опять же, мы точно знаем, сколько человек должно быть на площадке. Это может нам сильно помочь с выбором threshhold’ а динамически, просто отбирать 12+1 фигур, похожих на человека в кадре, а не играться с линией отсечения.
Спасибо! Я ж понимал, что эта мысль витает в воздухе, но ни разу воплощения не видел.
Во-первых - это весело. Во-вторых - хотелось бы видеть, что я/меня не топят, выключен свет на кухне, окно закрыто, да мало ли что еще. В конце концов, наконец узнать, где кот спит, когда меня нет дома.
А есть игрушки, которые можно по usb/bt/wi-fi соединить с телефоном и использовать телефоньи мозги, датчики, экран и тп? На взгляд дилетанта очевидно, насколько умнее можно сделать машинку/робота/коптер, соединив его с телефоном.
Как минимум, у меня уже 100 лет есть идея такого домашнего охранного устройства. Базовая станция, подключенная к электросети. На ней заряжается машинка, ну скажем см 20-40 длиной, дорожный просвет несколько см, чтобы переползать через пороги. В машинку установлен телефон. По команде из веб-интерфейса машинку при помощи телефона можно отправить по квартире с включенной камерой - просто своими глазами проверить, что дома все ОК, пока тебя нет. Можно записать маршрут - пусть сама ездит и возвращается на базу заряжаться по расписанию. Можно дооснастить подъемником телефона, чтобы рассматривать детали с бОльшей высоты. Подобных игрушек - море, остается только добавить контроллер и написать не самое сложное мобильное приложение.
Минутка статистики. 2,5 года Senior, >100 собесов по этой позиции. Т.е. раз в 1-2 недели по собесу.
И еще одна история, как центр Красноярска оказался на КДПВ?
Огромное спасибо за статью! Я бы сам до шестиугольников еще долго не дошёл, хотя с географией работаю.
Пс. Главное, чтобы никто не бросился по этой тепловой карте строить кофейни в Краснодарском Шанхае ;)
Огромное спасибо за ту статью. И результат крутой, и оформление статьи, и понятное описание, что где и как делали.
Боюсь, там нет циана и домклика :) Только руками парсить агрегаторы недвижимости местные.
Ну и еще немного пояснения. Мне кажется, B2 у меня был в конце школы, либо очень близко к тому, ездил на районную олимпиаду :). Меньше лексики и грамматики, зато больше беглости. В ВУЗе держал его же несколько лет. Лексики и грамматики добрал, потерял в беглости. После ВУЗа еще пару раз дотягивал куда-то туда курсами, сейчас сильно упал из-за 0 практики. По словарному запасу вроде как даже выше нормы. Зато просто 0 грамматики, ушло произношение, 0 беглости речи, в сумме недо-B1.
Потому что это отдельная работа, которая сейчас для меня не в приоритете. Есть миллион вещей, который можно и нужно выучить, чтобы оставаться конкурентоспособным. И честный B2+ не в топе моих личных приоритетов.
Я прекрасно читаю техническую литературу на английском без обращения к словарям и справочникам. С гуглотранслейтом могу составить кривоватое письмо. И, краснея, пользуясь от силы 1000-2000 слов и простейшей грамматикой, изъясниться устно. Меня поймут, но всем будет неловко.
Чтобы перейти на честный B2 мне нужно много работать над устной и письменной речью. Ориентировочно, ввалить в это 100ч времени. Что я получу взамен? Эфемерную возможность легкой переписки и речи. Вероятность, что это мне реально понадобится — процентов 5-10.
За те же условные 100ч можно выучить достаточно практических вещей, которые мне интереснее и с большей вероятностью встретятся в работе.
Плюс не забываем, что силы не бесконечные. 4 часа на английский в неделю так или иначе идут минусом к основному рабочему времени. Я тупо на 10% больше устаю и соразмерно снижается моя производительность труда. Не уверен, что и я и работодатель этого хотим.
В общем, у меня изрядно пригорает от того, что невладение идеальным английским сейчас воспринимается исключительно как лень.