Как стать автором
Обновить

Комментарии 5

Участие в подобных мероприятиях необходимо для профессионального роста. Скорость развития Data Science растет, работы устаревают еще до момента их презентаций на конференции, а большая часть работ оказывается забытой после завершения конференции. — мне кажется, или это взаимоисключающие параграфы: зачем тратить время на мероприятия, где презентуют уже устаревшие технологии?
Тем более, ~2% бесполых существ (ангелы? разумные электрочайники??) обсуждают важность каминг-аутов перед коллегами: мне всегда казалось, что на работу ходят работу работать, а не рассказывать, как офигенно спалось с особью своего/противоположного пола, бесполой, или вовсе — акулой из икеи.
Хотя, я бы взглянул на серьёзное исследование типа «влияние каминг-аутов на качество модели и скорость обучения нейросетей» /irony
Вижу два вопроса, постараюсь ответить последовательно:
1) зачем ходить на мероприятия с устаревшими результатами?
Такова природа конференций и статей: предаются гласности те идеи, которые уже получили подтверждение. Количество материала даже с таким условием настолько велико, что за всеми статьями не уследить. Если дать возможность исследователям публиковать еще не подтвержденные результаты на уровне идеи, то количество работ еще больше увеличится, а качество их упадет, т.к. именно практические результаты говорят о жизнеспособности идеи. Хорошо, что есть возможность следить хотя бы за теми работами, которые были выполнены 6 месяцев назад, иначе можно совсем отстать от жизни.

2) Социальные нюансы автором статьи поставлены на первое место, однако этот вопрос субъективный и остается полностью на совести автора.
ML серьёзно не занимался, больше data engeneer поэтому любопытно: как говорится, «есть 57 способов сочинять музыку и всё они правильные» — какая разница, если используется не самая подходящая сеть для моделей / не самая актуальная сеть? Медленнее обучение? Меньше валидность?
С ETL всё просто: грузи/преобразуй чем умеешь: Informatica, NiFi, Airflow — да хоть руками файлы таскай и запросы выполняй, результат будет одинаковый.
в ML есть множество способов решить задачу, и в первую очередь проверка на практике может дать критерий «правильности». Не самая хорошая модель будет давать хуже предсказания, или делать это медленней, или требовать тщательного мониторинга и частого до-обучения. В принципе, возможно свести задачу к деньгам и сравнить затраты на улучшение модели с выигрышем от ее улучшения хотя бы на уровне оценки. В некоторых задачах доли процентов от качества предсказания модели являются существенными, но далеко не во всех. Бывает, что простые эвристические правила оказываются настолько сильными, что ML и не нужен.
какая разница, если используется не самая подходящая сеть

Есть много задач, которые на текущий момент не решены нормально. Например, сопоставление лиц в видеопотоке с базой на миллионы людей. И тут разница в том, что можно получить хоть сколько-нибудь приемлемый результат, а можно получить неприемлемый. И самые свежие идеи как раз и проводят грань между этими двумя вариантами — получится или нет.


А в более простых задачах гнаться за новинками действительно незачем.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий