Как стать автором
Обновить
0
0

Статистический анализ данных/Машинное обучение

Отправить сообщение

@Alexrook,смотрите:

  1. Для того, чтобы хоть как то предметно ответить на ваш вопрос, мне пришлось лезть в гугл и смотреть обертки и фреймворки под Юлю. К примеру, чтобы решить какую нибудь простенькую задачу, например MNIST пошатать или таблички, или временные ряды или еще чтото...
    Ок, я нашел обертку под TF, которая вроде как работает, не проверял, но всеравно допустим она написана чисто хорошо с хорошим "запахом" и кодовым покрытием. И более того, я смогу засервить полученную модель в прод.

  2. Разумеется, для ассесмента запроса заказчика я не могу рекомендовать Юлю, поскольку, я не знаю, есть ли серьезная коммерческая поддержка требуемых фреймворков или поддержки комьюнити... Ну, оно (комьюнити) пока достаточно маленькое, то есть фиксить и контребьютить придется самим и за свой счет, либо заказчика радовать высокими счетами при малом количестве нового полезного функционала.

  3. Допустим мы все нашли и решили вопросы с лицензиями, саппортом и прочими аспектами, и нам надо "застафить" наш проект. Нам нужен софтвер инженер, знающий Юлю, иначе просто нет смысла, мы не получим велью от использования Юли, нужны датасаентисты (поскольку из-за них весь сырбор), возможно датаинженеры, и прочее (там специалисты по автоматизации тестов, если компания богатая и большая, к примеру). Согласитесь, пока проблема?

    Собсвенно вот. Я не спорю, что Julia это офигенная штука и возможно за ней будущее, но сейчас я бы не стал рекомендовать этот технологический стек заказчикам, просто из-за того, что пока глобольного перехода на Julia нет как и комьюнити подобного Python или JS комьюнити пока не сформировалось и денег скорее всего в Julia тоже нет, а вот риски связанные с саппортом, лицензированием и закрытием проектов, как мне кажется огромны.

    В своей практике, пять лет назад я обжигался с TokuMX. Проект был крутой и хайповый, затем стартап, который развивал эту технологию купили, а проект закрыли и нам пришлось пол года выпиливать интеграцию с этой фигней из нашего продукта... В деньгах это было больно.

Скорее всего потому, что в плане DS не особо важно на чем писать.. а питон под рукой есть всегда и с ним хлопот объективно меньше

@egorborisov, у меня несколько замечаний к статье:

  1. Анализ всего текста без исключения «стоп слов».. Выводы получились правдоподобные, но тем не менее. Наличие слов «на», «около» в чарте shap’a на достаточно высоких позициях как бы настораживает.

  2. К регулярным у меня лично вопросов нет, но лемматизация токенов была бы уместнее.

  3. Так же порадовала «Москва», но она имеет право на место в списке важных признаков в отличии от предлогов, к примеру.

  4. Наверное не следовало рассматривать дата инженеров здесь, поскольку их реально на рынке надо гораздо больше, но ODS это хороший ресурс больше про анализ данных, поэтому логично, что сюда чаще приходят за аналитиками и тру DS’ами, нежели за инженерами

В целом выводы достаточно правдоподобны,

Спасибо Вам за статью

Буквально сегодня делал табличку с распределением головняков/обязанностей/скилов в нашем дата-мирке для семейных нужд)))

Будет любопытно ознакомиться с результатами и опроса и выводами.

Вот кстати к вопросам «случайно или специально?» и «самоучка или не самоучка?».

Долго и упорно учился в университете, специальность не IT, но кодить пришлось over дофига.
Затем аспирантура, тоже не IT, но больше трети диссертации по сути расчеты и код. (Самоучка ли? как классифицировать?)

Затем достаточно долго и упорно ждал появление позиции в универе, попутно успев обжиться фриланс аккаунтом на elance (ныне Upwork), а позднее работой разработчиком в штат компании. В результате окончательно обжился в IT. Случайно или нет, тоже вопрос?

Касательно выборки в 700 человек, с учетом всего многообразия мира IT может и мало, но в сравнении с подобными социалогическими исследованиями, считаю вполне годно.
ZlodeiBaal, большое спаибо за материал и исходники!
Собственно вопрос наверное не по теме, но все же почему в работе Вы используете винду, а не тот же macOS к примеру?

Информация

В рейтинге
Не участвует
Зарегистрирован
Активность