Pull to refresh
56
0
Андрей Лукьяненко @Artgor

Data scientist @ Careem (Dubai)

Send message
Если это стол для работы в open space, то хотелось бы иметь перегородки повыше…
> Если попробовать унифицировать, то стандартный путь горизонтальной карьеры: стажер или Junior DS, затем Middle DS и Senior DS.

А мне казалось, что это вполне себе вертикально…
Активно участвую в работе над этим проектом и мне он очень нравится. Приглашаю интересующихся тоже поучаствовать в нём :)
Как обычно — компании хотят иметь человека, который будет уметь прям вообще всё.
Опыт. Работаю в DS около 2-х лет и могу с уверенностью сказать, что «простая нейросеть на гитхабе» — это примерно ничего. Научиться делать такое, если не вникать в теорию и повторять изученное, можно за пару дней. Сейчас есть большое количество качественных курсов по DL (deeplearning.ai, fastai, udacity nanodegree) и другие, которые учат писать сложные нейронки, но и этого недостаточно.
Если хочется работать по направлению ML, то для начальных позиций надо знать SQL, понимать принципы работы основных алгоритмов, знать немного статистики (p-value, ошибки 1 и 2 рода, статистические критерии), знать общие вещи по ML/статистике (какие метрики бывают и когда применяются, какие существуют способы валидации, что такое оверфиттинг и как с ним бороться, как готовить данные для машинного обучения и т. д.). Это примерный, возможно неполный список. Желательно иметь хоть какие-то завершенные проекты (даже если это кернелы на каггле).
В случае DL будет другой спрос — будут спрашивать про архитектуру нейронных сетей, про разные слои, оптимизаторы, деплой и многое другое.

А на удалёнку совсем уж новичков вряд ли возьмут, так что требования будут повыше.
Я скорее про это:
— вначале переехали, потратили много времени на изучение ML, а только потом стали смотреть, если ли в этом городе вакансии
— был план приехать куда-то, потом поехать в другой город. В реальности в другой город переезжать не захотели
Потому, что этого совсем недостаточно, чтобы получить работу :)
Что-то я не очень понимаю историю:
Изначальный план был — поехать в Германию «туда, куда берут», а потом поехать работать в большой город.
Реальность: приехали в небольшой город, год изучали ML и только потом стали смотреть есть ли вакансии — оказалось рядом их нет.
Как-то одно противоречит другому.

А потом и в большой город ехать расхотели.

Вполне понятно, что в маленьком городке может не быть каких-то вакансий — имхо, надо об этом заранее думать.

>Поэтому не повторяйте моих ошибок. Несколько дней вдумчивого анализа могут сэкономить вам уйму времени.
Полностью поддерживаю. Тем более, что это предварительный анализ ситуации — один из необходимых навыков для специалиста по машинному обучению.

В общем искренне желаю успехов в развитии.
Ну, увы :) Возможно, что хорошо зарабатывающие не участвуют в Каггл, а может всё действительно так и есть.
В этом году microsoft объявили о своём фреймворке ML.NET
blogs.msdn.microsoft.com/dotnet/2018/05/07/introducing-ml-net-cross-platform-proven-and-open-source-machine-learning-framework там C# играет важную роль.
Tensorflow выпустил свой TF.js — версию для JS.
Ну и всех этих языков возможен другой вариант: программисты, знающие эти языки, перешли в DS, возможно на Python, а в опросе указали все известные им языки.
Решил в статью пока не добавлять, вот данные: gist.github.com/Erlemar/5cc82b706b5d237127264a2de2c58398

Лидируют маленькие страны типа Сингапура. Америка на 12-м месте, Россия на 29-м, Индия на 38-м.
Спасибо за комментарий, не заметил, что этот график не упорядочен. Исправил.
В данном случае учитывались голоса людей в опросе. Количество просмотров никак не учитывается.
Да, возможно стоило бы :) Решил оставить, чтобы было видно как люди указывают схожие вещи, возможно был не прав.
Вот честно, я прочитал эту книгу уже давно, она мне понравилась, но не могу понять такой хайп вокруг неё. Книга крутая, но в ней немало проблем.
Был техническим экспертом на этом хакатоне. Ваше выступление было реально интересным, да и код был качественным. Заслуженная победа :)
Я могу ошибаться, но в википедии под «регрессией» имеется ввиду не задача регрессии в противоположность задаче классификации, а регрессионный анализ. А регрессионный анализ — это оценка влияния независимых переменных на зависимую.
Зарегистрировался из любопытства. Первое впечетление — среднего качества подобие linkedin.
Реализация некоторых вещей вызывает вопросы.
Например, заполнил профиль и нажал кнопку сохранения. Секунд 10 вообще ничего не происходит, затем внезапно показывается обновленный профиль. Могли бы хоть показать, что сайт думает.
Для дат начала/окончания учебы и работы обязательно указываться не только месяц-год, но и число, при этом в профиле число не указывается. Причем не 3 отдельных поля, а типа листаемый календарик — удобно для указания дат, близких к текущей дате, но для старых дат не очень.
Иногда кликаешь что-то — нет реакции, кликаешь ещё раз — действие произошло 2 раза.
Степень образования (бакалавр, магистр, phd) нельзя указать.
Раздела для сертификатов/курсов нет. Зато есть раздел с достижениями, где их 4 вида: Грамота/благодарость, статья, проект, участие.
И куча мусора в мастер-данных.
Стало интересно по поводу оплаты — насколько сможете конкурировать с Amazon/ Google Cloud?

Возможна ли самостоятельная установка необходимых библиотек?

Ну и в целом, в чем преимущество перед тем же Colaboratory?
Как хорошо, что я успел сменить направление работы с внедрения ERP-систем на data science
:)

Information

Rating
Does not participate
Location
Москва, Москва и Московская обл., Россия
Works in
Date of birth
Registered
Activity

Specialization

Data Scientist
Lead
From 500,000 ₽
Python
Machine learning
Deep Learning
Natural language processing
Neural networks