Идея построения дерева для LM не нова. Вот, например, попытка из 2005: https://www.iro.umontreal.ca/~lisa/pointeurs/hierarchical-nnlm-aistats05.pdf В этой же работе утверждается, что перфоманс сетей сильно зависит от способа построения дерева. В работах позднее сравниваются другие способы построения эмбеддингов LM между собой, в том числе с деревом. Выясняется, что дерево работает не лучше некоторых других более простых способов. Если интересна тема развития эмбеддингов, то вот хорошая отправная точка: https://lilianweng.github.io/posts/2017-10-15-word-embedding/
В cs231 есть другое мнение на этот счет (п.6 Summary):
Take note of the hyperparameters that gave the best results. There is a question of whether you should use the full training set with the best hyperparameters, since the optimal hyperparameters might change if you were to fold the validation data into your training set (since the size of the data would be larger). In practice it is cleaner to not use the validation data in the final classifier and consider it to be burned on estimating the hyperparameters.
Дефицита не будет успокойтесь, есть схемы для обхода любых санкций. Самая простая - создаём контору в Китае, покупаем любое железо у условного Интела, продаём в Россию. Это ведёт к издержкам и увеличению цен процентов на 10, но исчезновения не будет. К тому же уверен, есть схемы гораздо изощреннее. Деньги всегда найдут дорогу.
У меня такая же история, как у автора. Проблема в том, что когда приходишь на госпредприятие после института, все это воспринимается "ок", потом привыкаешь. Если же ты живешь в провинции, где твое предприятие - топ по уровню зарплат (500-1000 баксов в месяц, да), то все рассказы из интернета про дефицит кадров, зп по 300к и увольнения каждые 1.5 года воспринимаются как сказки. Также, как Москва воспринимается сказочным городом, и все что там происходит - не правда.
А потом у тебя открываются глаза. Резко. Ты понимаешь, что ты был в секте, и тебе основательно промыли мозги. Ты смотришь на своего бывшего коллегу и говоришь ему "давай, у меня получилось и у тебя получится, греби из болота!", а ему не надо. Он не понимает, у него глаза не открылись, и может быть никогда не откроются. Так и проработает там 30 лет до пенсии, вечно виноватым рабом, которого начальник натурально кроет матом с визгами каждый день, для бодрящего настроения.
Если вы регулярно приходите на работу мокрый, заливаете водой свое рабочее место и всех окружающих вас коллег, а на просьбу "купи ты уже зонт" вы начинаете кричать "не хочу кормить производителей зонтов, дождя не существует!", затем покупаете муляж зонта из папье-маше в 5 раз дороже настоящего, то почему вы возмущаетесь, что вас хотят уволить?
Если я буду бессмертным, со способностью итеративно улучшать возможности своего тела и бесконечно совершенствоваться в своей профессии, то какое мне будет дело до поумневших тараканов? Они догонят меня только спустя сотни тысяч лет, если им повезет. И тоже начнут решать проблему бессмертия. С точки зрения эволюции это всего-лишь смена фазы развития - с количества на качество.
С моей точки зрения умирание человека >> непоявление человека. Да и опыт отцовства тоже на любителя, если честно, не всем зайдет (я не Вика, btw). К тому же умирать только ради того, чтобы ребенок испытал "радость" родительства это... странно. Кринжово, я бы даже сказал. Поэтому мой ответ нет - я не соглашусь умереть от старости/добровольно ради чьих-либо хотелок.
Возможно, у человека дислексия. У моей супруги такая беда. Она в принципе не может писать правильно, в каждом слове по три ошибки. Бывает пишет просто не то слово. Вслух читает по слогам. Но при живом общении никогда не догадаешься об этом. Она закончила на инженера-строителя с отличием, немного поработала по специальности, но все же сменила профессию на дизайнера из-за хейта со стороны работодателей и коллег. Кодер-дислексик, должно быть, очень упорный человек, потому что читать доки ему в 3 раза сложнее. Хотя, возможно, читает он нормально.
Возможно вы просто никогда не занимались работой, которая категорически вам не нравится.
Я по природе сильно выраженный интроверт, очень не люблю общаться с людьми, меня это безумно напрягает. У меня нет друзей, я не хочу звонить своим знакомым/родственникам, и всегда сливаю любые корпоративные мероприятия. Но судьба занесла меня на менеджерский карьерный трек, потому что там хорошо платят, а я считал что работа не должна нравиться, она должна приносить деньги. Я хорошо мимикрирую под социального человека, а неплохие аналитические способности и сильная эмпатия позволяют мне относительно неплохо управлять коллективом.
И вот я каждый раз приходил на работу, спрашивал себя "какого черта я здесь делаю?" и начинал активную социальную жизнь - совещания, планерки, руководство своей командой, отчеты, координация другой команды, весь день на телефоне. После работы я вымотанный приходил домой и не хотел разговаривать ни с женой, ни с ребенком. Часто срывался на них и кричал. Один раз ударил жену, которая устроила мне вечер с кино и вкусняшками, что практически привело к разводу. Меня натурально трясло перед выходом на работу после отпуска или даже выходных. А на корпоративах я должен был всегда быть и еще толкать речь, что добавляло стресса в бочку со стрессом. Потом до меня дошло, что к черту эти деньги, меня так в 40 лет с работы вперед ногами вынесут. Я перешел джуном в DS, сократил общение с людьми до необходимого минимума. Вот уже год меня прет от моей работы, я счастлив на нее приходить и с нее уходить, весь год я ни разу ни на кого не кричал и вообще забыл что это такое.
Я в 32, сравнивая себя с 20-летним, могу сказать, что сейчас я умнее, быстрее соображаю, и в целом принимаю намного более эффективные решения.
Ощущение, как будто раньше я смотрел на мир сквозь "мыло", как будто зрение -7. А с возрастом резкость выросла и я стал видеть вещи намного глубже и четче.
Fun fact: в ПК игры я сейчас играю объективно лучше, чем в студенчестве - на изи прохожу те места, которые раньше были серьезным препятствием. Хотя жаль что студентом я мог засесть и на 8 часов, сейчас хоть час бы найти после работы, самообразования и дел семейных.
А еще мое здоровье и самочувствие в 32 лучше, чем в 20, но это из-за некоторых особенностей здоровья и прикладываемых усилий по их компенсации.
Перефразируя известную фразу: Вы, конечно, можете нанимать только тех, у кого есть огонек в глазах, но когда нужен будет человек чтобы работать - зовите.
Со школы компьютер у меня использовался только для "поиграть". Брат в это время писал дипломную работу, как часть диплома у него была небольшая программа. Он пытался привить мне интерес к кодингу (я был примерно в 5 классе), я попробовал Basic, затем что-то сделать на Delphi, и как-то не затянуло. Выучился на инженера связи, пошел связистом на железную дорогу - в далеком сибирском городе другой работы кроме как у военных и железнодорожников просто нет.
Всегда был отличником и любил учиться, а тут было много моментов, когда на работе не надо было работать, а тупо присутствовать "на контроле". Чтобы мозги не превратились в кашицу, решил что-нибудь учить, да посложнее. Выбор пал на C++. Взял Прата и начал потихоньку идти, с самых азов, запуская и разбирая каждый пример, решая каждую задачу несколькими способами. Через год перевели на инженера, а там я увидел древние проблемы, которые могу решить. Тумблер щелкнул. Написал одну вещь. Понял границы применимости C++, пошел дальше. Visual Basic, бек и фронт на JS, базы данных. Написал просто самосвалы очень плохого кода (который неплохо работал и работает до сих пор, но поддерживать его было решительно невозможно), потому что учиться было не у кого. В это время двигался по карьерной лестнице до менеджерской позиции.
Спустя 7 лет после устройства на дорогу, пришлось делать выбор - связист/менеджер или программист. Тут я понял, чего действительно хочу. Осталось побороть безумно сильный синдром самозванца, но меня уже было не остановить. Закончил платный онлайн-курс, параллельно еще пяток бесплатных курсов, уволился с работы чтобы начать учиться фулл-тайм и параллельно искать работу в дефолт сити (в родном городе единственные IT-вакансии - это эникейщики с зарплатами уборщицы). Два месяца рассылал резюме, безуспешно пытаясь пробиться сквозь HR-фильтр, и наконец прошел первое же назначенное собеседование. Наскреб по сусекам денег, взял семью и перевез в ДС. Так я лишь в 30+ лет начал заниматься тем, от чего меня прет.
Оглядываясь назад, я поражаюсь, насколько сильной была мотивация, протащившая меня через огромное количество трудностей.
«Пощупали», «палочкой потыкали» или реально погрузились в каждый из пунктов?
Я не знаю как можно реально погрузиться в каждый. Один С++ чего стоит. Но с него я вообще начал писать код. В 2013 году скачал книжку Прата, и попер по теории и всем упражнениям, ловя кайф от решения задач. Затем искал на работе что-нибудь, к чему можно применить свои знания. Решал какие-нибудь мелкие задачки (потому что крупных не было). Выйти в большой мир и прицепиться к опен-сорсу мешал дикий синдром самозванца. IT предприятий в городе тогда не было, да и в 2020 их нет. Боюсь, к 2050 их там тоже не появится.
А тяга писать код была. Вот и штудировал книжку за книжкой, делая игрушечные проекты (поскольку переводные книжки отстают от технологий на пятак лет в лучшем случае, то о пользе сами понимаете, но я этого тогда не знал). Потом стал начальником отдела, и увидел некоторые процессы, которые можно цифровизовать. Запустил от начала и до конца один проект. Смотрю — люди пользуются. Попросили сделать еще вот это. Запустил второй. Тоже пользуются. Однако качество моих проектов оставалось ниже плинтуса — гитом не пользовался, про докер вообще никогда не слышал. Фреймворки? Ну что вы, только хардкод. Я понял:
1. Мою кашу в голове надо упорядочить. Там была даже не каша, а дикое хрючево.
2. Если ты ловишь себя на мысли, что дико раздражаешься, когда тебя отвлекают от разработки на выполнение своих рабочих обязанностей — то ты делаешь что-то не то. Поэтому пошел учиться с целью сменить профессию и место жительства. Было страшно. Потому что внутри госкорпораций люди искренне считают, что снаружи жизни нет, и ты умрешь от голода. Я тоже так считал. Это чертова секта, достойная целой статьи. Спасибо супруге, что видела мои метания и поддержала.
Отвечая на вопрос прямо: я реально погрузился в машинное обучение, чуть меньше — в работу с данными. Все остальное скорее пощупал. Щупал я каждую тему долго, иногда очень, но не интенсивно — все-таки работать в профессиональной команде с технологией и писать сольные велосипеды в обеденный перерыв — совершенно разные вещи. Там еще assembler и visual basic .net были. Вот их да, палочкой потыкал. Покидало в стороны, так сказать.
К вышесказанному добавлю, что работа с данными (ETL) это вообще не то, что изучают на курсах DS.
На тех курсах сразу предупреждают, что DS fit-predict делает 10% времени, а 90% времени работает с данными. И большую часть учебного времени посвящали работе с сырыми данными и подготовке их для моделей. Хотя SQL было мало, и опять же нам честно сказали — SQL в отведенные часы не влез, учите сами, вот ссылки.
Но с утра до вечера джойнить простые таблички мне было бы скучно, Вы правы.
Всё дело в том, что у Вас не был написан опыт работы. А это красная тряпка для тех кто резюме просматривает. Второй момент, у Вас не самый популярный стек.
В резюме он был описан, но он нерелевантен. Когда HR видит соискателя на вакансию junior datascientist, а с резюме на тебя смотрит 30-летний мужик из деревни с последним местом работы — начальник отдела «госкорпорация Х», то резюме летит в утиль. Смотреть пет-проекты никто не будет. Но подавляющее большинство выпускников с онлайн-курсов имеют нерелевантный опыт работы, иначе они бы не пошли на онлайн-курсы.
Не популярный стек? Возможно. На курсах я учился обработке данных и машинному обучению на python, все остальное — несколько лет по книжкам for fun еще до курсов.
Но насколько я знаю, на более популярных направлениях типа фронтэнда ситуация точно такая же — конкуренция невероятно высокая, и будь ты семь пядей во лбу, ты можешь за два-три месяца не попасть ни на одно собеседование. Хотя если попадешь, то высокая вероятность получить оффер, потому что общий уровень при таком количестве все-таки низкий.
Вайтишник на связи, после 8-месячных онлайн курсов по DS. Позвольте пару уточнений с моей колокольни. Когда я искал работу в июле-сентябре, я отправил за 2 полных месяца 70 качественных откликов. Качественных — значит я прочитал описание вакансии, понял, что подхожу как минимум под половину требований, подогнал резюме под эту вакансию, направил отклик и сопроводительное. Вакансия свежая, не трехмесячной давности. Воронка: 40 резюме посмотрели (30 даже не открывали), 1 раз уточнили по опыту в сообщениях. 0 тестовых, 0 приглашений на поговорить.
Плохое резюме? Возможно. Но мое резюме смотрели многие, в том числе HR с тех курсов — их задачей было помочь в трудоустройстве. Оно много раз менялось и допиливалось, но результата это не меняло.
Возможно причина в том, что на некоторые джуновские вакансии приходится по 200 (не шутка, информация от тех же HR) откликов.
Слабые знания? Возможно, но знания никто не спрашивал, хотя я описывал свой бэкграунд. Высшее техническое образование, за 7 лет работы в госкорпорации своего предприятия хороший карьерный трек, пет-проекты с автоматизацией и аналитикой. Базы данных, с++, фулл-стэк проекты на node.js (кривые — да, я бы себе руки за них оторвал, но они работали, а я понял, как писать не надо), Python+ML, нейронки на голом pytorch. Серьезно заморачивался на Kaggle, хотя медалей пока нет. Я это вобщем-то подробно описывал в откликах.
Я такой не один, у нас весь поток с такими же проблемами. И после нас. И до нас. Да, первую работу находят. Но, как правило, это не очень хорошая работа. 40-60 т.р. зарплата в ДС. Ничего общего с тем, что написано в статье. Я не жалуюсь, я был готов к таким трудностям, т.к. в IT пошел не за легкой жизнью, просто сообщаю факт.
Поэтому, если честно, мне слабо верится в дефицит джунов.
Второе, я не верю в 120 т.р. джунские вакансии, на которые берут трактористов, заучивших термины. Я, пока искал работу после курсов, 2 месяца учился по 10 часов в день (уволился с работы). Сейчас я нашел хорошую работу дата-аналитиком, и пока не перевез семью в ДС, продолжаю учиться после работы до позднего вечера каждый день почти без выходных, получаю люлей на различных соревнованиях, разворачиваю реальный ML проект на предприятии на общественных началах в свободное от работы время. Но я не уверен, что выдержу конкуренцию с олимпиадниками и ШАДовцами, которые штурмуют эти вакансии.
Не все «вайтишники» пошли на онлайн-курсы за легким баблом. У меня был жесткий синдром самозванца — я со студенчества хотел писать код, но для этого нужно было уехать с моей мухосрани. Онлайн-курсы помогли мне пройти этот потенциальный барьер и начать делать то, с чего я кайфую. Если бы не они, то так бы и сидел до пенсии в провинции на работе, которую ненавижу.
Если бы я не знал, что такое p-value, я бы не понял из этой статьи ничего. Более того, даже понимая смысл p-value, мне было очень трудно следовать за скачущей аки горный козел мыслью автора.
Сам текст тоже очень трудно читается, много лишнего:
Наконец… Здесь мы говорим о р-значение!
Все предыдущие объяснения предназначены для того, чтобы подготовить почву и привести нас к этому P-значению. Нам нужен предыдущий контекст и шаги, чтобы понять это таинственное (на самом деле не столь таинственное) р-значение и то, как оно может привести к нашим решениям для проверки гипотезы.
Если вы зашли так далеко, продолжайте читать. Потому что этот раздел — самая захватывающая часть из всех!
То самое чувство, когда работаешь в полугосконторе на непоследней должности, совмещая с еще несколькими калымами и:
1. Получаешь ~8 баксов в час суммарно со всех работ. Все равно получаешь ты в 2-3 раза больше, чем все твои друзья и знакомые с других мест работы.
2. 200-220 часов в неделю — это нормальный режим работы. Оплачивают только 168.
3. На тебя постоянно кричат и делают идиотом. Раз в неделю минимум.
4. А другой работы в регионе нету (кроме той, на которой платят в разы меньше)
Но ты считаешь это нормальным порядком вещей и даже не задумываешься, что что-то не так. А потом читаешь статью и узнаешь, что это все очень плохо и вообще скандал.
Идея построения дерева для LM не нова. Вот, например, попытка из 2005: https://www.iro.umontreal.ca/~lisa/pointeurs/hierarchical-nnlm-aistats05.pdf
В этой же работе утверждается, что перфоманс сетей сильно зависит от способа построения дерева. В работах позднее сравниваются другие способы построения эмбеддингов LM между собой, в том числе с деревом. Выясняется, что дерево работает не лучше некоторых других более простых способов. Если интересна тема развития эмбеддингов, то вот хорошая отправная точка:
https://lilianweng.github.io/posts/2017-10-15-word-embedding/
Сейчас у меня в проде микросервис из десятка нейронок. CLOC посчитал 4290 строк на питоне и 600 на SQL.
У меня к автору два вопроса:
Почему Вы считаете, что корпорация, основной целью которой является заработок денег, "просто так" вкладывает деньги в Россию?
Почему Вы считаете, что уровень технологий, единожды достигнутый одной группой людей, не может быть достигнут другой группой?
В cs231 есть другое мнение на этот счет (п.6 Summary):
Take note of the hyperparameters that gave the best results. There is a question of whether you should use the full training set with the best hyperparameters, since the optimal hyperparameters might change if you were to fold the validation data into your training set (since the size of the data would be larger). In practice it is cleaner to not use the validation data in the final classifier and consider it to be burned on estimating the hyperparameters.
https://cs231n.github.io/classification/
Справедливости ради, этот совет относится к KNN. Я скорее к тому, что решение может быть не столь однозначным.
Дефицита не будет успокойтесь, есть схемы для обхода любых санкций. Самая простая - создаём контору в Китае, покупаем любое железо у условного Интела, продаём в Россию. Это ведёт к издержкам и увеличению цен процентов на 10, но исчезновения не будет. К тому же уверен, есть схемы гораздо изощреннее. Деньги всегда найдут дорогу.
У меня такая же история, как у автора. Проблема в том, что когда приходишь на госпредприятие после института, все это воспринимается "ок", потом привыкаешь. Если же ты живешь в провинции, где твое предприятие - топ по уровню зарплат (500-1000 баксов в месяц, да), то все рассказы из интернета про дефицит кадров, зп по 300к и увольнения каждые 1.5 года воспринимаются как сказки. Также, как Москва воспринимается сказочным городом, и все что там происходит - не правда.
А потом у тебя открываются глаза. Резко. Ты понимаешь, что ты был в секте, и тебе основательно промыли мозги. Ты смотришь на своего бывшего коллегу и говоришь ему "давай, у меня получилось и у тебя получится, греби из болота!", а ему не надо. Он не понимает, у него глаза не открылись, и может быть никогда не откроются. Так и проработает там 30 лет до пенсии, вечно виноватым рабом, которого начальник натурально кроет матом с визгами каждый день, для бодрящего настроения.
Грустно все это.
Если вы регулярно приходите на работу мокрый, заливаете водой свое рабочее место и всех окружающих вас коллег, а на просьбу "купи ты уже зонт" вы начинаете кричать "не хочу кормить производителей зонтов, дождя не существует!", затем покупаете муляж зонта из папье-маше в 5 раз дороже настоящего, то почему вы возмущаетесь, что вас хотят уволить?
Если я буду бессмертным, со способностью итеративно улучшать возможности своего тела и бесконечно совершенствоваться в своей профессии, то какое мне будет дело до поумневших тараканов? Они догонят меня только спустя сотни тысяч лет, если им повезет. И тоже начнут решать проблему бессмертия.
С точки зрения эволюции это всего-лишь смена фазы развития - с количества на качество.
С моей точки зрения умирание человека >> непоявление человека. Да и опыт отцовства тоже на любителя, если честно, не всем зайдет (я не Вика, btw). К тому же умирать только ради того, чтобы ребенок испытал "радость" родительства это... странно. Кринжово, я бы даже сказал.
Поэтому мой ответ нет - я не соглашусь умереть от старости/добровольно ради чьих-либо хотелок.
Ну вот есть у меня ребенок. Но я по прежнему совсем не хочу умирать. ЧЯДНТ?
Возможно, у человека дислексия. У моей супруги такая беда. Она в принципе не может писать правильно, в каждом слове по три ошибки. Бывает пишет просто не то слово. Вслух читает по слогам. Но при живом общении никогда не догадаешься об этом. Она закончила на инженера-строителя с отличием, немного поработала по специальности, но все же сменила профессию на дизайнера из-за хейта со стороны работодателей и коллег.
Кодер-дислексик, должно быть, очень упорный человек, потому что читать доки ему в 3 раза сложнее. Хотя, возможно, читает он нормально.
Возможно вы просто никогда не занимались работой, которая категорически вам не нравится.
Я по природе сильно выраженный интроверт, очень не люблю общаться с людьми, меня это безумно напрягает. У меня нет друзей, я не хочу звонить своим знакомым/родственникам, и всегда сливаю любые корпоративные мероприятия. Но судьба занесла меня на менеджерский карьерный трек, потому что там хорошо платят, а я считал что работа не должна нравиться, она должна приносить деньги. Я хорошо мимикрирую под социального человека, а неплохие аналитические способности и сильная эмпатия позволяют мне относительно неплохо управлять коллективом.
И вот я каждый раз приходил на работу, спрашивал себя "какого черта я здесь делаю?" и начинал активную социальную жизнь - совещания, планерки, руководство своей командой, отчеты, координация другой команды, весь день на телефоне. После работы я вымотанный приходил домой и не хотел разговаривать ни с женой, ни с ребенком. Часто срывался на них и кричал. Один раз ударил жену, которая устроила мне вечер с кино и вкусняшками, что практически привело к разводу. Меня натурально трясло перед выходом на работу после отпуска или даже выходных. А на корпоративах я должен был всегда быть и еще толкать речь, что добавляло стресса в бочку со стрессом.
Потом до меня дошло, что к черту эти деньги, меня так в 40 лет с работы вперед ногами вынесут. Я перешел джуном в DS, сократил общение с людьми до необходимого минимума. Вот уже год меня прет от моей работы, я счастлив на нее приходить и с нее уходить, весь год я ни разу ни на кого не кричал и вообще забыл что это такое.
Очень жаль, что у вас был такой опыт.
Я в 32, сравнивая себя с 20-летним, могу сказать, что сейчас я умнее, быстрее соображаю, и в целом принимаю намного более эффективные решения.
Ощущение, как будто раньше я смотрел на мир сквозь "мыло", как будто зрение -7. А с возрастом резкость выросла и я стал видеть вещи намного глубже и четче.
Fun fact: в ПК игры я сейчас играю объективно лучше, чем в студенчестве - на изи прохожу те места, которые раньше были серьезным препятствием. Хотя жаль что студентом я мог засесть и на 8 часов, сейчас хоть час бы найти после работы, самообразования и дел семейных.
А еще мое здоровье и самочувствие в 32 лучше, чем в 20, но это из-за некоторых особенностей здоровья и прикладываемых усилий по их компенсации.
Перефразируя известную фразу: Вы, конечно, можете нанимать только тех, у кого есть огонек в глазах, но когда нужен будет человек чтобы работать - зовите.
Со школы компьютер у меня использовался только для "поиграть". Брат в это время писал дипломную работу, как часть диплома у него была небольшая программа. Он пытался привить мне интерес к кодингу (я был примерно в 5 классе), я попробовал Basic, затем что-то сделать на Delphi, и как-то не затянуло. Выучился на инженера связи, пошел связистом на железную дорогу - в далеком сибирском городе другой работы кроме как у военных и железнодорожников просто нет.
Всегда был отличником и любил учиться, а тут было много моментов, когда на работе не надо было работать, а тупо присутствовать "на контроле". Чтобы мозги не превратились в кашицу, решил что-нибудь учить, да посложнее. Выбор пал на C++. Взял Прата и начал потихоньку идти, с самых азов, запуская и разбирая каждый пример, решая каждую задачу несколькими способами. Через год перевели на инженера, а там я увидел древние проблемы, которые могу решить. Тумблер щелкнул. Написал одну вещь. Понял границы применимости C++, пошел дальше. Visual Basic, бек и фронт на JS, базы данных. Написал просто самосвалы очень плохого кода (который неплохо работал и работает до сих пор, но поддерживать его было решительно невозможно), потому что учиться было не у кого. В это время двигался по карьерной лестнице до менеджерской позиции.
Спустя 7 лет после устройства на дорогу, пришлось делать выбор - связист/менеджер или программист. Тут я понял, чего действительно хочу. Осталось побороть безумно сильный синдром самозванца, но меня уже было не остановить. Закончил платный онлайн-курс, параллельно еще пяток бесплатных курсов, уволился с работы чтобы начать учиться фулл-тайм и параллельно искать работу в дефолт сити (в родном городе единственные IT-вакансии - это эникейщики с зарплатами уборщицы). Два месяца рассылал резюме, безуспешно пытаясь пробиться сквозь HR-фильтр, и наконец прошел первое же назначенное собеседование. Наскреб по сусекам денег, взял семью и перевез в ДС. Так я лишь в 30+ лет начал заниматься тем, от чего меня прет.
Оглядываясь назад, я поражаюсь, насколько сильной была мотивация, протащившая меня через огромное количество трудностей.
Я не знаю как можно реально погрузиться в каждый. Один С++ чего стоит. Но с него я вообще начал писать код. В 2013 году скачал книжку Прата, и попер по теории и всем упражнениям, ловя кайф от решения задач. Затем искал на работе что-нибудь, к чему можно применить свои знания. Решал какие-нибудь мелкие задачки (потому что крупных не было). Выйти в большой мир и прицепиться к опен-сорсу мешал дикий синдром самозванца. IT предприятий в городе тогда не было, да и в 2020 их нет. Боюсь, к 2050 их там тоже не появится.
А тяга писать код была. Вот и штудировал книжку за книжкой, делая игрушечные проекты (поскольку переводные книжки отстают от технологий на пятак лет в лучшем случае, то о пользе сами понимаете, но я этого тогда не знал). Потом стал начальником отдела, и увидел некоторые процессы, которые можно цифровизовать. Запустил от начала и до конца один проект. Смотрю — люди пользуются. Попросили сделать еще вот это. Запустил второй. Тоже пользуются. Однако качество моих проектов оставалось ниже плинтуса — гитом не пользовался, про докер вообще никогда не слышал. Фреймворки? Ну что вы, только хардкод. Я понял:
1. Мою кашу в голове надо упорядочить. Там была даже не каша, а дикое хрючево.
2. Если ты ловишь себя на мысли, что дико раздражаешься, когда тебя отвлекают от разработки на выполнение своих рабочих обязанностей — то ты делаешь что-то не то. Поэтому пошел учиться с целью сменить профессию и место жительства. Было страшно. Потому что внутри госкорпораций люди искренне считают, что снаружи жизни нет, и ты умрешь от голода. Я тоже так считал. Это чертова секта, достойная целой статьи. Спасибо супруге, что видела мои метания и поддержала.
Отвечая на вопрос прямо: я реально погрузился в машинное обучение, чуть меньше — в работу с данными. Все остальное скорее пощупал. Щупал я каждую тему долго, иногда очень, но не интенсивно — все-таки работать в профессиональной команде с технологией и писать сольные велосипеды в обеденный перерыв — совершенно разные вещи. Там еще assembler и visual basic .net были. Вот их да, палочкой потыкал. Покидало в стороны, так сказать.
На тех курсах сразу предупреждают, что DS fit-predict делает 10% времени, а 90% времени работает с данными. И большую часть учебного времени посвящали работе с сырыми данными и подготовке их для моделей. Хотя SQL было мало, и опять же нам честно сказали — SQL в отведенные часы не влез, учите сами, вот ссылки.
Но с утра до вечера джойнить простые таблички мне было бы скучно, Вы правы.
DepthRel
В резюме он был описан, но он нерелевантен. Когда HR видит соискателя на вакансию junior datascientist, а с резюме на тебя смотрит 30-летний мужик из деревни с последним местом работы — начальник отдела «госкорпорация Х», то резюме летит в утиль. Смотреть пет-проекты никто не будет. Но подавляющее большинство выпускников с онлайн-курсов имеют нерелевантный опыт работы, иначе они бы не пошли на онлайн-курсы.
Не популярный стек? Возможно. На курсах я учился обработке данных и машинному обучению на python, все остальное — несколько лет по книжкам for fun еще до курсов.
Но насколько я знаю, на более популярных направлениях типа фронтэнда ситуация точно такая же — конкуренция невероятно высокая, и будь ты семь пядей во лбу, ты можешь за два-три месяца не попасть ни на одно собеседование. Хотя если попадешь, то высокая вероятность получить оффер, потому что общий уровень при таком количестве все-таки низкий.
Плохое резюме? Возможно. Но мое резюме смотрели многие, в том числе HR с тех курсов — их задачей было помочь в трудоустройстве. Оно много раз менялось и допиливалось, но результата это не меняло.
Возможно причина в том, что на некоторые джуновские вакансии приходится по 200 (не шутка, информация от тех же HR) откликов.
Слабые знания? Возможно, но знания никто не спрашивал, хотя я описывал свой бэкграунд. Высшее техническое образование, за 7 лет работы в госкорпорации своего предприятия хороший карьерный трек, пет-проекты с автоматизацией и аналитикой. Базы данных, с++, фулл-стэк проекты на node.js (кривые — да, я бы себе руки за них оторвал, но они работали, а я понял, как писать не надо), Python+ML, нейронки на голом pytorch. Серьезно заморачивался на Kaggle, хотя медалей пока нет. Я это вобщем-то подробно описывал в откликах.
Я такой не один, у нас весь поток с такими же проблемами. И после нас. И до нас. Да, первую работу находят. Но, как правило, это не очень хорошая работа. 40-60 т.р. зарплата в ДС. Ничего общего с тем, что написано в статье. Я не жалуюсь, я был готов к таким трудностям, т.к. в IT пошел не за легкой жизнью, просто сообщаю факт.
Поэтому, если честно, мне слабо верится в дефицит джунов.
Второе, я не верю в 120 т.р. джунские вакансии, на которые берут трактористов, заучивших термины. Я, пока искал работу после курсов, 2 месяца учился по 10 часов в день (уволился с работы). Сейчас я нашел хорошую работу дата-аналитиком, и пока не перевез семью в ДС, продолжаю учиться после работы до позднего вечера каждый день почти без выходных, получаю люлей на различных соревнованиях, разворачиваю реальный ML проект на предприятии на общественных началах в свободное от работы время. Но я не уверен, что выдержу конкуренцию с олимпиадниками и ШАДовцами, которые штурмуют эти вакансии.
Не все «вайтишники» пошли на онлайн-курсы за легким баблом. У меня был жесткий синдром самозванца — я со студенчества хотел писать код, но для этого нужно было уехать с моей мухосрани. Онлайн-курсы помогли мне пройти этот потенциальный барьер и начать делать то, с чего я кайфую. Если бы не они, то так бы и сидел до пенсии в провинции на работе, которую ненавижу.
Сам текст тоже очень трудно читается, много лишнего:
1. Получаешь ~8 баксов в час суммарно со всех работ. Все равно получаешь ты в 2-3 раза больше, чем все твои друзья и знакомые с других мест работы.
2. 200-220 часов в неделю — это нормальный режим работы. Оплачивают только 168.
3. На тебя постоянно кричат и делают идиотом. Раз в неделю минимум.
4. А другой работы в регионе нету (кроме той, на которой платят в разы меньше)
Но ты считаешь это нормальным порядком вещей и даже не задумываешься, что что-то не так. А потом читаешь статью и узнаешь, что это все очень плохо и вообще скандал.
Похоже где-то я свернул не туда…