Обновить

Компания Skillfactory временно не ведёт блог на Хабре

Сначала показывать

7 способов, как Data Scientists пытаются вас обмануть

Время на прочтение6 мин
Охват и читатели4.3K
image

Иногда, люди продающие вам “искусственный интеллект” или “машинное обучение” могут вводить вас в заблуждение. В этой статье я поделюсь 7 простыми принципами, которые позволят избежать этого.

Неважно кем вы являетесь: руководителем фирмы, крупным предпринимателем, бизнес-ангелом, средним звеном в компании, судьей на хакатоне или человеком, кто хоть как-то связан с “техникой”. Рано или поздно кто-то обязательно попытается “продать” вам “ПО для машинного обучения”, “продукт с использованием ИИ” или еще какую-нибудь смесь из модных словечек. Когда вы оказываетесь в такой ситуации, может показаться, что у вас недостаточно знаний и опыта для принятия правильного решения. Не теряйте голову! Ниже приведены 7 критериев, которые позволят отличить стоящий продукт от пустышки. Они помогут вам не обращать внимание на лапшу, которую вам будут вешать на уши, и понять истинную ценность продукта.
Читать дальше →

Новые фичи в Python 3.9

Время на прочтение4 мин
Охват и читатели33K
Обзор лучших функций, включенных в последнюю итерацию Python.

image

Пришло время, выход новой версии Python неизбежен. Сейчас она в бета-версии (3.9.0b3), но скоро мы увидим полную версию Python 3.9.

Некоторые из новейших функций невероятно интересные, и будет восхитительно видеть их использование после релиза. Мы рассмотрим следующее:

  • Операторы объединения словарей
  • Тайп хинтинг
  • Два новых строковых метода
  • Новый Python Parser — это очень круто

Давайте сначала рассмотрим новые функции и то, как мы их будем использовать.

Объединение словарей


Одна из новых и уже моих любимых фич с синтаксисом. Если у нас есть два словаря a и b, которые нам нужно объединить, мы теперь используем операторы объединения.

У нас есть оператор слияния “|”:

a = {1: 'a', 2: 'b', 3: 'c'}
b = {4: 'd', 5: 'e'}
c = a | b
print(c)

[Out]: {1: 'a', 2: 'b', 3: 'c', 4: 'd', 5: 'e'}

И оператор обновления “|=”, который обновляет исходный словарь:

a = {1: 'a', 2: 'b', 3: 'c'}
b = {4: 'd', 5: 'e'}
a |= b
print(a)

[Out]: {1: 'a', 2: 'b', 3: 'c', 4: 'd', 5: 'e'}

Если наши словари имеют общий ключ, будет использована пара ключ-значение из второго словаря:

a = {1: 'a', 2: 'b', 3: 'c', 6: 'in both'}
b = {4: 'd', 5: 'e', 6: 'but different'}
print(a | b)

[Out]: {1: 'a', 2: 'b', 3: 'c', 6: 'but different', 4: 'd', 5: 'e'}
Читать дальше →

В чем разница между Data Analytics и статистикой

Время на прочтение5 мин
Охват и читатели7.9K
Разбираемся в ценности двух совершенно разных профессий.

image

Статистика и аналитика это два раздела дата сайнс, у которых было много предшественников. Люди до сих пор спорят о том, где проходит граница между ними. На практике современные программы обучения, которые содержат в названиях эти термины, разбирают совершенно разные задачи. Аналитики специализируются на изучении ваших данных, а статистики уделяют больше внимания выводам, которые можно сделать на основе этих данных.

Disclaimer: Эта статья о типичных выпускниках учебных программ, в которых преподают только статистику или только аналитику. Я не хочу задеть тех, кто каким-то образом смог освоить и то и другое. На самом деле лучшие датасаентисты должны иметь отличные знания и в статистике, и в аналитике (и в машинном обучении само собой). Вы удивитесь, но такие специалисты встречаются, правда очень редко.

Человеческие поисковые системы


Когда вы располагаете всеми фактами касательно вашей деятельности, единственная квалификация, которая вам нужна, это здравый смысл. Он позволяет вам задавать вопросы о данных и отвечать на них. Просто поищите ответ.

Хотите прямо сейчас увидеть базовую аналитику в действии? Попробуйте загуглить прогноз погоды. Каждый раз, когда вы пользуетесь поисковой системой, вы занимаетесь базовой аналитикой. Вы получаете данные о погоде и смотрите на них.
Читать дальше →

Джоел Спольски: роль геймификации в успехе Stack Overflow

Время на прочтение5 мин
Охват и читатели2.3K
В 2010 году успех Stack Overflow привел к тому, что в нас захотели вкладываться венчурные капиталисты. 



Фирма, которая в итоге стала нашим спонсором, называлась Union Square Ventures. Ее владельцы признались, что их настолько привлекал концепт геймификации, что они вкладывались только в те компании, которые инкорпорируют в свой продукт элемент геймплея. 

Например, Foursquare. Помните такую сеть? Она позволяла превратить поход в дешевую кафешку или бар в увлекательную игру, которая попутно генерировала данные для маркетологов. Или Duolingo — забавное приложение с карточками для изучения иностранных языков. В то время USV вкладывались в подобные компании.

Вот тогда я осознал, что у Stack Overflow тоже есть элемент геймификации. Не такой очевидный, конечно, лишь малая толика, связанная с репутацией. 

Элемент репутаций на Stack Overflow началась с системы оценок. Первоначальная идея заключалась в том, что участники получают 10 баллов, когда их ответы лайкают. Такая система апвоутов выполняет сразу две функции: самые полезные ответы выходят в топ, давая другим участникам форума понять, что этот совет оказался полезным; также она показывает человеку, написавшему этот ответ, что его труды не прошли напрасно. А это мотивирует еще как.
Читать дальше →

Крутые Data Scientist не тратят время на статистику

Время на прочтение3 мин
Охват и читатели7.1K
image

Недавно я узнала, что один мой хороший друг получил докторскую степень по статистике, при этом он даже никогда не думал над вопросом: а какой собственно прок от статистики? О боже. Если не знаешь — для чего, тогда и не знаешь — нужно ли оно тебе. И раз профессорам это не очевидно, посмотрим, что смогу сделать я.

Статистика — это наука о том, как принимать решения в условиях неопределенности. Как вы можете думать? Следовать стандартным действиям или идти по пути априорных убеждений. Но что делать, если ваш разум не определился? Что если у вас еще не сложилось на этот счет никакого мнения?

Просто руководствуйтесь своими предположениями (это такой причудливый способ сказать, что “лучшая догадка строится на ваших знаниях”). Как это сделать? Посмотрите на данные, и скажите, что там. Это называется аналитикой (или data-mining), а если вам когда-нибудь доводилось пользоваться электронными таблицами, то вы наверняка уже ответили на вопрос. Дело в том, что ваше чутье поможет сделать правильную оценку и, соответственно, выбор. Поэтому всякая необходимость в сложных математических расчетах попросту отпадает.

«Но я ведь могу и ошибаться!» Конечно, ошибка не исключена, это и значит — попасть в неопределенность. В мире нет такой математики, благодаря которой можно было бы прийти к уверенному ответу. Ваша лучшая догадка может оказаться ошибочной, но тем не менее, раз это ваше лучшее предположение, на фоне него все остальные неправильны и даже скорее ошибочны.

Так что, сколько бы данных у вас не было, просто следуйте своей интуиции.

«Подождите, но мне нужно знать, достаточно ли у меня данных?» — Правда? А достаточно для чего?
Читать дальше →

Как стать Data Scientist без онлайн-курсов

Время на прочтение4 мин
Охват и читатели26K
image

Это всего лишь мое мнение. Если у вас есть контраргументы, пожалуйста, напишите их в комментариях.

Хотите стать data scientists?

Я познакомился с более 50-ю data scientists и с еще парочкой поработал лично.

Здесь я расскажу, как эти люди пришли в Data Science. Без онлайн-курсов.

1. Решите задачу с помощью машинного обучения


Выберите реальную проблему, и решите ее с помощью машинного обучения.

Сделать это нелегко, так как нет готового плана действий. Но вне зависимости, преуспеете вы в этом деле или нет, благодаря полученному опыту и истории, впоследствии вы сможете продать себя гораздо дороже.

Вот примеры задач, которые вы можете попробовать разрешить:

  • Распознавание фейковых новостей
  • Прогнозирование стоимости жилья в вашем районе
  • Подбор домашних питомцев в зависимости от образа жизни потенциальных хозяев

Если ваш решатель заработает (или даже почти сработает), создайте пользовательский интерфейс, которым можно будет пользоваться, и опубликуйте его на Hacker News или Product Hunt.

Добавьте строку с названием «Data Scientist» в резюме. Если получилось решить проблему машинного обучения, никому и дела не будет, что это было всего лишь шоу одного актера.

Теперь вам есть, что рассказать на собеседовании, и такая история будет иметь гораздо больший вес, нежели сертификат об окончании онлайн курсов.
Читать дальше →

Шпаргалка по сортировке для Data Science

Время на прочтение11 мин
Охват и читатели31K
image

Сортировка данных является основной задачей для ученых и инженеров по обработке данных. Пользователи Python могут выбирать наиболее удобную из ряда библиотек со встроенными, оптимизированными опциями сортировки. Некоторые даже работают параллельно с GPU. На удивление, некоторые методы сортировки не используют указанные типы алгоритмов, а другие работают совсем не так, как ожидалось.

Выбор библиотеки и типа алгоритма сортировки не всегда прост, а нововведения меняются в быстром темпе. На данный момент документация Pandas не соответствует коду (хотя лично мое PR-обновление сортировочных опций было самым последним).

В этой статье я разъясню вам, что к чему, дам пару советов, которые помогут с разобраться с методами, и поделюсь результатами теста скорости.

UPD 17 июля 2019: В результаты оценки теста скорости теперь входят реализации GPU PyTorch и TensorFlow. TensorFlow также включает в себя результаты CPU как при tensorflow==2.0.0-beta1, так и при tensorflow-gpu==2.0.0-beta1. Интересные наблюдения: графический процессор PyTorch буквально летает, а GPU TensorFlow оказался медленнее CPU TensorFlow.

Контекст


Базовых алгоритмов сортировки существует множество. Одни из них имеют высокую производительность и занимают меньше места, другие хорошо работают с большим числом данных. Для некоторых алгоритмов важно взаимное расположение элементов данных. На диаграмме в начале статьи можно увидеть ситуацию по времени и объему для самых распространенных алгоритмов.
Читать дальше →

Джоэл Спольски: как началась эпоха Stack Overflow

Время на прочтение6 мин
Охват и читатели4.1K
image

(эссе 2018 года)

Всем привет! Много чего произошло с тех пор, как я, 18 лет назад, писал посты в блоге об эргономичных стульях Aeron. Некоторые из тех записей настолько старые, что уже сами могут идти получать первое высшее.

О, и еще: скоро Stack Overflow исполняется 10 лет! Вау! Поэтому я решил, что в честь такого события неплохо было бы собрать нашу старую команду и повспоминать что да как было. Хочу рассказать вам обо всем, что происходило, но больше всего хочу по полочкам разложить историю развития Stack Overflow. Оглядываясь назад, гораздо проще сказать, что мы сделали правильно, а где конкретно накосячили. Поэтому я попытаюсь осветить все хорошее и не очень в серии постов.

И еще: через несколько недель мы запустим Stack Overflow Teams, самое большое обновление за историю существования нашей системы, и оно будет очень крутое. Расскажу поподробнее в следующем посте!

Сегодня будет часть первая. Хочу немного рассказать о том, чем занимались разработчики сайта до появления Stack Overflow, зачем вообще он создавался, какими были ранние версии.

Когда интернет только зарождался, существовала система Usenet, которая позволяла создавать примитивные дискуссионные форумы. Когда у программистов возникали проблемы с кодом, они могли задать вопрос на форуме Usenet (так-то они назывались новостными группами, а не форумами (хотя к новостям не имели никакого отношения — на Usenet их просто не было)).
Как только появилась всемирная паутина, с технической точки зрения Usenet моментально ушел в отставку. Мы, программисты, сразу же переключились на тысячи и тысячи веб-форумов, где и стали задавать свои вопросы.
Читать дальше →

Сэм Альтман: генерация идей

Время на прочтение3 мин
Охват и читатели2.2K
image


Самый распространенный вопрос, который задают потенциальные основатели стартапов, — как придумать идеи для стартапов. Второй наиболее распространенный вопрос — есть ли у вас какие-то идеи для их запуска.

Но дать основателям идею почти всегда не получается. Наличие идей является одним из самых важных качеств для основателя стартапа — вам нужно будет генерировать много новых идей в процессе запуска стартапа.

Y Combinator однажды попробовал провести эксперимент по финансированию, казалось бы, хороших основателей без каких-либо идей. Я думаю, что каждая компания в этом исследовании без идей потерпела неудачу. Оказывается, что у хороших основателей есть много идей для всего, поэтому, если вы хотите быть основателем и не можете придумать идею для компании, вам, вероятно, следует сначала поработать над тем, чтобы стать хорошим генератором идей.

Как это сделать?
Читать дальше →

Data Science для гуманитариев: что такое «data»

Время на прочтение7 мин
Охват и читатели16K

Размышления об информации, памяти, аналитике и распределениях


Все, что воспринимают наши чувства, — это данные, хотя их хранение в наших черепушках оставляет желать лучшего. Записать это немного надежнее, особенно когда мы записываем это на компьютере. Когда эти записи хорошо организованы, мы называем их данными… хотя я видел, как некоторые ужасно организованные электронные каракули получают то же имя. Я не уверен, почему некоторые люди произносят слово data так, как будто оно имеет заглавную букву D.

Почему мы произносим data с большой буквы?

Нам нужно научиться быть непочтительно прагматичными в отношении данных, поэтому эта статья поможет новичкам заглянуть за кулисы и помочь практикующим объяснить основы новичкам, у которых проявляются симптомы поклонения данным.

Смысл и смыслы


Если вы начнете свое путешествие с покупки наборов данных в Интернете, вы рискуете забыть, откуда они берутся. Я начну с нуля, чтобы показать вам, что вы можете делать данные в любое время и в любом месте.

Вот несколько постоянных обитателей моей кладовой, расставленных на полу.

image

Эта фотография представляет собой данные — она хранится как информация, которую ваше устройство использует для отображения красивых цветов.

Давайте разберемся в том, на что мы смотрим. У нас есть бесконечные варианты того, на что обращать внимание и помнить. Вот что я вижу, когда смотрю на продукты.

image

Если вы закрываете глаза, вы помните каждую деталь того, что вы только что видели? Нет? И я нет. Вот почему мы собираем данные. Если бы мы могли помнить и обрабатывать это безупречно в наших головах, в этом не было бы необходимости. Интернет мог быть одним отшельником в пещере, рассказывая обо всех твитах человечества и прекрасно передавая каждую из наших миллиардов фотографий кошек.
Читать дальше →

Data Scienсe на стероидах: знакомство с Decision Intelligence

Время на прочтение13 мин
Охват и читатели6.7K
Что общего между защитным поведением при встрече со львами в саванне, ответственным подходом к управлению ИИ и проблемами проектирования хранилищ данных.

image

Decision intelligence — новая научная дисциплина, рассматривающая все аспекты теории принятия решения. Она объединяет лучшее из прикладного направления data science, социальных наук и науки управления в единую область, призванную помочь людям повысить качество жизни, усовершенствовать бизнес и улучшить окружающий мир, используя данные. Это важнейшая наука эры искусственного интеллекта, включающая в себя навыки грамотного управления проектами, стратегического планирования целей, определение оптимальной метрики и систем безопасности для широкомасштабной автоматизации.

Decision intelligence — дисциплина, позволяющая превратить информацию в лучшее практическое действие любого масштаба.

Давайте немного разберемся с основной терминологией и концепциями. Следующие абзацы можно просмотреть бегло (или совсем пропустить, если информация покажется вам чересчур занудной).

Что значит «decision» (решение)


Данные прекрасны, но важны именно решения. Именно наши решения — наши действия — влияют на мир, окружающий нас.

Под «decision» мы понимаем любой выбор между вариантами любого субъекта, так что разговор куда обширнее, нежели типичная дилемма в духе MBA (вроде: открывать филиал своего бизнеса в Лондоне или пока не стоит).
Читать дальше →

Гамак дривен девелопмент: «Сон — это важная часть работы программиста»

Время на прочтение20 мин
Охват и читатели8.3K
Рич Хикки — создатель языка программирования Clojure, независимый разработчик ПО и консультант с 20-летним опытом работы в различных областях разработки ПО. Примерно 2,5 года в одиночку работал над Clojure, прежде чем кому-либо его показать.

image

Предлагаю вашему вниманию расшифровку доклада 2010 года «Hammock Driven Development»

Это просто доклад, основанный на опыте. Не научный доклад, не будет какой-то методологии, науки или чего-то ещё.

Когда был последний раз, когда вы всерьёз думали о чем-то целый час? Чтобы вас никто не беспокоил и вы могли сосредоточиться. Или целый день? Помните ли вы день, когда вы могли целый день над чем-то думать? Или месяц? Почти всё время думая над чем-то? Или год?

Это чрезвычайно ценные моменты, если они у вас вообще есть. Я считаю, что мне очень повезло, я мог думать о трех разных вещах в течение года или более. Одной из них был Clojure. И нет ничего, что я ценю больше, чем такое время.

Еще одна вещь, которую я хотел бы спросить: «Когда вы в последний раз чувствовали себя уверенно, пытаясь сделать то, чего никогда раньше не делали?» И как вы думаете, что нужно, чтобы стать уверенным в том, чего вы никогда не делали раньше?

Очевидно, что, как разработчики программного обеспечения мы часто делаем еще одно приложение, которое извлекает что-то из базы данных и размещает в Интернете, но чем вы удачливее, тем больше вероятность того, что вы столкнётесь с проблемами которых никогда раньше не решали. И как вы начнёте их решать? Не чувствуя себя в большой опасности?

Поэтому я начну с того, что расскажу о некоторых вещах в области разработки софта, о которых мы все знаем, что это правда.

Джоел Спольски: «Не юзабилити единым»

Время на прочтение10 мин
Охват и читатели5.1K
Эссе 2004 года

В течение многих лет работающие над своим имиджем умники, такие, как… ну, я, например, бесконечно болтали о юзабилити и о том, как важно сделать программное обеспечение удобным для использования. У Якоба Нильсена есть математическая формула, которую он откроет вам всего за 122 доллара: с помощью неё вы сможете рассчитать значение юзабилити. (Если ожидаемое значение юзабилити больше 122 долларов, думаю, вы получите прибыль.)

У меня есть книга, которую вы можете купить гораздо дешевле. В ней рассказывается о некоторых принципах разработки удобного программного обеспечения, но о математике там нет ни слова, и цена может показаться вам сомнительной.

В этой книге на странице 31 я показал пример того, что в то время было самой популярной программой на Земле — Napster. На главном окне Napster находились кнопки для переключения между пятью экранами. В соответствии с принципом юзабилити, который называется «affordance», вместо кнопок у него на самом деле должны были быть вкладки, что я и хотел продемонстрировать этим примером.

image

И все же Napster был самой популярной программой на Земле.
Читать дальше →

65 бесплатных курсов по Machine Learning от ведущих университетов мира

Время на прочтение3 мин
Охват и читатели35K
image

Картинка отсюда.

Читать дальше →

Ближайшие события

109 бесплатных курсов по Data Science

Время на прочтение5 мин
Охват и читатели14K
image

Информационные технологии позволяют получить невероятно крутые образовательные ресурсы в один клик. Бесплатно.

Я сейчас решаю задачу, как из огромной массы жизненно важного контента выбрать тот, который стоит попробовать в первую очередь, как «разметить данные», чтобы нейросеточка у подрастающего поколения обучилась более эффективно. (ontol.org, «Выгорание», «Удаленка», телеграмм-канал).

Предлагаю вам подборку бесплатных онлайн-курсов по Data Science от лучших университетов в мире:

Читать дальше →

24 датасета для ритейла и ecommerce

Время на прочтение4 мин
Охват и читатели26K
image

Продуктовые датасеты


  • Fashion-MNIST: Идеально подходит для продуктовой категоризации. MNIST содержит почти 60 000 обучающих изображений и 10 000 тестовых изображений продуктов фэшн-индустрии в 10 классах.
  • Innerwear Data from Victoria’s Secret and Others: Данные с 600 000+ товаров нижнего белья, извлеченного из популярных торговых объектов. Включает в себя описание продукта, цену, категорию, рейтинг и многое другое.
  • Electronic Products and Pricing Data: Содержит список из более чем 7000 электронных продуктов.
  • Men’s Shoe Prices: Список содержащий 10 000 мужских ботинок и цен.
  • Women’s Shoe Prices: Список содержащий 10 000 женских туфель и цены.
  • eCommerce Item Data: Подходит для рекомендательных систем. Этот набор данных содержит артикулы и связанные с ними описания продуктов из каталога продукции бренда наружной одежды.
  • Fashion Products on Amazon.com: Это pre-crawled набор данных, созданный путем извлечения данных из Amazon. Он состоит примерно из 22 000 фэшн-товаров на Amazon.
  • E-commerce Tagging for Clothing: Содержит изображения с сайтов ecommerce с ограничивающими рамками, нарисованными вокруг рубашек, пиджаков, солнцезащитных очков и т. д. Он содержит 907 наименований, из которых 504 наименования были помечены вручную.

Читать дальше →

Не надо учить Machine Learning

Время на прочтение4 мин
Охват и читатели20K

Учитесь создавать софт, используя модели машинного обучения


image

Дисклеймер: статья основана исключительно на моих наблюдениях за командами разработчиков в области машинного обучения и не является результатом научного обзора отрасли. Для справки, я помогаю разрабатывать Cortex — платформу с открытым исходным кодом для запуска моделей в производство.

Если вы разработчик, то, мимолетный интерес к машинному обучению у вас как минимум есть. Концепция алгоритма, которые учатся, чтобы потом делать прогнозы, это ведь просто… круто.

Однако, если вы решили начать изучать ML следуя всем канонам, то велика вероятность, что после двух недель линейной алгебры и многомерного анализа, вы бросите это занятие.

Причина кроется в том, что большинство вводных материалов по ML ориентированы не на разработчиков, а на исследователей — что и является проблемой для разработчиков, которые просто хотят создавать продукты с машинным обучением.

Вы хотите создавать продукты или проводить исследования?


До конца 2000-х годов машинное обучение было практически только исследовательской проблемой. Просто было не так много компаний, которые бы реально использовали машинное обучение в производстве.

Джоел Спольски: Как правильно задавать вопросы более опытным программистам

Время на прочтение5 мин
Охват и читатели8K

Чудаковатые и ломающие мозг правила Usenet, Burning Man и Stack Overflow


image


Джоел Спольски, апрель 2018

Ходит среди разработчиков популярная байка, что если у тебя не работает код, то надо взять резиновую уточку и рассказать ей — да-да, утке — как этот код должен был работать: объяснить каждую строку, что должно было произойти, что вылезло в итоге и т.п. Разработчики, которые опробовали этот лайфхак на себе, утверждают, что в процессе детального проговаривания проблемы неживому объекту часто получается найти и ее решение.

Это одна из хитростей, которая может помочь самостоятельно разрешить проблему в процессе программирования. Еще один способ — освоить отладку программы (дебаггинг) по принципу “разделяй и властвуй”. Невозможно перерыть тысячу строк кода ради одной ошибки. Зато можно разделить код на две части и посмотреть, что происходит в первой половине, а что происходит во второй. Сделай это пять-шесть раз и дойдешь до той самой строки с ошибкой.

С учетом вышесказанного любопытно почитать чек-лист Джона Скита для написания идеального вопроса. Джон спрашивает: “Прочитали ли вы внимательно вопрос, чтобы оценить его внятность и понятность для человека, который в глаза не видел ту информацию, которой вы обладаете?”. По большому счету, это и есть тест с резиновой уточкой. Другой вариант: “Если в вопрос включен код, вписали ли вы его в полную, но короткую программу?”. Акцент на короткой программе — это, по сути, проверка того, пытались Вы “разделить и властвовать” или нет.

Чек-лист Джона, грубо говоря, предлагает людям сначала попробовать сделать то, что уже пробовали опытные программисты, а потом уже обращаться за помощью к другим.

К сожалению, не каждый слышал об этом чек-листе. А может и слышал, но предпочел проигнорировать. У человека проблема с кодом, он знает, что существует система вопросов и ответов Stack Overflow, которая может ему помочь, и времени читать протокол какого-то ботана о том, как надо задавать вопросы, у него нет.
Читать дальше →

Как я (PhD нейробиологии) стала Data Scientist за 6 месяцев

Время на прочтение7 мин
Охват и читатели8.7K
Четыре инструмента, которые я использовала в обучении, не потратив ни цента.

image Я только что сбежала от восьми лет учебы и упорной работы не имея никакого плана. Возможно вам интересно, почему люди идут на такие поступки. Дело в том, что на протяжении долгого времени мой босс отбивал мое желание работать, и я понимала, что пора что-то менять.

Мой молодой человек предложил мне стать data scientist. Моей реакцией, конечно, было «Ты сошел с ума!», ведь я совсем ничего не знала о программировании. Без сомнений он переоценивал мои способности. Вот и синдром самозванца снова напоминает о себе.

Примерно через две недели моя подруга Анна предложила то же самое. Немного поразмыслив, я всерьез начала обдумывать эту идею. А почему бы и нет? Так я решила вновь стать новичком и начать новую жизнь в роли data scientist.

Я хотела учиться в своем темпе, поэтому решила пройти онлайн курсы. Я полагала, что с PhD в нейробиологии я уже получила достаточно формального обучения для работы в data science. Мне просто нужны были практические знания.

Я расскажу о четырех разных курсах, которые я прошла, и о том, как они привели меня к работе с data science в стартапе по здравоохранению в Кремниевой долине.

В то время большинство найденных мной онлайн курсов были бесплатными. Поэтому я бросила себе вызов – получить все необходимые навыки не потратив ни копейки. Что тут скажешь, я – настоящая скряга.
Читать дальше →

Результат опроса разработчиков на Stack Overflow 2020 (+ хабраопрос)

Время на прочтение2 мин
Охват и читатели16K
image

Взаимосвязь технологий. Полная версия результатов опроса тут.

Краткие выводы


  • 65 000 разработчиков было опрошено.
  • Python спустился с 2 на 3 место среди самых любимых технологий, будучи побитый TypeScript. Rust на первом месте пять лет подряд.
  • Инженеры по надежности сайта и специалисты DevOps остаются среди самых высокооплачиваемых. 80% респондентов считают, что DevOps важен, а 44% работают в организациях с хотя бы одним выделенным сотрудником DevOps.
  • 52% респондентов думают «Привет, старина», когда ищут в сети решение для кодирования, и обнаруживают, что первая ссылка на результат фиолетового цвета, потому что они уже посетили эту ссылку.
  • 90% респондентов ответили, что посещают Stack Overflow, когда сталкиваются с трудностями и застревают в написании кода.
  • 0,3% респондентов никогда не посещали Stack Overflow до начала этого опроса.
  • Респонденты из Австралии сообщили о самом высоком среднем уровне опыта написания кода (16,9 лет), за ними следуют разработчики из Великобритании и США.
  • Респонденты из Соединенных Штатов и Соединенного Королевства показывают самый высокий средний возраст — 33,7 и 33,1 года соответственно.
  • Более 40% респондентов сообщили, что они являются членами других сообществ онлайн-разработчиков, помимо Stack Overflow.
  • Более 75% разработчиков работают сверхурочно, по крайней мере, время от времени — один-два дня в квартал. 25% работают сверхурочно 1-2 дня в неделю и более.

Некоторые любопытные результаты опросов.
Читать дальше →