Pull to refresh
-1
0
Глеб @snackTate

User

Send message

Факторный анализ

Level of difficultyMedium
Reading time8 min
Views36K


Автор статьи: Артем Михайлов

Факторный анализ является мощным инструментом для изучения сложных данных, который позволяет выявить основную структуру информации и выделить важные факторы. Этот метод дает возможность более глубоко изучить взаимосвязи между переменными и понять, как они влияют на конечный результат. Если вы ищете эффективный способ определить, какие факторы играют решающую роль в вашей исследовательской задаче, то факторный анализ будет удачным выбором. В данной статье мы более подробно рассмотрим, что такое факторный анализ, какие задачи он может решить и как он применяется на практике. Если вы хотите усовершенствовать свой аналитический подход и достичь лучших результатов в своей работе, тогда приятного прочтения!
Читать дальше →
Total votes 13: ↑10 and ↓3+9
Comments5

Делаем проект по машинному обучению на Python. Часть 1

Reading time13 min
Views91K


Перевод A Complete Machine Learning Project Walk-Through in Python: Part One.

Когда читаешь книгу или слушаешь учебный курс про анализ данных, нередко возникает чувство, что перед тобой какие-то отдельные части картины, которые никак не складываются воедино. Вас может пугать перспектива сделать следующий шаг и целиком решить какую-то задачу с помощью машинного обучения, но с помощью этой серии статей вы обретёте уверенность в способности решить любую задачу в сфере data science.

Чтобы у вас в голове наконец сложилась цельная картина, мы предлагаем разобрать от начала до конца проект применения машинного обучения с использованием реальных данных.
Читать дальше →
Total votes 24: ↑21 and ↓3+18
Comments4

«То, чего на белом свете вообще не может быть…»

Reading time6 min
Views41K
Дорогие друзья, я рад представить вам еще одну статью из серии своих путешествий по миру удивительного. Мы начали с разговора о числах-гигантах, где я попытался поделиться с вами своим восхищением от того, какие невероятные по своей величине числа окружают нас во Вселенной и как близко мы можем подойти по ним к самой бесконечности. Вторая статья рассказывала о микроскопически малых объектах, находящихся далеко за пределами видимости не только невооруженного глаза, но и самого сильного микроскопа. Сейчас я предлагаю вам отправиться в третье путешествие — путешествие в мир вероятностей. Мы рассмотрим примеры невероятных, но, тем не менее, математически возможных событий. Нам снова придется работать с числами, так что я заранее прошу прощения у гуманитариев (если, конечно, таковые есть на данном ресурсе). В общем, если вы, так же как и я, любите забивать голову бесполезными фактами, то добро пожаловать.

image
Читать дальше →
Total votes 61: ↑56 and ↓5+51
Comments106

Теорема Байеса для чайников

Level of difficultyEasy
Reading time5 min
Views74K

Теорема (формула) Байеса позволяет выяснить вероятность события при условии, что произошло связанное с ним другое событие.

Теорема позволяет рассчитать вероятность события, если причину и следствие поменять местами. Например, мы знаем распространенность симптома среди больных и здоровых. Значит, мы можем вычислить вероятность заболевания от наличия симптома.

Читать далее
Total votes 20: ↑19 and ↓1+22
Comments35

Фундаментальные концепции переобучения и недообучения в машинном обучении

Level of difficultyMedium
Reading time15 min
Views9.8K

Этот модуль дает интуитивно понятное введение в очень фундаментальные концепции переобучения и недообучения в машинном обучении. Модели машинного обучения никогда не могут делать идеальные прогнозы: ошибка теста никогда не равна нулю. Этот провал происходит из-за фундаментального компромисса между гибкостью моделирования и ограниченным размером обучающего набора данных .

Читать далее
Total votes 23: ↑1 and ↓22-21
Comments8

Автоматический майнинг изображений

Level of difficultyMedium
Reading time6 min
Views4.4K

В предыдущих статьях мы рассказали, как создать фотогалерею с собственной поисковой системой [1,2]1. Но где нам найти изображения для нашей галереи? Нам придется вручную искать источники «хороших» изображений, а затем вручную проверять, является ли каждое изображение «хорошим». Можно ли автоматизировать обе эти задачи? Ответ — да.

Читать далее
Total votes 11: ↑11 and ↓0+11
Comments7

Применение Python для сбора и предобработки данных цифрового следа

Level of difficultyEasy
Reading time6 min
Views7.2K

Python для сбора и предобработки данных цифрового следа.

Про цифровой след обычно говорят лишь в общих чертах, и описание программирования для работы с ним лишь упоминают. В данной статье рассмотрен набор библиотек Python и приемов, которые можно использовать для сбора и предобработки данных цифрового следа.

Читать далее
Total votes 10: ↑3 and ↓7+2
Comments4

Не доверять данным и уметь признавать ошибки: какие софтскилы нужны аналитику данных

Level of difficultyEasy
Reading time6 min
Views3.4K

Привет! Меня зовут Дарина Кухтина, я работаю лидом маркетинговой аналитики в геймдев-компании и наставником на курсе «Аналитик данных» в Практикуме.

На основном месте работы я провела много интервью и со временем стала уделять софтскилам не меньше внимания, чем хардскилам. Если вторые хотя бы понятно, как прокачивать, то для развития «мягких навыков» нет чёткого рабочего алгоритма. И если закрыть глаза на нехватку софтскилов при найме, потом с сотрудником могут быть проблемы.

В этой подборке я расскажу, какие софтскилы, на мой взгляд, особенно важны для аналитиков данных, как специалисту найти свои слабые места и что поможет развить те или иные навыки.

Читать далее
Total votes 6: ↑4 and ↓2+4
Comments2

Новые инструменты для работы c ML-моделями и обзор MLOps от CERN

Level of difficultyMedium
Reading time7 min
Views4.7K

Привет всем, кто работает с ML-моделями и занимается аналитикой данных! В новом дайджесте для вас много интересных обзоров по инструментам — как говорится, ни ClearML и Airflow едиными. Рынок решений стремительно развивается, и наши подборки помогут вам держать руку на пульсе. Еще больше полезных текстов по DataOps и MLOps публикуем в Telegram-сообществе «MLечный путь».

Как вам, кстати, ренессансная GPU на обложке, которую сгенерила нейросеть для блога Andreesen and Horowitz? Что тут сказать — просто поделитесь промтом.
Читать дальше →
Total votes 40: ↑40 and ↓0+40
Comments1

Как построить систему геоаналитики с применением ML

Reading time10 min
Views5.7K


Геоаналитика помогает бизнесу принимать решения: где открыть магазин, построить отель или возвести новостройку с учетом доступности и популярности локации, наличия конкурентов и сотен других факторов. Решать подобные аналитические задачи с большим количеством значимых признаков помогает машинное обучение. В этой статье мы рассмотрим примеры работы сервисов геоаналитики VK Predict. Выясним, какие модели машинного обучения используются при построении таких систем и из каких этапов состоит разработка продукта с возможностями геоаналитики.

Статья подготовлена на основе вебинара команд VK Predict и VK Cloud. 
Читать дальше →
Total votes 16: ↑15 and ↓1+22
Comments1

Книга «Python для финансистов»

Reading time8 min
Views7.9K
image Как дела, Хаброжители?

Программирование, математика и финансы неразрывно связаны между собой. Ив Хилпиш, автор бестселлера «Python для финансовых расчетов», объясняет базовые концепции и дает в ваши руки все необходимые инструменты для работы в мире финансовой инженерии.

В этой книге вы:
• изучите основы программирования на Python и познакомитесь с теорией финансов через математику;
• узнаете о моделировании данных и использовании Python в финансовой инженерии;
• научитесь статическому и динамическому моделированию финансовых задач: ценообразование, принятие решений и распределение активов;
• получите общее представление о необходимый библиотеках Python: NumPy, SciPy, Matplotlib и SymPy.
Читать дальше →
Total votes 9: ↑9 and ↓0+9
Comments6

Книга «Python для хакеров. Нетривиальные задачи и проекты»

Reading time12 min
Views21K
image Привет, Хаброжители!

«Python для хакеров. Нетривиальные проекты и задачи» делает упор на реальные проекты, так что от экспериментирования с синтаксисом вы сразу перейдете к написанию полноценных программ. Развивая свои навыки разработки на Python, вы будете проводить научные опыты, изучать статистику и решать задачи, которые не давали покоя гениям на протяжении многих лет, и даже займетесь обнаружением далеких экзопланет.

Каждая глава начинается с четко поставленной цели и обсуждения способов решения задачи. Далее следует собственно миссия и стратегия действий, построенная таким образом, чтобы вы научились мыслить как программист. Вы будете руководить спасательной операцией береговой охраны, спланируете и осуществите полет космического корабля на Луну, реализуете ограничение доступа в секретную лабораторию с помощью распознавания лиц и не только это.

Программы, представленные в книге, не отпугнут даже новичков. Вы будете осваивать все более сложные техники и наращивать навыки написания кода. Справившись со всеми миссиями, вы будете готовы к самостоятельному решению любых сложных реальных задач с помощью Python.
Читать дальше →
Total votes 9: ↑8 and ↓1+9
Comments9

DataHub: веб-песочница для тех, кто изучает SQL

Level of difficultyEasy
Reading time4 min
Views15K

Привет! Меня зовут Андрей Шмиг, я разработчик платформы DataHub, платформа для совместной работы над данными - своего рода GitHub для данных. В этой статье покажу на что способен веб-редактор MySQL хранилища и почему это отличный инструмент для работы тем, кто изучает SQL.

Читать далее
Total votes 7: ↑4 and ↓3+1
Comments9

Книга «40 алгоритмов, которые должен знать каждый программист на Python»

Reading time6 min
Views49K
image Привет, Хаброжители!

Понимание работы алгоритмов и умение применять их для решения прикладных задач – must-have для любого программиста или разработчика. Эта книга поможет вам не только развить навыки использования алгоритмов, но и разобраться в принципах их функционирования, в их логике и математике.

Вы начнете с введения в алгоритмы, от поиска и сортировки перейдете к линейному программированию, ранжированию страниц и графам и даже поработаете с алгоритмами машинного обучения. Теории не бывает без практики, поэтому вы займетесь прогнозами погоды, кластеризацией твитов, механизмами рекомендаций фильмов. И, наконец, освоите параллельную обработку, что даст вам возможность решать задачи, требующие большого объема вычислений.

Дойдя до конца, вы превратитесь в эксперта по решению реальных вычислительных задач с применением широкого спектра разнообразных алгоритмов.
Читать дальше →
Total votes 12: ↑10 and ↓2+11
Comments4

Предсказание оттока пользователей

Reading time10 min
Views11K

Обработка данных и применение основных видов регрессий для решения задач на Kaggle, на примере соревнования "Предсказание оттока пользователей" от DeepLearningSchool МФТИ.

Читать далее
Total votes 8: ↑8 and ↓0+8
Comments5

Страдающее ML: как мы автоматизировали проверку данных, чтобы не было мучительно больно

Reading time6 min
Views6K

Работать с данными — муторно, но есть кое-что похуже — проверять их качество. Больше данных — больше изматывающих ручных проверок и меньше уверенности, что с массивом всё в порядке.

Я разрабатываю ML-модели для розничного бизнеса, провожу A/B-тесты и оцениваю бизнес-эффекты в Газпромбанке. Год назад мы разработали систему, которая показывает, где и насколько данные плохи, а инженерам остаётся только разобраться почему. Раньше они сначала вручную выясняли, что в данных пошло не так, а теперь есть система, которая даёт подсказки. Расскажу об алгоритме, лежащем в основе системы, и о том, что она сейчас собой представляет и как используется в наших бизнес-процессах.

Читать далее
Total votes 28: ↑28 and ↓0+28
Comments11

Нужно читать академические статьи в Computer Science

Reading time7 min
Views10K

Как программисты, вы должны постоянно учиться. Вы изучаете учебники, документацию, вопросы по Stack Overflow — всё, что можно найти и что может помочь вам писать код и поддерживать актуальность своих навыков. Но как часто вы заглядываете в академические статьи по компьютерным наукам, чтобы лучше программировать?


Руководства могут помочь вам написать код здесь и сейчас, но академические статьи могут помочь понять, откуда и куда движется программирование. Каждая особенность программирования, начиная с указателя null (также известного как ошибка на миллиард долларов) и заканчивая объектами (в смысле Smalltalk), построена на основании исследований, восходящих к 1960-м (и более ранним) годам. Предстоящие инновации будут основаны на сегодняшних исследованиях. Продолжение — к старту нашего флагманского курса по науке о данных.

Читать дальше →
Total votes 7: ↑6 and ↓1+6
Comments0

Как структурировать проект ML и сделать его воспроизводимым и поддерживаемым

Reading time6 min
Views5.5K

При создании проектов в машинном обучении зачастую сложнее всего бывает начать работу. Какой должна быть структура репозитория? Каким стандартам следовать? Смогут ли ваши коллеги воспроизвести результаты экспериментов? Автор материала делится шаблоном проекта, наработанным за годы изучения науки о данных, а наш флагманский курс по Data Science стартует 25 января.

Читать дальше →
Total votes 3: ↑3 and ↓0+3
Comments0

Декораторы, о которых вам не расскажут

Reading time11 min
Views31K

От переводчика: мне понравился подход к объяснению декораторов, описанный в этой статье, а так как других вариантов перевода я не нашёл, я решил поделиться этим с аудиторией Хабра. Надеюсь что этот текст будет полезен как новичкам, так и опытным программистам.

Если вы программируете на языке Python, вы должны были слышать о декораторах, однако существует много людей, которые либо не знакомы с ними, либо, что еще хуже, знакомы с ними (использовали так или иначе), но так и не поняли их суть.

Цель этого краткого руководства — развеять мифы, которые вы слышали о декораторах, и показать вам другие их стороны, о которых вы и не подозревали.

Читать далее
Total votes 42: ↑41 and ↓1+49
Comments12

Есть ли польза от решения алгоритмических задач на LeetCode?

Reading time8 min
Views89K

Пожалуй каждый программист, который сталкивался с вопросом: "А как устроиться на работу в FAANG?" - получал ответ, что ему нужно разобраться с алгоритмами, со структурами данных и прорешать порядка 300-400 задач на leetcode по алгоритмам.

Однако вслед за этим советом тут же появляются люди, которые говорят, что это никоим образом не делает тебя лучше, как программиста. Да и вообще - просто пустая трата времени.

Поэтому, в этой статье я постараюсь дать ответ, насколько это может быть полезным для работы и развития, и как может сказаться на карьере.

Читать далее
Total votes 51: ↑43 and ↓8+50
Comments182

Information

Rating
Does not participate
Location
Ставрополь, Ставропольский край, Россия
Date of birth
Registered
Activity