Как стать автором
Обновить
78.39
Skillfactory
Учим работать в IT на курсах и в магистратурах
Сначала показывать

Как создать первую модель машинного обучения на Python: гид для начинающих

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров4.4K

Инструкция для новичков в Machine Learning с примерами кода и популярными библиотеками

Умение создать собственную модель машинного обучения — это обязательно для дата-сайентистов и хороший дополнительный навык для программистов. Разбираемся на практике, как это сделать. 

Читать далее

Как SonarQube помогает автоматизировать код-ревью: гид для начинающих

Уровень сложностиПростой
Время на прочтение10 мин
Количество просмотров1.4K

SonarQube — это инструмент анализа качества кода, написанный на Java. Он выявляет баги, уязвимости, дублирование кода и «запахи кода» (code smells).

SonarQube используют в CI/CD (Continuous Integration, Continuous Delivery — непрерывная интеграция и доставка) для автоматической проверки и улучшения качества кода.

Читать далее

Синтетические данные в 2025: волшебная таблетка для нейросетей или темная лошадка?

Уровень сложностиПростой
Время на прочтение9 мин
Количество просмотров904

Мир генерирует данные быстрее, чем когда-либо: умные часы, онлайн-покупки, медицинские датчики… Кажется, что данных просто море. Но вот парадокс: для обучения крутых нейросетей данных все равно не хватает. Особенно если вы хотите создать что-то новенькое — например, умного помощника для диагностики и лечения редких болезней или систему контроля качества на заводе, который выпускает уникальные детали. При этом нужно не забыть новые законы о приватности данных — как бы чего не нарушить, работая с личной информацией людей.

В этот момент на помощь приходят синтетические данные. Разбираемся, что это такое, чем они полезны и вредны. Также узнаем, какие технологии помогают их создавать, и заглянем в будущее этого направления.

Читать далее

AutoML: гид по автоматизации машинного обучения для начинающих

Уровень сложностиПростой
Время на прочтение8 мин
Количество просмотров1.5K

Каждый, кто пытался построить даже самую простую модель машинного обучения, знает, сколько всего нужно учесть: сбор данных, предобработка, выбор алгоритма, подбор гиперпараметров, оценка качества… Это большой объем рутинных задач, но есть и хорошие новости: их можно автоматизировать. На помощь придет AutoML.

В 2025 году AutoML уже не просто модное слово, а мощный инструмент, который меняет правила игры в Data Science. Разберемся, что это такое, каким бывает и как его использовать, чтобы стать еще круче в ML.

Читать далее

MapReduce: гид для начинающих

Уровень сложностиПростой
Время на прочтение12 мин
Количество просмотров4K

Разберем роль модели MapReduce в составе Hadoop, а также расскажем, как использовать его отдельно и насколько это эффективно.

Читать далее

Федеративное обучение: учимся вместе, не раскрывая секретов

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров889

Как обучать ML-модели на большом объеме данных из разных источников, сохраняя их конфиденциальность? Ответ — федеративное машинное обучение (Federated Learning, или FL). Эксперт простыми словами на примерах рассказывает, что это такое, как работает и в каких областях применяется

Читать далее

Векторизация текста в NLP: от слов к числам

Уровень сложностиПростой
Время на прочтение8 мин
Количество просмотров2K

Перед началом работы с NLP-моделями текст нужно преобразовать в понятный модели вид. Этот процесс называется векторизацией, и без него невозможно представить современный NLP. По сути, мы превращаем слова, предложения или целые документы в векторы — наборы чисел, которые отражают определенные характеристики текста. 

Рассказываем о векторизации подробнее вместе с экспертом.

Читать далее

Алгоритм k-means и метод локтя: кластеризация данных с примерами на Python

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров5.1K

Кластеризация данных — одна из ключевых задач машинного обучения. Она позволяет группировать объекты в однородные кластеры на основе их характеристик. Один из самых популярных, простых и эффективных методов кластеризации — это алгоритм k-means. 

Рассмотрим, как работает k-means, познакомимся с методом локтя для определения числа кластеров и проиллюстрируем их применение на реальных данных с помощью языка программирования Python.

Читать далее

«Все сходится» — лучший комплимент дата-сайентисту

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров1.2K

Алгоритмы и модели машинного обучения оценивают по разным параметрам: от них зависит, насколько быстро и точно работает модель. Один из таких параметров — сходимость, или конвергенция алгоритма. Сходимость показывает, насколько быстро модель достигает «оптимума» — точки, за которой меньше ошибается и делает более точные прогнозы. 

Читать далее

Фрактальная размерность: что это и как вычислить

Уровень сложностиПростой
Время на прочтение8 мин
Количество просмотров3.3K

Фрактальная размерность описывает сложность объектов, которые нельзя измерить обычными параметрами, такими как длина или площадь. Например, снежинка при увеличении не становится проще — каждая ее деталь открывает еще более мелкие элементы. Разбираем, что такое фрактальная размерность и основные методы ее вычисления. 

Читать далее

Переобучение моделей: гайд и советы для начинающих

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров3.1K

С развитием нейросетей появляются новые вызовы. Один из них — переобучение моделей. Совместно с Александром Рыжковым, ментором Skillfactory, руководителем команды LightAutoML и 4х Kaggle Grandmaster, разбираемся, что такое переобучение, хорошо ли это и как его избежать.

Читать далее

Модели BERT для машинного обучения: гайд для начинающих

Уровень сложностиПростой
Время на прочтение9 мин
Количество просмотров8.1K

BERT (Bidirectional Encoder Representations from Transformers) — это одна из ключевых моделей обработки естественного языка (NLP), построенная на архитектуре трансформера.

Читать далее

Анализ временных рядов: полное руководство для начинающих

Уровень сложностиПростой
Время на прочтение8 мин
Количество просмотров14K

Временной ряд — это последовательность значений, которые протекают и измеряются в определенном временном промежутке. К бытовым примерам временного ряда можно отнести метеорологические наблюдения или колебания цен на рынке. 

Аналитикам такие наборы данных позволяют выявлять закономерности, прогнозировать будущее и предлагать бизнесу обоснованные решения. В этой статье разберемся, с чего начать осваивать анализ временных рядов, вместе с Team Lead Data Scientist в VK Максимом Кулаевым. 

Читать далее

Совершенный код: 10 книг по веб-разработке для начинающих

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров8.2K

Книги — отличный способ узнать больше и начать изучать новую профессию. Составили подборку учебников по программированию, которые помогут познакомиться с веб-разработкой. 

Читать далее

Support Vector Machine: +1 алгоритм машинного обучения для начинающих

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров4.7K

Метод опорных векторов — это алгоритм машинного обучения, применяемый для задач линейной и нелинейной классификации, регрессии и обнаружения аномальных данных. С его помощью можно классифицировать текст, изображения, обнаружить спам, идентифицировать почерк, анализировать экспрессии генов, распознавать лица, делать прогнозы и так далее. SVM адаптируется и эффективен в различных приложениях, поскольку может управлять многомерными данными и нелинейными отношениями.

Читать далее

Какие минусы работы в IT: собрали мнения айтишников

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров24K

Работа в стол, ненормированный график и другие проблемы IT

В интернете только и разговоров о том, как здорово быть айтишником. Большая востребованность и разнообразный рынок вакансий, удаленная работа, высокая зарплата, возможность участвовать в международных проектах…

Но за всем этим мы иногда забываем, что работа в IT — это тоже работа, со своими проблемами и минусами. Рассказываем со слов айтишников, что им не нравится в работе.

Читать далее

Мобильный гейминг — тоже круто: топ игр на телефон для iOS и Android

Уровень сложностиПростой
Время на прочтение12 мин
Количество просмотров27K

Во что поиграть с телефона, если «три в ряд» уже надоели

Если вы устали от бесконечных кликеров и поиска пар — давайте поговорим о чем-то более любопытном. Мобильный гейминг развивается, и сейчас для iOS и Android можно найти множество интересных игр: от классических квестов до MMORPG.

Собрали для вас подборку мобильных игр, которые показались нам особенно интересными. Некоторые из них — платные. Другие доступны бесплатно, но могут содержать рекламу или внутриигровые покупки. 

Читать далее

Обзор платформы Kaggle для начинающих: от состязаний до менторской программы

Уровень сложностиПростой
Время на прочтение12 мин
Количество просмотров7.5K

В IT-среде название Kaggle часто ассоциируется только с соревнованиями. Но на самом деле это полноценная социальная сеть и база данных для специалистов в сфере Data Science и ML.

Подготовили обзор, чтобы помочь новичкам разобраться в Kaggle. Разбираем, что площадка предлагает джунам и опытным специалистам, как пользоваться ее функциями и с какими задачами она может помочь.

Читать далее

Что такое технология TTS, как устроена и каких сферах используется синтез речи

Уровень сложностиСредний
Время на прочтение13 мин
Количество просмотров3.3K

Вместе с Григорием Стерлингом, лидом команды TTS в SberDevices, разбираемся, как устроена технология, как разрабатывают синтезаторы речи и что нужно знать, чтобы работать в этой сфере. 

Читать далее

Предварительная обработка данных в машинном обучении: инструкция, инструменты, полезные ресурсы для начинающих

Уровень сложностиСредний
Время на прочтение17 мин
Количество просмотров7.5K

Рассказываем, зачем обрабатывать данные перед загрузкой в модель, как провести предобработку и какие инструменты использовать.

Читать далее
1
23 ...

Информация

Сайт
www.skillfactory.ru
Дата регистрации
Дата основания
Численность
501–1 000 человек
Местоположение
Россия
Представитель
Skillfactory School