Skillfactory, Москва - Учим работать в IT на курсах и в магистратурах / Статьи / Хабр

Все потоки

Компания Skillfactory временно не ведёт блог на Хабре

Статьи817Посты

skillfactory_school 17 апр 2025 в 15:31

Как написать приложение на JavaFX: гид для начинающих

11 мин

24K

Блог компании SkillfactoryJava *

JavaFX — это мощный инструмент для создания кроссплатформенных графических интерфейсов на Java. В этой статье разберём, как разработать простое приложение на JavaFX с использованием визуального редактора в двух популярных средах разработки. Также рассмотрим альтернативный подход — создание интерфейса вручную, без визуального редактора.

Читать далее

+5

skillfactory_school 15 апр 2025 в 13:13

Optuna: находим лучшие настройки для моделей без головной боли

Простой

9 мин

6.6K

Блог компании SkillfactoryBig Data *

Обзор

Если вы уже пробовали обучать модели, то знаете: выбрал не тот гиперпараметр — получил плохой результат. А перебирать их вручную или даже с помощью GridSearchCV из scikit-learn — долго, муторно и не всегда эффективно. Поэтому сегодня поговорим о том, как заставить компьютер делать эту скучную работу за нас.

В этом поможет Optuna — библиотека для автоматической оптимизации гиперпараметров. Она умнее простого перебора и часто находит отличные комбинации параметров гораздо быстрее.

Читать далее

+2

skillfactory_school 31 мар 2025 в 14:18

Параллельные вычисления, конкурентность и асинхронное программирование в Python: обзор для начинающих

Простой

12 мин

36K

Блог компании SkillfactoryPython *

Обзор

Однопоточные приложения на Python ограничены в производительности: они выполняют задачи последовательно и не используют преимущества многоядерных процессоров. Кроме того, такие программы не справляются с обработкой множества операций одновременно, особенно если речь идет о задачах, связанных с вводом-выводом, например сетевыми запросами или чтением файлов.

Производительность можно значительно улучшить, внедрив в код параллельные вычисления, конкурентность или асинхронное программирование. Для этого Python предлагает такие инструменты, как multiprocessing, threading и asyncio.

Читать далее

+8

skillfactory_school 26 мар 2025 в 13:41

Как создать первую модель машинного обучения на Python: гид для начинающих

Простой

6 мин

26K

Блог компании Skillfactory

Обзор

Инструкция для новичков в Machine Learning с примерами кода и популярными библиотеками

Умение создать собственную модель машинного обучения — это обязательно для дата-сайентистов и хороший дополнительный навык для программистов. Разбираемся на практике, как это сделать.

Читать далее

+5

skillfactory_school 13 мар 2025 в 09:32

Как SonarQube помогает автоматизировать код-ревью: гид для начинающих

Простой

10 мин

40K

Блог компании SkillfactoryPython *

Обзор

SonarQube — это инструмент анализа качества кода, написанный на Java. Он выявляет баги, уязвимости, дублирование кода и «запахи кода» (code smells).

SonarQube используют в CI/CD (Continuous Integration, Continuous Delivery — непрерывная интеграция и доставка) для автоматической проверки и улучшения качества кода.

Читать далее

+2

skillfactory_school 4 мар 2025 в 16:28

Синтетические данные в 2025: волшебная таблетка для нейросетей или темная лошадка?

Простой

9 мин

3.1K

Блог компании SkillfactoryМашинное обучение *

Мир генерирует данные быстрее, чем когда-либо: умные часы, онлайн-покупки, медицинские датчики… Кажется, что данных просто море. Но вот парадокс: для обучения крутых нейросетей данных все равно не хватает. Особенно если вы хотите создать что-то новенькое — например, умного помощника для диагностики и лечения редких болезней или систему контроля качества на заводе, который выпускает уникальные детали. При этом нужно не забыть новые законы о приватности данных — как бы чего не нарушить, работая с личной информацией людей.

В этот момент на помощь приходят синтетические данные. Разбираемся, что это такое, чем они полезны и вредны. Также узнаем, какие технологии помогают их создавать, и заглянем в будущее этого направления.

Читать далее

0

skillfactory_school 28 фев 2025 в 12:31

AutoML: гид по автоматизации машинного обучения для начинающих

Простой

8 мин

11K

Блог компании SkillfactoryМашинное обучение *

Обзор

Каждый, кто пытался построить даже самую простую модель машинного обучения, знает, сколько всего нужно учесть: сбор данных, предобработка, выбор алгоритма, подбор гиперпараметров, оценка качества… Это большой объем рутинных задач, но есть и хорошие новости: их можно автоматизировать. На помощь придет AutoML.

В 2025 году AutoML уже не просто модное слово, а мощный инструмент, который меняет правила игры в Data Science. Разберемся, что это такое, каким бывает и как его использовать, чтобы стать еще круче в ML.

Читать далее

+2

skillfactory_school 20 фев 2025 в 13:21

MapReduce: гид для начинающих

Простой

12 мин

19K

Блог компании SkillfactoryBig Data *

Обзор

Разберем роль модели MapReduce в составе Hadoop, а также расскажем, как использовать его отдельно и насколько это эффективно.

Читать далее

+1

skillfactory_school 7 фев 2025 в 11:42

Федеративное обучение: учимся вместе, не раскрывая секретов

Простой

6 мин

6.2K

Блог компании SkillfactoryBig Data *

Обзор

Как обучать ML-модели на большом объеме данных из разных источников, сохраняя их конфиденциальность? Ответ — федеративное машинное обучение (Federated Learning, или FL). Эксперт простыми словами на примерах рассказывает, что это такое, как работает и в каких областях применяется

Читать далее

+3

alena_alkova 30 янв 2025 в 16:06

Векторизация текста в NLP: от слов к числам

Простой

8 мин

8.4K

Блог компании SkillfactoryBig Data *

Обзор

Перед началом работы с NLP-моделями текст нужно преобразовать в понятный модели вид. Этот процесс называется векторизацией, и без него невозможно представить современный NLP. По сути, мы превращаем слова, предложения или целые документы в векторы — наборы чисел, которые отражают определенные характеристики текста.

Рассказываем о векторизации подробнее вместе с экспертом.

Читать далее

+4

alena_alkova 29 янв 2025 в 14:25

Алгоритм k-means и метод локтя: кластеризация данных с примерами на Python

Простой

7 мин

43K

Блог компании SkillfactoryBig Data *

Обзор

Кластеризация данных — одна из ключевых задач машинного обучения. Она позволяет группировать объекты в однородные кластеры на основе их характеристик. Один из самых популярных, простых и эффективных методов кластеризации — это алгоритм k-means.

Рассмотрим, как работает k-means, познакомимся с методом локтя для определения числа кластеров и проиллюстрируем их применение на реальных данных с помощью языка программирования Python.

Читать далее

+3

alena_alkova 20 дек 2024 в 09:51

«Все сходится» — лучший комплимент дата-сайентисту

Простой

6 мин

2.9K

Блог компании SkillfactoryМашинное обучение *

Обзор

Алгоритмы и модели машинного обучения оценивают по разным параметрам: от них зависит, насколько быстро и точно работает модель. Один из таких параметров — сходимость, или конвергенция алгоритма. Сходимость показывает, насколько быстро модель достигает «оптимума» — точки, за которой меньше ошибается и делает более точные прогнозы.

Читать далее

0

alena_alkova 12 дек 2024 в 12:26

Фрактальная размерность: что это и как вычислить

Простой

8 мин

12K

Блог компании SkillfactoryМатематика *

Обзор

Фрактальная размерность описывает сложность объектов, которые нельзя измерить обычными параметрами, такими как длина или площадь. Например, снежинка при увеличении не становится проще — каждая ее деталь открывает еще более мелкие элементы. Разбираем, что такое фрактальная размерность и основные методы ее вычисления.

Читать далее

+6

alena_alkova 5 дек 2024 в 14:19

Переобучение моделей: гайд и советы для начинающих

Простой

5 мин

9.5K

Блог компании SkillfactoryBig Data * Машинное обучение *

Обзор

С развитием нейросетей появляются новые вызовы. Один из них — переобучение моделей. Совместно с Александром Рыжковым, ментором Skillfactory, руководителем команды LightAutoML и 4х Kaggle Grandmaster, разбираемся, что такое переобучение, хорошо ли это и как его избежать.

Читать далее

+5

skillfactory_school 28 ноя 2024 в 15:08

Модели BERT для машинного обучения: гайд для начинающих

Простой

9 мин

44K

Блог компании SkillfactoryBig Data *

Обзор

BERT (Bidirectional Encoder Representations from Transformers) — это одна из ключевых моделей обработки естественного языка (NLP), построенная на архитектуре трансформера.

Читать далее

+11

skillfactory_school 22 ноя 2024 в 17:07

Анализ временных рядов: полное руководство для начинающих

Простой

8 мин

62K

Блог компании SkillfactoryBig Data *

Recovery Mode

Временной ряд — это последовательность значений, которые протекают и измеряются в определенном временном промежутке. К бытовым примерам временного ряда можно отнести метеорологические наблюдения или колебания цен на рынке.

Аналитикам такие наборы данных позволяют выявлять закономерности, прогнозировать будущее и предлагать бизнесу обоснованные решения. В этой статье разберемся, с чего начать осваивать анализ временных рядов, вместе с Team Lead Data Scientist в VK Максимом Кулаевым.

Читать далее

+4

skillfactory_school 15 ноя 2024 в 14:58

Совершенный код: 10 книг по веб-разработке для начинающих

Простой

5 мин

28K

Блог компании SkillfactoryВеб-разработка *

Обзор

Книги — отличный способ узнать больше и начать изучать новую профессию. Составили подборку учебников по программированию, которые помогут познакомиться с веб-разработкой.

Читать далее

-1

skillfactory_school 8 ноя 2024 в 15:43

Support Vector Machine: +1 алгоритм машинного обучения для начинающих

Простой

5 мин

11K

Блог компании SkillfactoryBig Data * Data Engineering *

Туториал

Recovery Mode

Метод опорных векторов — это алгоритм машинного обучения, применяемый для задач линейной и нелинейной классификации, регрессии и обнаружения аномальных данных. С его помощью можно классифицировать текст, изображения, обнаружить спам, идентифицировать почерк, анализировать экспрессии генов, распознавать лица, делать прогнозы и так далее. SVM адаптируется и эффективен в различных приложениях, поскольку может управлять многомерными данными и нелинейными отношениями.

Читать далее

+5

skillfactory_school 2 ноя 2024 в 13:54

Какие минусы работы в IT: собрали мнения айтишников

Простой

5 мин

45K

Блог компании SkillfactoryПрограммирование * Карьера в IT-индустрии

Мнение

Работа в стол, ненормированный график и другие проблемы IT

В интернете только и разговоров о том, как здорово быть айтишником. Большая востребованность и разнообразный рынок вакансий, удаленная работа, высокая зарплата, возможность участвовать в международных проектах…

Но за всем этим мы иногда забываем, что работа в IT — это тоже работа, со своими проблемами и минусами. Рассказываем со слов айтишников, что им не нравится в работе.

Читать далее

+3

skillfactory_school 25 окт 2024 в 10:57

Мобильный гейминг — тоже круто: топ игр на телефон для iOS и Android

Простой

12 мин

203K

Блог компании SkillfactoryРазработка игр * Игры и игровые консоли

Обзор

Во что поиграть с телефона, если «три в ряд» уже надоели

Если вы устали от бесконечных кликеров и поиска пар — давайте поговорим о чем-то более любопытном. Мобильный гейминг развивается, и сейчас для iOS и Android можно найти множество интересных игр: от классических квестов до MMORPG.

Собрали для вас подборку мобильных игр, которые показались нам особенно интересными. Некоторые из них — платные. Другие доступны бесплатно, но могут содержать рекламу или внутриигровые покупки.

Читать далее

+8

1

2 3 ...